《数据科学:R语言实现》——2.8 获取Facebook数据

简介:

本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.9节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.9 使用twitteR

除了可以获取社交网络交互数据,我们也可以收集Twitter上大量推文信息进行文本挖掘任务。获取Twitter数据的方法与获取Facebook的非常类似。二者都是社交平台,我们所需的只是一个访问令牌来访问内部数据。获取到访问令牌之后,我们就可以使用twitteR访问海量推文了。
准备工作
在本教程中,你需要给开发环境安装R,同时确保计算机可以访问互联网。
实现步骤
执行下列步骤,读取Twitter数据。
1.首先,你需要登Twitter,访问Twitter Apps页面https://apps.twitter.com/。单击Create New App,如图26所示。
2.填写所有所需的应用信息,创建新的应用,如图27所示。
screenshot

3.然后,你可以选取Keys and Access Tokens,访问Application Settings,如图28所示。

screenshot

4.单击Create my access token按键,探索器会生成一个授权的访问令牌和密钥,如图29所示。
5.安装加载twitteR程序包:

screenshot

6.使用从Application Settings复制的用户键值和密钥,以及从Your Access Token复制的访问令牌和访问密钥,建立Twitter OAuth:
screenshot

运行原理
在本教程中,我们使用twitteR获取Twitter上的推文。要使用访问令牌,我们首先必须创建一个带有登录账户的应用,然后填入所需信息,完成创建。
应用创建完成之后,我们选取Keys and Access Tokens标签,在Application Settings下找到用户键值和密钥。向下滚动到Create my access token按键。单击按键之后,访问令牌和密钥会出现在Your Access Token部分。
现在,我们可以使用twitteR连接Twitter。首先,安装加载twitteR程序包。你可以从Application Settings复制用户键值和密钥,从Your Access Token复制访问令牌和密钥。复制的信息可以用来创建Twitter OAuth。最后,我们可以使用函数searchTwitter找到世界杯搜索词下的前100个搜索结果。
更多技能
类似于Facebook,Twitter也向用户提供了API测试的控制台。你可以访问API控制台 https://dev.twitter.com/rest/tools/console,如图30所示。

screenshot

相关文章
|
3天前
|
Web App开发 数据可视化 数据挖掘
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
利用R语言进行聚类分析实战(数据+代码+可视化+详细分析)
|
3天前
|
数据采集 数据可视化
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
利用R语言进行因子分析实战(数据+代码+可视化+详细分析)
|
6天前
|
数据采集 机器学习/深度学习 Java
数据猎手:使用Java和Apache HttpComponents库下载Facebook图像
本文介绍了如何使用Java和Apache HttpComponents库从Facebook获取图像数据。通过设置爬虫代理IP以避免限制,利用HttpClient发送请求,解析HTML找到图像链接,然后下载并保存图片。提供的Java代码示例展示了实现过程,包括创建代理配置、线程池,以及下载图片的逻辑。注意,实际应用需根据Facebook页面结构进行调整。
数据猎手:使用Java和Apache HttpComponents库下载Facebook图像
|
8天前
|
移动开发 数据可视化
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
广义线性模型beta二项分布的淋巴结疾病风险预测可视化R语言2实例合集|附数据代码
|
8天前
|
机器学习/深度学习 人工智能 数据可视化
【视频】R语言支持向量回归SVR预测水位实例讲解|附代码数据
【视频】R语言支持向量回归SVR预测水位实例讲解|附代码数据
|
8天前
|
机器学习/深度学习 数据可视化
R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码
R语言Stan贝叶斯回归置信区间后验分布可视化模型检验|附数据代码
|
8天前
|
机器学习/深度学习 数据采集 算法
数据分享|R语言机器学习预测案例合集:众筹平台、机票折扣、糖尿病患者、员工满意度
数据分享|R语言机器学习预测案例合集:众筹平台、机票折扣、糖尿病患者、员工满意度
|
9月前
|
机器学习/深度学习 算法 决策智能
【重磅开源】Facebook开源 Nevergrad:一种用于无梯度优化的开源工具
【重磅开源】Facebook开源 Nevergrad:一种用于无梯度优化的开源工具
100 0
|
缓存 数据可视化 测试技术
开源多年后,Facebook这个调试工具,再登Github热门榜
让许多工程师合作开发大型应用大多会面临一个挑战,通常没有一个人知道每个模块是如何工作的,这种技能会让开发新功能、调查Bug或优化性能变得困难,为了解决这个问题,Facebook创建并开源了Flipper,一个可扩展的跨平台的调试工具,用来调试 iOS 和 Android 应用。近日又双叒登上了Github热榜。
|
前端开发 JavaScript 测试技术
Facebook 开源可扩展文本编辑器 Lexical
Meta(原 Facebook)近日开源可扩展文本编辑器 Lexical,源代码托管在 GitHub 上采用 MIT 许可证。
401 0
Facebook 开源可扩展文本编辑器 Lexical