《中国人工智能学会通讯》——3.16 谣言识别的研究进展

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第3章,第3.16节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

3.16 谣言识别的研究进展

过对社交媒体中谣言识别的研究,探寻谣言传播的基本规律,不但有助于限制谣言的传播,也有助于发现现实生活中人们所关心的问题、不易发现的社会现象或社会问题,因此具有重要的研究意义。当前,工业界对谣言识别的方式大部分是基于用户的举报或人工检索的方法。因此,需要相关的技术开发出自动或半自动化的辅助工具来缩短谣言识别的延迟,提高谣言识别的效率。目前,一些研究人员已经为此做出了努力,主要从谣言的静态特性以及谣言的动态特性两个角度,研究谣言和非谣言的区别以及谣言的传播规律。

谣言的静态特性

从谣言的静态特性出发,探索谣言和非谣言的差异,这类工作往往归结为信息可信度判断问题。解决问题的核心在于能够提取谣言和非谣言有显著差异的特征。因此,特征提取是从谣言的静态特性角度区别于非谣言的基础和关键。

当前的研究主要关注消息内容、发布消息的用户以及消息传播三个方面的特征。① 消息内容特征。消息内容中包含积极的情感词、动词、脏话、代词、问号、感叹号、笑脸、非标准语法或标点符号、过期的图片等往往有更大的可能性是谣言;相反,消息中包含消极的情感词、URL、hashtag 往往关系到可信的信息,但是,事件谣言比正常的消息包含更多的消极词[1-4] 。② 用户特征。可信的用户通常发布可信的消息。用户的朋友数大于粉丝数、用户头像使用默认图像或者使用卡通图片或头像的往往有低的可信度[3] ;用户使用 Web 应用和移动客户端发帖,其中 71.8% 的错误信息由非移动客户端发帖[5] 。活跃的用户、已发表很多消息的用户往往传播更可信的信息[1] ;使用相关话题的用户名与使用传统的和 Internet 的用户名相比,发表的消息可信度更高[3] 。男性相对于女性发布的消息更可信,尤其是政治类的消息;来自自由地区的人比来自保守地区的人发布的消息更可信[6] 。③ 传播特征。消息传播树中一个层级上有许多转发往往认为消息更可信[1] 。

从上面的研究工作可以看出,基于信息可信度的评估方法主要利用了消息内容和用户的静态特征进行谣言识别,所用到的传播特征也只是转发数、评论数或传播树的层级等,并没有用到传播过程的动态特征。

谣言的动态特性

Mendoza 等[7]通过分析推文的转发网络拓扑结构发现谣言的传播模式和新闻不同,谣言传播中往往会引起一些人的质疑和反驳,聚合大众的这些行为可以识别谣言。因此,研究谣言传播过程的特征对谣言识别具有重要的作用。当前的工作主要通过对谣言传播过程的分析,从谣言的传播特征以及传播模型两方面来识别谣言。

⑴ 利用谣言的传播特征识别谣言。从转发的内容角度,一些人对发布的谣言有很强的背景知识或逻辑推理能力,会在谣言的转发或评论中对谣言提出反驳或者质疑,这样的消息被称为谣言的修正(Correction)或群体智慧。已经有许多研究注意到谣言的修正对于探究或阻止谣言的传播起着重要的作用[8-9] 。Qazvinian 等 [10]使用微博的内容、网络以及特定的摹因(Memes)特征建立一个通用的框架识别谣言和非谣言,并对识别出的谣言根据用户对谣言的赞同、反驳或质疑来识别造谣者或传谣者。Nadamoto 等[11]针对 2011 年 3 月 11 日日本大地震时 Twitter 上传播的谣言,首先根据谣言的修正对谣言进行抽取,然后分析发现谣言往往给人强烈的行为驱动,使人产生消极和混乱的感觉,正常形式下谣言的传播有多个层级,而灾难形式下谣言的传播只有二、三级。Starbird 等[12]使用 2013年波士顿马拉松爆炸案的 Twitter 数据,对谣言修正的作用进行了实例研究,意在理解错误信息是怎样传播的,修正在错误信息传播中起到怎样的作用,以及对不同的谣言它是怎样变化的[13] 。Liu 等 [14]使用谣言的修正以及源的特征,结合用户和传播特征揭露谣言事件,并应用到实时的数据流,在揭露谣言的准确性和有效性上都高于专业人士的手工验证。从传播的结构角度,Wu 等[15]把消息的传播模式建模成树型结构,利用谣言传播通常是从普通用户到意见领袖,而非谣言传播是从意见领袖到普通用户的结构特征,使用随机游走图和计算消息传播树之间的相似性;并结合消息的话题特征以及传播中的情感特征,使用混合支持向量机实现对新浪微博的谣言识别。从传播的时序角度,Kwon 等[16]改进了信息传播的 SpikeM 模型[17] ,分析了谣言传播的多峰特征,结合传播结构和语言特征构建决策树、随机森林、支持向量机三种分类器,判定给定话题是否为谣言。Ma 等[18]建立了动态时间序列结构模型,捕获各种社会特征在传播生命周期里的动态变化(如在传播的后期谣言使用问号的数量比非谣言高,在传播的早期谣言中会出现更多的第一人称),再结合内容和用户特征使用 SVM 分类器进行谣言识别。

⑵ 利用模型识别谣言。Jin 等[19]通过使用传 染 病 模 型 的 变 体 SEIZ(Susceptible ExposedInfected Skeptic) [20] 建模 Twitter 上新闻和谣言的传播,并获得了用户状态间转变的概率参数,使用这些概率参数组成的比率形式来识别新闻和谣言。然而,这个比率对一些特殊的话题并不能较好的区分。

通过回顾上面两方面的研究工作,我们发现单纯使用谣言的静态特性识别谣言并没有使用谣言的动态特性效果好。然而,已有从谣言的动态特性角度的研究工作,大部分都是结合谣言传播过程中转发内容进行谣言的识别,虽然有些工作研究了谣言传播的结构以及时序特征,但是并不系统。下面主要从这两方面切入,展开我们的一些研究工作。

相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
人工智能在医疗影像识别中的应用与挑战
【2月更文挑战第5天】 传统医疗影像识别依赖于医生肉眼观察和经验判断,但这种方法存在着主观性和误判的风险。随着人工智能技术的发展,医疗影像识别逐渐引入了深度学习、卷积神经网络等技术,为医生提供了更精准的诊断工具。本文将探讨人工智能在医疗影像识别中的应用现状、技术挑战和未来发展方向,旨在展示人工智能在医疗领域中的巨大潜力和影响。
|
3月前
|
人工智能 Shell 开发工具
全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别:比赛全流程体验(baseline训练+Docker提交)
全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别:比赛全流程体验(baseline训练+Docker提交)
190 1
|
3月前
|
机器学习/深度学习 人工智能 算法
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
45 2
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
|
11月前
|
机器学习/深度学习 编解码 人工智能
中科院团队新研究:人工智能有助于从空间分辨转录组学中识别组织亚结构
中科院团队新研究:人工智能有助于从空间分辨转录组学中识别组织亚结构
108 0
|
人工智能 自然语言处理 API
调用百度api实现人工智能文本语义识别
调用百度api实现人工智能文本语义识别
134 0
调用百度api实现人工智能文本语义识别
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
|
机器学习/深度学习 人工智能 自然语言处理
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
这是ShowMeAI每周通讯的第3期。本期内容关键词:新冠、ChatGPT、2022 AI 报告、腾讯·绝悟、阿里·AliceMind、小红书·全站智投、OpenAI·Point-E、Google·CALM、Wayve·MILE、AI2·MemPrompt、Stanford x MosaicML·PubMed GPT、腾讯全员大会、特斯拉裁员、图森未来裁员、AI 应用与工具大全。
463 0
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
|
人工智能 自然语言处理 搜索推荐
识别人工智能用户场景---一种规格并不适用于所有场景(Noogata)
人工智能已经成为主流。各种类型和规模的企业都充分意识到人工智能可以释放巨大的价值,但对于非数据原生组织来说,这一说法似乎仍然相当模糊。这意味着什么?他们是如何获得这个价值的?在之前的博客中,我们的首席执行官 Assaf Egozi 谈到了如何在组织内使用 AI 以及一些好处。但现在是时候具体化了——单个组织如何缩小选择范围以找到最佳用户场景? Noogata 运营副总裁 Roni Lieber 概述了她用来帮助客户导航其选项的方法。
|
机器学习/深度学习 人工智能 文字识别
【人工智能】机器学习及与智能数据处理之降维算法PCA及其应用手写字体识别以及【自定义数据集】
利用PCA算法实现手写字体识别,要求: 1、实现手写数字数据集的降维; 2、比较两个模型(64维和10维)的准确率; 3、对两个模型分别进行10次10折交叉验证,绘制评分对比曲线。
379 1
【人工智能】机器学习及与智能数据处理之降维算法PCA及其应用手写字体识别以及【自定义数据集】
|
机器学习/深度学习 人工智能 自然语言处理
与世界同行 2017中国人工智能大会有感
与世界同行 2017中国人工智能大会有感
1540 0
与世界同行 2017中国人工智能大会有感

热门文章

最新文章