《中国人工智能学会通讯》——3.17 基于传播的谣言识别

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第3章,第3.17节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

3.17 基于传播的谣言识别

结合已有的研究工作,我们也发现谣言和非谣言的传播过程确实有明显的差异,如图 1 所示。根据这种研究现状,从谣言的传播结构、时序以及转发用户的角度进行了系统的实证研究。

image
谣言传播的结构特征

我们把每个消息的传播过程看成一棵传播树,即传播树的大小为消息的转发数,根节点为消息的发帖用户,传播树的其他节点是消息传播过程中参与转发的转发用户。我们对谣言和非谣言传播树的高度和宽度进行了实证分析。

⑴ 传播树的高度。传播树的高度是指在传播树中从根节点到叶子节点的最大路径长度。图 2 显示了谣言和非谣言的传播树高度的互补累积分布图。从图中可以看出,传播树深度的互补累积分布图符合指数分布,且谣言的指数为 0.33 小于非谣言的0.53,表明大部分谣言传播树的高度大于非谣言传播树的高度。谣言的所有传播树的平均高度为 4.96,仍然大于非谣言传播树的平均高度 3.65。当传播树的大小增加时,传播树的高度也会增加,表明当消息大范围传播时,谣言的渗透力大于非谣言的渗透力。
image

⑵ 传播树的宽度。传播树的宽度是指在传播树的所有层中具有最多节点数的层中包含的节点数。图 3 表示了传播树的宽度占传播树节点数的比率图。当传播树的宽度比率大于 50% 时,谣言的消息比率占 70.48%,而非谣言的消息比率占 90.76%,表明大部分谣言的传播树的宽度小于非谣言传播树的宽度。随着传播树的增大,传播树的宽度比率逐渐减小,表明传播树越小,转发越集中于发帖用户,相反则转发越广且渗透越深。
image

因此,把消息的传播过程看成传播树,在传播树的结构上,我们发现谣言的传播树往往高且窄,而非谣言的传播树矮又宽。

谣言传播的时序特征

对于时序特征,我们主要研究了谣言和非谣言消息多快被转发,即转发的时间间隔。

转发的时间间隔是指从消息的发帖到第一个转发的时间间隔。大部分消息转发的时间间隔在 5 分钟以内,谣言占到 72.11%,非谣言占到 83.82%;谣言有 2.26% 而非谣言只有 0.38% 的消息转发的时间间隔超过了 1 天。考虑到消息的影响范围,我们统计了转发数在 100 以内以及大于 100 的消息,发现影响较大的谣言消息更可能吸引人们的注意力并给人们一种强烈的行为驱动,使人们在较短的时间内快速转发,而大部分非谣言信息更可能在发帖的 1 分钟后发生转发。

谣言传播的转发用户特征

消息在传播过程中,当一个用户转发一条消息后,我们假设这个用户的所有粉丝都能看见这条消息,一个消息的所有转发数则是所有看到消息的用户并对消息做出响应用户数,把它定义为转发看到比,即一个消息的转发数和参与消息传播的所有用户的粉丝数和的比例。通过计算每个消息的转发看到比,我们发现当转发数相当时,谣言的转发看到比比非谣言的大。这表明谣言通常比非谣言能吸引更多的用户参与转发。

为了验证提出的这些特征的有效性,我们和已有的工作进行了对比,结果表明所提出的这些特征在谣言识别上取得了更好的效果,和以前提出的特征相结合进一步提升了谣言识别的准确率。当然上述三方面的特征只是传播特征的一部分,我们还在继续探索更显著的谣言传播特征和规律,以期达到更好的谣言识别效果。

相关文章
|
2月前
|
机器学习/深度学习 人工智能 算法
人工智能在医疗影像识别中的应用与挑战
【2月更文挑战第5天】 传统医疗影像识别依赖于医生肉眼观察和经验判断,但这种方法存在着主观性和误判的风险。随着人工智能技术的发展,医疗影像识别逐渐引入了深度学习、卷积神经网络等技术,为医生提供了更精准的诊断工具。本文将探讨人工智能在医疗影像识别中的应用现状、技术挑战和未来发展方向,旨在展示人工智能在医疗领域中的巨大潜力和影响。
|
3月前
|
人工智能 Shell 开发工具
全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别:比赛全流程体验(baseline训练+Docker提交)
全球人工智能技术创新大赛【热身赛一】布匹疵点智能识别:比赛全流程体验(baseline训练+Docker提交)
190 1
|
3月前
|
机器学习/深度学习 人工智能 算法
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
45 2
鱼类识别Python+深度学习人工智能+TensorFlow+卷积神经网络算法
|
11月前
|
机器学习/深度学习 编解码 人工智能
中科院团队新研究:人工智能有助于从空间分辨转录组学中识别组织亚结构
中科院团队新研究:人工智能有助于从空间分辨转录组学中识别组织亚结构
108 0
|
人工智能 自然语言处理 API
调用百度api实现人工智能文本语义识别
调用百度api实现人工智能文本语义识别
134 0
调用百度api实现人工智能文本语义识别
|
机器学习/深度学习 人工智能 自然语言处理
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
这是ShowMeAI每周通讯的第3期。本期内容关键词:新冠、ChatGPT、2022 AI 报告、腾讯·绝悟、阿里·AliceMind、小红书·全站智投、OpenAI·Point-E、Google·CALM、Wayve·MILE、AI2·MemPrompt、Stanford x MosaicML·PubMed GPT、腾讯全员大会、特斯拉裁员、图森未来裁员、AI 应用与工具大全。
463 0
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
|
人工智能 自然语言处理 搜索推荐
识别人工智能用户场景---一种规格并不适用于所有场景(Noogata)
人工智能已经成为主流。各种类型和规模的企业都充分意识到人工智能可以释放巨大的价值,但对于非数据原生组织来说,这一说法似乎仍然相当模糊。这意味着什么?他们是如何获得这个价值的?在之前的博客中,我们的首席执行官 Assaf Egozi 谈到了如何在组织内使用 AI 以及一些好处。但现在是时候具体化了——单个组织如何缩小选择范围以找到最佳用户场景? Noogata 运营副总裁 Roni Lieber 概述了她用来帮助客户导航其选项的方法。
|
机器学习/深度学习 人工智能 文字识别
【人工智能】机器学习及与智能数据处理之降维算法PCA及其应用手写字体识别以及【自定义数据集】
利用PCA算法实现手写字体识别,要求: 1、实现手写数字数据集的降维; 2、比较两个模型(64维和10维)的准确率; 3、对两个模型分别进行10次10折交叉验证,绘制评分对比曲线。
379 1
【人工智能】机器学习及与智能数据处理之降维算法PCA及其应用手写字体识别以及【自定义数据集】
|
机器学习/深度学习 人工智能 自然语言处理
与世界同行 2017中国人工智能大会有感
与世界同行 2017中国人工智能大会有感
1540 0
与世界同行 2017中国人工智能大会有感
|
机器学习/深度学习 人工智能 算法
AI识别细胞3D结构?人工智能做到了人类不可能做到的事情
利用人工智能(AI)标记和识别细胞的 3D 结构是一个非常有趣的研究课题。AI可以从光显微镜图像中预测细胞结构的位置,而无需有害的荧光标记。
177 0
AI识别细胞3D结构?人工智能做到了人类不可能做到的事情

热门文章

最新文章