《中国人工智能学会通讯》——3.22 基于时间序列建模的预测方法

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第3章,第3.22节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

3.22 基于时间序列建模的预测方法

基于时间序列建模的预测方法主要关注用户生成内容传播过程对应的时间序列。这类方法在对时间序列建模后,利用所得的模型进行用户生成内容的流行度预测工作。

下面介绍其中一些典型的研究工作。Crane 等[22]通 过 分 析 Youtube 中 500 万 段视频的传播过程对应的时间序列发现,大部分 ( 约90%) 视频的传播过程可以用泊松过程精确刻画,剩余视频的传播过程在经历流行度的爆发 (burst)之后,其单位时间内增加的流行度服从幂律分布的衰减。Yang 等[23]研究了用户生成内容流行度随时间的消涨模式。该研究通过对 5.8 亿条推文和 1.7亿篇博客文章流行度随时间消涨模式的聚类分析,挖掘出六类形态各异的流行度时序模式。进一步,Matsubara 等[24]提出了 SpikeM 模型对上述六种时序模式进行拟合,并利用 SpikeM 模型进行流行度预测。SpikeM 模型中利用幂律分布,描述用户生成内容的传播能力随时间衰减的过程,并利用正弦方程描述了用户关注度随时间周期变化的过程。Ahmed 等[25-28]先对用户生成内容初期传播过程的时序模式进行分类,之后利用分类后所得时序模式信息进行流行度预测。Lerman 等[29]在建模 Digg中消息获得投票的过程中,考虑了消息的兴趣度和可见度,进一步利用所得模型进行消息最终获得票数的预测。Wang 等[30]利用增强泊松过程模型,对论文获得引用的过程进行建模。该模型建模了论文的适应力、论文新颖性随着时间的衰减和论文引用过程中的优先连接机制。其中,论文的适应力表示为常数;论文新颖性的衰减服从对数正态分布;优先连接机制表示为引用次数的线性方程。Shen等[31]在上述模型的基础上增加了共轭先验,以消除模型对训练数据过拟合的现象。改进的模型中论文的适应力不再是常数,而是服从伽马分布。改进后的模型提高了论文引用次数预测工作的精度。同样,Gao等[32]在上述模型的基础上,提出了一种基于增强泊松过程的微博消息流行度预测模型。该模型从建模微博消息转发过程对应时间序列的角度,研究了流行度预测问题,并引入微博时间的概念并设计时间映射过程。

相关文章
|
1月前
|
人工智能 安全 数据挖掘
Pandas AI:Pandas与人工智能的结合,让你不再拘泥于如何使用pandas方法及处理语法
Pandas AI:Pandas与人工智能的结合,让你不再拘泥于如何使用pandas方法及处理语法
|
3月前
|
人工智能 前端开发 测试技术
AI:探究下前端组件化设计的实现方法及其重要性(一)
AI:探究下前端组件化设计的实现方法及其重要性
|
3月前
|
人工智能 缓存 前端开发
AI:探究下前端组件化设计的实现方法及其重要性(二)
AI:探究下前端组件化设计的实现方法及其重要性
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能的概念、分类与实现方法
什么是人工智能 人工智能 又被称为机器智能,是一种综合计算机科学、统计学、语言学等多种学科,使机器 模仿、展现 人类智能的 技术。 说到人工智能我们不得不提到图灵测试,那么什么是图灵测试呢? 计算机科学家 艾伦·图灵 在 1950 年发表了一篇论文,文中提出了一项思想实验:我们委托一名人类测试员,使用测试对象能够理解的语言,分别和身处密室中的一台机器、一名人类自由地进行对话。假如经过若干轮对话后,测试员依然无法分辨出谁是机器、谁是人类,则说明该机器通过测试,是具有智能的。 人工智能的应用也可分为四大主要组成部分: 计算机视觉:辨识图像的形状、颜色、含义; 自然语言处理:理解人类的自然语言
147 0
|
12天前
|
机器学习/深度学习 数据采集 人工智能
|
13天前
|
机器学习/深度学习 数据采集 人工智能
|
13天前
|
机器学习/深度学习 人工智能 算法
|
13天前
|
机器学习/深度学习 人工智能 算法
|
2月前
|
人工智能 文字识别 Java
AI工具【OCR 01】Java可使用的OCR工具Tess4J使用举例(身份证信息识别核心代码及信息提取方法分享)
【2月更文挑战第1天】Lept4J和Tess4J都是基于Tesseract OCR引擎的Java接口,可以用来识别图像中的文本,本次介绍Tess4J
91 0
|
4月前
|
机器学习/深度学习 人工智能 安全
人工智能中非平衡数据处理方法、欠采样、过采样讲解(简单易懂)
人工智能中非平衡数据处理方法、欠采样、过采样讲解(简单易懂)
116 0