【数据挖掘】关联规则和Apriori算法

  1. 云栖社区>
  2. 博客>
  3. 正文

【数据挖掘】关联规则和Apriori算法

姚攀 2015-11-21 12:03:55 浏览660
展开阅读全文

一.数据挖掘概念

1.1什么是数据挖掘?

数据挖掘就是从海量的数据源中,如数据库、文本、图片、万维网、视频等资源中寻找有用的模式,这些模式是有用的、有潜在价值的、可以被理解的。

1.2从数据中发现知识的步骤

  • 采集数据
  • 存储数据
  • 管理数据
  • 分析数据
  • 结果应用

1.3数据挖掘的任务

1.传统数据挖掘任务

  • 分类
  • 聚类
  • 关联规则挖掘
  • 序列挖掘
  • 离群点发现
  • 数据可视化

2.互联网时代的数据挖掘任务

  • 文本、网页分析
    • 知识库(实体、属性、关系抽取)
    • 关键词发现
  • 社交网络分析
  • 商品推荐
  • 互联网搜索排序
  • 互联网广告

1.4相关领域

  • 机器学习
  • 概率统计
  • 数据库
  • 信息检索
  • 推荐系统
  • 自然语言处理

1.5 数据挖掘的方法

数据挖掘的方法有很多种,常见的有:

  1. 监督学习(或者称为分类)
  2. 无监督学习(或者称为聚类)
  3. 关联规则挖掘
  4. 序列模式挖掘

1.6数据挖掘经典案例

通俗的理解,数据挖掘就是从数据中发掘规律,利用规律创造价值。啤酒与尿

网友评论

登录后评论
0/500
评论
姚攀
+ 关注