《相关性准则——大数据时代的高效能之道》一一2.1 .定义

简介:

本节书摘来自异步社区出版社《相关性准则——大数据时代的高效能之道》一书中的第2章,第2.1节,作者:【意】Stefania Lucchetti,更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.1 .定义

相关性准则——大数据时代的高效能之道
相关性1这个术语通常用于描述某样事物(信息、事件、文档,也指思想、举措以及行动)与给定事件的关系密切程度或适用程度。如果某样事物对于特定目的有意义,则该事物为相关事物。在信息检索领域,相关性定义了特定的数据资料或数据元素与查询主题的匹配程度。

在过去20年中,许多语言学家提请大家关注相关性决策在推理和交流方面的重要性。他们指出,任何信息都是在某种语境下给出的,其相关性取决于遇到该信息的主体的知识状态2。

这种理论应用于人际交换信息的交流与理解之间的关系时,似乎十分妥当,但是,在应用于不涉及两个人之间的直接互动的问题时却遇到了麻烦。为了弥补这个缺陷,其他研究者试着将相关性定义为与目标有关的特性,即如果某一事项(例如一段信息或一个对象)能够成为且仅这个事项能够成为能够实现某个理想目标的某个计划的基本要素,则这个事项为该目标的相关事项3。

但是,要找到一个客观参数对相关性进行评估并非易事。例如,根据所有信息的接收顺序和接收时间,某段信息可能较为重要,也可能较不重要。因此,相关性似乎是一个相当主观的参数,本质上指出了一个事项与另一个被当作参数的事项之间的关系(相关事项与什么事项相关)。

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
13天前
|
存储 传感器 大数据
大数据定义详解
【4月更文挑战第9天】大数据,超常规工具处理的海量(TB-PB-EB)多样化数据,包含结构化与非结构化信息,生成速度快且真实性高。关键在于专业化处理以实现数据增值,依赖于计算机科学、统计学的理论与云计算的支撑。大数据分析提供决策支持,驱动业务创新和社会治理改善,与云计算紧密关联,共同塑造新兴领域。
29 4
|
4月前
|
SQL 大数据 Java
大数据必知必会系列——萌新提问怎么定义HiveUDF函数?能否给个示例
大数据必知必会系列——萌新提问怎么定义HiveUDF函数?能否给个示例
36 0
|
存储 分布式计算 DataWorks
持续定义 SaaS 模式云数据仓库—— MaxCompute 数据的持续保护 | 学习笔记(三)
快速学习持续定义 SaaS 模式云数据仓库—— MaxCompute 数据的持续保护
233 0
持续定义 SaaS 模式云数据仓库—— MaxCompute 数据的持续保护 | 学习笔记(三)
|
新零售 分布式计算 安全
MaxCompute 持续定义 Saas 模式云数据仓库一云数据仓库 + BI | 学习日记(二)
快速学习 MaxCompute 持续定义 Saas 模式云数据仓库一云数据仓库 + BI
183 0
MaxCompute 持续定义 Saas 模式云数据仓库一云数据仓库 + BI | 学习日记(二)
|
存储 分布式计算 运维
MaxCompute 持续定义 Saas 模式云数据仓库一云数据仓库 + BI | 学习笔记
快速学习 MaxCompute 持续定义 Saas 模式云数据仓库一云数据仓库 + BI
397 0
MaxCompute 持续定义 Saas 模式云数据仓库一云数据仓库 + BI | 学习笔记
|
存储 分布式计算 DataWorks
持续定义 SaaS 模式云数据仓库 ——MaxCompute 数据的持续保护 | 学习笔记
快速学习持续定义 SaaS 模式云数据仓库 ——MaxCompute 数据的持续保护,介绍了持续定义 SaaS 模式云数据仓库 ——MaxCompute 数据的持续保护系统机制, 以及在实际应用过程中如何使用。
195 0
持续定义 SaaS 模式云数据仓库 ——MaxCompute 数据的持续保护 | 学习笔记
|
分布式计算 运维 安全
MaxCompute 持续定义 Saas 模式云数据仓库 ——云数据仓库+ BI | 学习笔记
快速学习 MaxCompute 持续定义 Saas 模式云数据仓库 ——云数据仓库+ BI,介绍了 MaxCompute 持续定义 Saas 模式云数据仓库 ——云数据仓库+ BI系统机制, 以及在实际应用过程中如何使用。
171 0
MaxCompute 持续定义 Saas 模式云数据仓库 ——云数据仓库+ BI | 学习笔记
|
存储 监控 数据可视化
这是操作系统史上的创新还是作秀? 大数据OS价值该如何定义
这是操作系统史上的创新还是作秀? 大数据OS价值该如何定义
这是操作系统史上的创新还是作秀? 大数据OS价值该如何定义
|
存储 分布式计算 运维
MaxCompute 持续定义 SaaS 模式云数据仓库— 云数据仓库+ Severless | 学习笔记
快速学习 MaxCompute 持续定义 SaaS 模式云数据仓库— 云数据仓库+ Severless
121 0
MaxCompute   持续定义 SaaS  模式云数据仓库— 云数据仓库+  Severless  | 学习笔记
|
存储 数据采集 分布式计算
MaxCompute 持续定义 SaaS 模式云数据仓库——云数据仓库+数据银行 | 学习笔记
快速学习 MaxCompute 持续定义 SaaS 模式云数据仓库——云数据仓库+数据银行
163 0