本节书摘来自异步社区出版社《相关性准则——大数据时代的高效能之道》一书中的第2章,第2.1节,作者:【意】Stefania Lucchetti,更多章节内容可以访问云栖社区“异步社区”公众号查看。
2.1 .定义
相关性准则——大数据时代的高效能之道
相关性1这个术语通常用于描述某样事物(信息、事件、文档,也指思想、举措以及行动)与给定事件的关系密切程度或适用程度。如果某样事物对于特定目的有意义,则该事物为相关事物。在信息检索领域,相关性定义了特定的数据资料或数据元素与查询主题的匹配程度。
在过去20年中,许多语言学家提请大家关注相关性决策在推理和交流方面的重要性。他们指出,任何信息都是在某种语境下给出的,其相关性取决于遇到该信息的主体的知识状态2。
这种理论应用于人际交换信息的交流与理解之间的关系时,似乎十分妥当,但是,在应用于不涉及两个人之间的直接互动的问题时却遇到了麻烦。为了弥补这个缺陷,其他研究者试着将相关性定义为与目标有关的特性,即如果某一事项(例如一段信息或一个对象)能够成为且仅这个事项能够成为能够实现某个理想目标的某个计划的基本要素,则这个事项为该目标的相关事项3。
但是,要找到一个客观参数对相关性进行评估并非易事。例如,根据所有信息的接收顺序和接收时间,某段信息可能较为重要,也可能较不重要。因此,相关性似乎是一个相当主观的参数,本质上指出了一个事项与另一个被当作参数的事项之间的关系(相关事项与什么事项相关)。