《Modern Information Retrieval》笔记（一）-阿里云开发者社区

《Modern Information Retrieval》笔记（一）

2017-12-26 1675

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

一，信息检索的基本概念，评价，模型和算法:

1)模型、相关反馈、查询扩展;2)文本处理技术;3)文本分类和聚类技术(倾向性分析);4)信息过滤技术;5)信息组织和索引;6)并行和分布式检索

二，信息检索的应用：1)WEB检索;2)数字图书馆;3)多媒体检索

三，国际著名研究机构和代表人物

1）美国康奈尔大学Salton(1927-1995)，现代信息检索的奠基人，SMART的完成人，第一任Salton奖得主，ACM Fellow

2）英国剑桥大学SparckJones (1935-2007)，概率检索模型的提出者之一，NLP和IR中的先辈，曾获ACL终身成就奖和Salton奖

3）美国UMassCIIR W. B. Croft，ACM Fellow，基于统计语言建模IR模型的提出者和倡导者，和CMU共同开发了Lemur工具，Salton奖得主

4）英国Glasgow大学Rijsbergen，ACM Fellow，信息检索逻辑推理学派的提出者和倡导者

现在试图用量子物理的方法解决IR问题，Salton奖得主

5）英国微软剑桥研究院、伦敦城市大学Robertson，概率检索模型的倡导者，开发了OKAPI，Salton奖得主

6）美国CMU，美国UIUC，微软研究院，IBM研究院，Google研究院

7）一些活跃的华裔学者：加拿大蒙特利尔大学聂建云教授（跨语言检索，IR模型）；

美国UIUC ChengxiangZhai博士（IR模型）；美国CMU YimingYang教授（文本分类）；

台湾中研院简立峰（号称“中文搜索”第一人，加入Google研究院）

8）国内一些相关研究机构：北京大学，复旦大学，清华大学，哈尔滨工业大学，中科院计算所，中科院软件所，中科院自动化所

四，重要会议

国际会议：SIGIR、ACL、WWW、SIGKDD，CIKM、ICML ，TREC，AIRS

国内会议：全国信息检索及内容安全学术会议(2年一届)，全国计算语言学联合会议(2年一届)

五，重要期刊

国际：

ACM Transactions on Information Systems(TOIS)

ACM Transactions on Asian Language Information Processing(TALIP)

Information Processing & Management(IP&M)

Information Retrieval

国内：中文信息学报，情报学报

六，重要工具

Lemur：包含各种IR模型的实验平台，C++

SMART：向量空间模型工具, C编写

Weka：分类工具，Java编写

Lucene：开源检索工具，各种语言编写的版本

Larbin：采集工具，C++

Firtex：检索平台，C++，计算所开发

七，参考书籍及文献

Baeza-Yates, R. & B. Ribeiro-Neto. eds. Modern Information Retrieval. ACM Press, 1999 (国内有机械工业出版社出版的影印版和中文翻译版)

李国辉等著，信息的组织与检索，科学出版社，2003年

Witten, Ian et al. Managing Gigabytes. Orlando, FL: Morgan Kaufmann Publishers Incorporated, 1999

William Frakes& Ricardo Baeza-Yates, Information Retrieval Data Structures and Algorithms. PrenticeHall, 1992

Karen SparckJones& Peter Willet eds. Readings in Information Retrieval, Morgan Kaufmann, 1997

SIGIR Proceedings (since 1971，迄今举办26届)

本文转自Phinecos(洞庭散人)博客园博客，原文链接：http://www.cnblogs.com/phinecos/archive/2007/10/14/923782.html，如需转载请自行联系原作者

文章标签：

C++

《Modern Information Retrieval》笔记（一）

热门文章

最新文章

相关电子书