灵玖软件:KGB知识图谱技术是大数据精准挖掘新引擎

  1. 云栖社区>
  2. 博客>
  3. 正文

灵玖软件:KGB知识图谱技术是大数据精准挖掘新引擎

ljrj123 2018-11-20 11:44:44 浏览710
展开阅读全文

  在大数据时代下,数据已发展成经济社会的强大动力,而且还在提高社会生产力等多方面取得了显著成效,但同时也会带来许多问题,比如数据的存储、稳定性与可靠性,其中,最重要的就属于数据信息的安全,且还一度引起人们的广泛关注。
  大数据,又称海量数据,即所涉及到的数据量无法通过人工,在一定时间内收集、管理、处理和整理出人们所需要的信息.其数据规模巨大,资料海量复杂,难以整理成为人类所能解读的信息.其挑战包括采集、管理、存储、搜索、共享、分析和可视化。
  大数据技术是继云计算、物联网技术之后IT界的又一次颠覆性的变革,有利于整合与共享管理信息,提高协同工作效率,提高决策的科学性与精准性。但另一方面,数据的开放性要求与个人用户信息的私密性相冲突,是政府机构、学术界和工业界不得不长期面对的一个两难问题。大数据时代、物联网、可穿戴设备、智能汽车……万物互联的时代越走越近,安全威胁也如影相随。“万物互联将会是未来的趋势。”未来不仅手机、电脑、电视机等传统信息化设备会连入网络,家用电器和工厂设备、基础设施等也将逐步成为互联网的端点。
  大数据在带来了新安全风险的同时也为信息安全的发展提供了新机遇。大数据正在为安全分析提供新的可能性,对于海量数据的分析有助于信息安全服务提供商更好的刻画网络异常行为,从而找出数据中的风险点。
  北京理工大学大数据搜索与挖掘实验室张华平主任研发的NLPIR大数据语义智能分析技术是对语法、词法和语义的综合应用。NLPIR大数据语义智能分析平台平台是根据中文数据挖掘的综合需求,融合了网络精准采集、自然语言理解、文本挖掘和语义搜索的研究成果,并针对互联网内容处理的全技术链条的共享开发平台。
  其中KGB(Knowledge Graph Builder)知识图谱引擎是我们自主研发的知识图谱构建与推理引擎,基于汉语词法分析的基础上,采用KGB语法实现了实时高效的知识生成,可以从非结构化文本中抽取各类知识,并实现了从表格中抽取指定的内容等。KGB同时可以定义不同的动作,如抽取动作,并能自定义各类后处理程序。利用KGB知识图谱引擎可以抽取到产品的详细报价信息,方便进行下一步的数据挖掘与图谱构建。
  例如KGB语法:
  Knowledge: { [/LE;/w]+[采购方;甲方;发包方; 需方]} +1+{[-(/LE;/w)]20}s+{[(/LE;/w)]}
  Action: Extract
  Argument:甲方单位
  表示的是:
  如果 句首或者标点后,跟了{采购方;甲方;发包方};后面1步内跟的不是标点也不是是句尾,20个单元内的部分,将选中的词抽取为甲方单位。
  因此,数据挖掘技术是一个发展十分快的领域, 随着对数据挖掘技术在各领域日益广泛的应用,实现了数据资源共享及技术发展的跨域,从而大大提高了工作效率,并带来巨大的成功。21世纪是信息时代的社会,“信息不仅是资源,更是财富”,要实现经济的腾飞,需依赖高新尖科技的发展,故利用提供的信息,充分进行数据挖掘,则将为数据库的应用开辟了广阔的前景,也为人类的文明开辟了一个崭新的时代。

网友评论

登录后评论
0/500
评论
ljrj123
+ 关注