​万字长文详解文本抽取:从算法理论到实践(附“达观杯”官方baseline实现解析及答疑)

  1. 云栖社区>
  2. 数据派THU>
  3. 博客>
  4. 正文

​万字长文详解文本抽取:从算法理论到实践(附“达观杯”官方baseline实现解析及答疑)

初商 2019-08-28 23:51:24 浏览1297
展开阅读全文

文章来源:微信公众号 数据派THU

[ 导读 ]“达观杯”文本智能信息抽取挑战赛已吸引来自中、美、英、法、德等26个国家和地区的2400余名选手参赛,目前仍在火热进行中(点击“阅读原文”进入比赛页面,QQ群见下图或文末二维码)。达观数据目前已经举行过两次围绕比赛的技术直播分享,并开源了baseline模型。本文是这两次技术直播的内容总结,包括信息抽取传统算法和前沿算法详解、比赛介绍,以及比赛baseline模型代码分析和改进建议。

image.png

在前半部分,达观数据的联合创始人高翔详细讲解了自然语言处理中信息抽取算法技术。在后半部分,达观数据的工程师们分享并介绍了“达观杯”文本信息抽取挑战赛的baseline代码以及改进建议。最后,针对参赛选手和其他观众的疑问,三位专家也一一做了解答。

作者介绍:

高翔是达观数据联合创始人,达观数据前端产品组、文本挖掘

网友评论

登录后评论
0/500
评论
初商
+ 关注
所属云栖号: 数据派THU