CCL 2017最佳论文公布,看全国计算语言学前沿研究

简介: 本次会议共收到 264 篇投稿,录用 105 篇论文,录用率为 39.77%,共有超过 700 名计算语言学研究者和其他领域的专家学者参与本届会议,参会人数为历届最多。

10 月 14 日、15 日,由中国中文信息学会(CIPS)举办的第十六届全国计算语言学会议(CCL 2017)暨第五届自然标注大数据的自然语言处理国际学术研讨会(NLP -NABD 2017)于江苏南京召开。

本次会议共收到 264 篇投稿,录用 105 篇论文,录用率为 39.77%,共有超过 700 名计算语言学研究者和其他领域的专家学者参与本届会议,参会人数为历届最多。

image


大会主席,中国工程院院士倪光南在开幕式上致辞。

image


他表示,语言是信息最重要的载体,只有计算机有处理语言的能力时,计算机才能通过图灵测试,实现人工智能。因此语言智能是人工智能的核心。而信息时代以来,数字信息有效利用成为资源信息技术发展的一个全局性的瓶颈问题,语言信息处理已经成为信息科学技术长期发展新的战略制高点。而全国计算机语言学学术会议,为研讨和传播我们中文信息处理,尤其是计算语言学最新的技术和学术成果,提供了高水平的深入交流平台。2017 年,我国政府将人工智能升到国家战略高度,对 2030 年之前的中国人工智能产业进行了系统部署。在新的历史条件下,中文信息处理领域能否抓住这个重大机遇,对长期的研究和发展沉淀的基础上勇于创新产生重大突破,是我国中文信息处理里面必须回答的一个重大问题。希望此次大会能推动我国科技科学者在自然语言处理方面取得更多的成果,为我国中文信息处理事业开展新的发展阶段。

西安交通大学人工智能与机器人研究所教授、 IEEE Fellow、中国工程院院士郑南宁做了以《受脑认知和神经科学启发的人工智能》为主题的主旨报告。

image


郑教授认为,只有了解大脑,才能发展出更「健壮」的 AI。想要实现这类不仅在智力上超过一般人类,也在人类习以为常的复杂场景任务中取得卓越的表现的 AI,还应该从脑认知,神经科学,以及人与环境交互的过程中寻找新的方法。经典的人工智能基本理论,以演绎逻辑、语义描述以及形式化的方法来应对问题。换言之,只要能够形式化的任务,都可以用当今冯诺依曼架构的计算机以及当今的人工智能方法来解决。但是,由于条件问题(无法举出一个问题的所有条件)和分析问题(无法给出一个问题的所有分析),研究者无法对所有对象建立模型,也就无法用演绎逻辑和形式化的方法来解决复杂的、处于动态变化环境中的问题。人工智能的局限性,表现在以下五个方面:无法将问题抽象成有精确数学意义的模型,无法对已建立的数学模型设计出确定的算法或计算过于复杂,无法表现出真实世界的脆弱性和不确定性,只能进行可递归化的计算、处理可向量化的数据。

image

因此要向大脑中寻求人比机器强的地方,例如想象力、创造性、复杂性和动态性,找到将其融入人工智能系统的方法,建立中国新一代人工智能规划中提到的「混合增强智能」框架。

image


清华大学社会科学学院院长、清华大学心理学系系主任彭凯平教授则从心理学角度介绍了人的智能的优越性。

image


他坦陈如今传统心理学范畴内的人类智能,如学习、记忆、判断、分析、决策等认知能力都在逐渐被人工智能超越,然而除了「Brain」之外,人类还有「Mind」,即脑所产生的意识、心理、活动状况等。新兴的积极心理学,从达尔文以「自然选择,适者生存」与「性选择,美者生存」为核心观点的进化论出发,发现人类的进化历史几千万年的组织形态学变化,选择的都是人的一些独一无二的天性,这些天性现在看来可能是人比其他的生物要优越的地方,也可能是人迄今为止比机器优秀的地方。这些天性并不是我们传统上认为的认知加工能力的优势,而是进化选择出来的人类独一无二的积极心理能力。积极心理能力包括:从两岁半左右开始获得的与间接学习相关的同理心,从五岁左右开始获得的延迟满足的自控力,六个月就已经具有的天然道德意识,以及本能的对未来憧憬和计划的前瞻意识。积极心理学家认为这就是人类的智能优越之所在,以及这也许是人工智能的研究未来的探索方向。

香港科技大学计算机系新明工程学讲座教授,大数据研究所主任及计算机系主任杨强做了《从深度学习到迁移学习》报告,探讨了深度学习在小数据、可靠性等方面的弱点,介绍了近期迁移学习的进展,以及一些可能弥补深度学习不足的研究方向。

image


北京大学数学科学学院教授耿直以《从相关到因果:因果推断》为题,介绍了相关关系与因果关系的概念及形式化,如何由部分变量推断因果作用,如何确定替代目标的准则及问题,以及因果网络的分解学习方法、主动学习方法,并探讨了如何评价因果作用和挖掘因果网络的统计方法。

image


搜狗公司 CEO,前搜狐高级副总裁、首席技术官王小川介绍了搜狗公司基于「让表达与获取信息更简单」的使命,发展以输入法和搜索为核心的信息处理技术,并在「自然交互知识计算」的理念下,在对话、问答和机器翻译方面探讨产品需求和技术难题的实践。

image


除此之外,还有 20 位研究者就机器翻译中的分词、未登录词问题,知识图谱的关系抽取和推理问题等多个方向给出了四场口头报告。近 10 家公司在会场进行了系统展示。

image


15 日,大会公布了评选出的两篇 CCL 2017 最佳论文奖,一篇 NLP -NABD 2017 最佳论文奖,一篇最佳张贴报告展示奖和一篇系统展示奖,以下是获奖论文的介绍:

CCL 2017 最佳论文奖

论文:基于 E-CNN 的情绪原因识别方法
作者:慕永利,李旸,王素格
地址:http://www.cips-cl.org/static/anthology/CCL-2017/CCL-17-058.pdf

image


摘要:文本情绪原因识别作为一个新型的研究方向在文本情绪分析领域占据重要地位。本文结合卷积神经网络,提出了一种基于集成卷积神经网络的情绪原因识别方法。该方法通过词向量、卷积、池化等操作充分融合了句子的语义信息,利用多个 CNN 集成降低数据不平衡性对情绪原因识别的影响,克服了传统情绪原因识别方法的繁琐规则制定、特征抽取、特征空间降维等过程。实验结果表明,本文的方法在情绪原因识别方面取得了较好的效果,对于情绪归因的方法研究具有一定的指导作用。

论文:融合概念对齐信息的中文 AMR 语料库的构建
作者:李斌,闻媛,宋丽,卜丽君,曲维光,薛念文
地址:http://www.cips-cl.org/static/anthology/CCL-2017/CCL-17-034.pdf

image


摘要:作为一种新的句子语义表示方法,抽象语义表示(AMR)将一个句子抽象为单根有向无环图,已经建立 了较大规模的英文语料库。然而,句子中的词语和 AMR 图的概念对齐信息缺失,使得自动分析效果和语料标注 质量受到影响,同时中文尚无较大规模的 AMR 语料库。本文介绍了中文 AMR 语料库的构建工作,针对汉语特 点调整了 AMR 的标注体系,增加对复句关系的标注,提出了融合概念对齐的一体化标注方案,解决了中英文输 入法频繁切换的问题,增加了错别字纠正和未标注词高亮功能,提高了标注效率。然后,从 CTB 中选取了 6923 句进行人工标注,形成中文 AMR 语料库,统计得到图和环的比例分别为 48% 和 1%,以及利用对齐信息才能获 取的非投影句的比例 32%,为中文 AMR 的理论和自动分析研究奠定基础。

NLP -NABD 2017 最佳论文奖

论文:Using Cost-Sensitive Ranking Loss to Improve Distant Supervised Relation Extraction
作者:Daojian Zeng, Junxin Zeng, Yuan Dai


image

CCL 2017 最佳张贴报告展示奖

论文:儿童外语学习认知数据收集的在线游戏框架
作者:马为之,张敏,张琛昱,陈忆馨,谢倩,孙炜岳,刘奕群,马少平
地址:http://www.cips-cl.org/static/anthology/CCL-2017/CCL-17-056.pdf

image


摘要:近年来,人工智能技术飞速发展,不少工作试图从人类的认知发展过程中探索前进方向,语言学习 认知的过程成为了重点关注的研究领域。已有的语言认知研究工作主要集中在学龄前儿童母语的词汇学习认知方面,依赖于 WordBank1 等大规模语料库。然而就我们所知,目前在第二语言学习方面研究不多,尚未有大规模的第二语言词汇学习数据,且传统的数据收集方法难以收集到大规模数据,这也一定程度上限制了对于第二语言学习的研究工作及母语与第二语言学习的比较。针对这一问题,本文针对学龄前儿童群体设计了基于游戏性原则的数据收集方法和研究框架,用于收集第二语言的语言学习情况和用户数据,以支撑相应研究工作的开展。目前,我们已经实现了针对学龄前儿童的第二语言为英语的词汇认知数据收集系统,正在进行在线的数据收集。

CCL 2017 系统展示奖

系统:“九歌”古诗自动生成系统
作者:清华大学自然语言处理与社会人文计算实验室

九歌是清华大学自然语言处理与社会人文计算实验室研发的自动诗歌生成系统。九歌研究团队由孙茂松教授带领,下含两博士生、两名硕士生及多名本科生。九歌系统采用最新的深度学习技术,结合多个为诗歌生成专门设计的不同模型,基于超过 30 万首的诗歌进行训练学习。九歌系统能够产生集句诗、近体诗、藏头诗、现代诗等不同体裁的诗歌。该系统在生成诗歌的质量上有显著提升。作为一款融合现代技术和中国古典文化的有趣应用,九歌在推动自然语言处理技术发展,弘扬中华优秀传统文化等方面都有所帮助。

原文发布时间为:2017-10-17
本文作者: 邱陆陆
本文来自云栖社区合作伙伴“PaperWeekly”,了解相关信息可以关注“PaperWeekly”微信公众号

相关文章
|
1月前
|
机器学习/深度学习 人工智能 算法
【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选
阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。
|
21天前
|
人工智能
全球人才智库报告出炉:顶尖AI研究者,中国贡献26%
MIT Tech Review报告显示,中国贡献了全球26%的顶尖AI研究者,成为重要的人才基地。中国AI研究生留存率高达90%,正快速追赶美国在AI领域的主导地位。2019至2022年间,美国顶尖AI人才比例从2/3降至1/2。尽管面临中美关系影响及部分领域差距,中国AI产业的繁荣促进了人才增长。
16 1
全球人才智库报告出炉:顶尖AI研究者,中国贡献26%
|
8月前
|
机器学习/深度学习 传感器 SQL
中国最权威的NLP学术会议即将开幕,五大特邀报告公布
中国最权威的NLP学术会议即将开幕,五大特邀报告公布
126 0
|
8月前
|
人工智能 自然语言处理
ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜(2)
ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜(1)
ACL 2023奖项公布:3篇最佳论文、39篇杰出论文,多家国内机构上榜
248 0
|
10月前
|
机器学习/深度学习 人工智能 算法
AMiner公布AI 2000榜单:阿里巴巴获评全球十大计算机网络研究机构
AMiner公布AI 2000榜单:阿里巴巴获评全球十大计算机网络研究机构
110 0
|
机器学习/深度学习 人工智能 自然语言处理
斯坦福发布2019全球AI报告:中国论文数量超美国,但论文影响力比美国低50%
近日,斯坦福联合MIT、哈佛、OpenAI等院校和机构发布了一份291页的"2019年度AI指数报告"。报告显示中国AI论文数量超美国,但论文影响力美国比中国高50%;AI人才辞去学术界教职进入产业界的速度加快;自动驾驶最受投资者的青睐……
147 0
斯坦福发布2019全球AI报告:中国论文数量超美国,但论文影响力比美国低50%
|
机器学习/深度学习 人工智能 安全
蚂蚁安全实验室斩获NeurIPS & Facebook AI联合竞赛冠军
12月10日,由国际人工智能顶会NeurIPS 与 Facebook AI联合举办的图像相似匹配竞赛ISC2021落下帷幕,本次比赛共有1635支参赛队伍参加,是今年NeurIPS会议上最具影响力的比赛之一。来自蚂蚁集团的TitanShield Team(titanshield2)以超越第二名10个百分点的成绩斩获图像表征赛道冠军。据悉,此次夺冠团队采用的技术方案是由蚂蚁集团独立自研的、“基于特征兼容自监督学习框架”的预训练模型,能够针对性地解决内容安全风控领域常见的敏感信息更迭速度快、风控模型训练不及时等问题。作为可信AI技术研究及应用中的一环,该技术上线后可降低80%的图像对抗风险,将有助
171 0
|
安全
「人传人」去年12月或已发生:关于新型冠状病毒,最权威的流行病学研究发表了
新型冠状病毒肺炎疫情正牵动全国人民的心,在医务工作者和医务团队努力开展工作的同时,科研人员也在加紧对于疫情的研究工作。
158 0
「人传人」去年12月或已发生:关于新型冠状病毒,最权威的流行病学研究发表了