EMNLP最佳长论文作者独家解读:别让机器学习放大性别偏见,其实男人也喜欢购物!

简介: 近日,自然语言处理领域顶级国际会议 EMNLP 于丹麦哥本哈根举行。EMNLP是自然语言处理三大顶级会议(ACL, EMNLP, NAACL)之一,已经于前段时间公布了录用论文及最佳论文名单。

近日,自然语言处理领域顶级国际会议 EMNLP 于丹麦哥本哈根举行。EMNLP是自然语言处理三大顶级会议(ACL, EMNLP, NAACL)之一,已经于前段时间公布了录用论文及最佳论文名单。详情可参见雷锋网(公众号:雷锋网)AI科技评论此前文章:

万字长文,深度解读11篇 EMNLP 2017 被录用论文

EMNLP 2017 最佳论文揭晓,「男人也爱逛商场」获最佳长论文

其中,弗吉尼亚大学赵洁玉、王天露、Vincente Ordonez、张凯崴及华盛顿大学的 Mark Yatskar 凭借「Men Also Like Shopping: Reducing Gender Bias Amplification using Corpus-level Constraints」摘得最佳长论文。雷锋网AI科技评论邀请了第一作者赵洁玉对此论文做了独家解读。

原文地址:https://arxiv.org/abs/1707.09457

概要

包含语言的视觉识别的任务,例如图片标题标注,视觉问答系统以及视觉语义角色标注任务已经成为从图片中获取信息的不同途径。这些任务通常依赖于大量的数据集、结构化的预测方法以及深度学习提取图片及语言中的丰富信息并以此解决这类问题。其中结构化的预测方法允许机器学习模型用标注之间的关系来提升预测的准确度。例如视觉语义角色标注任务(vSRL),需要对给定图片中所展示的动词以及与该动词相关的几个角色(工具,地点等)值进行预测。例如在图1中,考虑到铲子是一种常见的烹饪工具,结构化的预测模型会有很高的几率将“tool”预测为“spatula”。

EMNLP最佳长论文作者独家解读:别让机器学习放大性别偏见,其实男人也喜欢购物!

图1 

尽管结构化的预测方法可以为我们提供较好的预测结果,但是这类方法会学习到数据集中存在的偏差 (bias)。如果不对模型进行修改限定,此类模型会做出具有偏见的预测。例如在上图中,模型从数据集中学习到女性与做饭之间的联系,即便给定一张描述男性做饭的图片(1.4),模型仍然会预测其为女性。这种将女性与做饭之间联系更紧密的情况,反映了一种社会成见,对不同的性别均有不良的影响。

在本文中,我们针对男女两个性别进行研究,通过实验发现,模型不仅会学习到数据集中的偏差,并且会放大该偏差。我们提出了RBA算法用于解决被放大的偏差,并且验证了我们的算法可以有效的减少放大的bias同时几乎保持了原有的模型性能。

模型对偏差的放大

我们针对以下两个任务进行研究:基于imSitu数据集的视觉语义角色标注(vSRL)任务以及基于COCO数据集的多标签物体识别(MLC)任务。本文中将以vSRL(如上图1)为例进行解释。该任务的目标在于预测所给定图片中的动词,以及图片中的其它角色。

在研究模型放大偏差的过程中,我们定义了测量集合以及属性集合。前者包含了所能预测的动词,比如cooking,washing等;后者则是一些人口特征,例如性别,年龄等。我们定义针对某动词的性别比例,该比例取值[0,1],越接近于1,表明该动词越倾向于男性。

我们也定义了如何计算放大的bias。例如在训练集中,cooking的性别比例为33%,偏向于女性,但是在预测结果中,该比例变成了16%,表明这种bias被放大了17%。实验结果如下图2所示:不同的动词对不同的性别表现出不同的偏见程度。例如上文所提到的cooking更倾向于女性,此外“购物”,“洗衣”等都更偏向于女性;“驾驶”,“射击”以及“指导”则更偏向于男性。分析结果表明在vSRL任务中,所有动词平均放大的bias率为5%,在MLC任务中,该值为3%。  

EMNLP最佳长论文作者独家解读:别让机器学习放大性别偏见,其实男人也喜欢购物!

图2 

对模型的修订

验证了模型对bias的放大作用后,我们提出了RBA算法对模型进行修订以减少所放大的偏差。我们先从训练集中获取每个动词的性别比例作为参考标准,并以此限制预测的结果,即每个动词预测的性别比例应当在相应参考标准的特定范围内。通过引入这些限制条件,我们将原有的模型变成一种具有限制的预测模型。

我们提出利用拉格朗日松弛方法对此类模型求解,该方法的优点在于我们可以利用原有的预测方法而不必重新构造算法训练模型,并且在所有限制条件均满足的情况下,该算法可以保证达到最优解。具体来说,我们对每一个限制条件设置了一个拉格朗日算子,循环地根据当前的预测结果更新所有的算子,根据这些新的拉格朗日算子来更新预测算法所利用的因子值,从而可以得到新的预测结果。当所有的限制条件均满足或者已经循环了足够多的次数后,算法停止。

实验结果(图3)表明我们的算法可以有效的减少放大的偏见,并且不失原有模型的准确度。具体来说,在vSRL中,我们减少了40.5%的平均放大bias值,在MLC任务中,该值为47.5%。在准确度上,两个模型几乎保留了原有的准确度,应用算法前后只有0.1%的差距。 EMNLP最佳长论文作者独家解读:别让机器学习放大性别偏见,其实男人也喜欢购物!

Bias on vSRL without RBA                                                      Bias on vSRL with RBA

图3 算法在vSRL数据集上的结果



本文作者:奕欣
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
1月前
|
机器学习/深度学习 人工智能 算法
【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选
阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。
|
机器学习/深度学习 算法 搜索推荐
阿里云机器学习平台PAI与香港大学合作论文入选INFOCOM 2022,有效减少大规模神经网络训练时间
近日,阿里云机器学习平台 PAI 与香港大学吴川教授团队合作的论文”Efficient Pipeline Planning for Expedited Distributed DNN Training”入选INFOCOM(IEEE International Conference on Computer Communications) 2022,论文提出了一个支持任意网络拓扑的同步流水线并行训练算法,有效减少大规模神经网络的训练时间。
阿里云机器学习平台PAI与香港大学合作论文入选INFOCOM 2022,有效减少大规模神经网络训练时间
|
11天前
|
机器学习/深度学习 数据可视化 算法
【python】Python大豆特征数据分析 [机器学习版一](代码+论文)【独一无二】
【python】Python大豆特征数据分析 [机器学习版一](代码+论文)【独一无二】
|
6月前
|
机器学习/深度学习 人工智能 算法
CV领域再创佳绩!阿里云机器学习平台 PAI 多篇论文入选 ICCV 2023
近期,阿里云机器学习平台PAI发表的多篇论文在ICCV 2023上入选。ICCV是国际计算机视觉大会是由电气和电子工程师协会每两年举办一次的研究大会。与CVPR和ECCV一起,它被认为是计算机视觉领域的顶级会议之一。ICCV 2023将于10月2日至10月6日法国巴黎举办。ICCV汇聚了来自世界各地的学者、工程师和研究人员,分享最新的计算机视觉研究成果和技术进展。会议涵盖了计算机视觉领域的各个方向,包括图像处理、模式识别、机器学习、人工智能等等。ICCV的论文发表和演讲都备受关注,是计算机视觉领域交流和合作的重要平台。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里云人工智能平台PAI多篇论文入选EMNLP 2023
近期,阿里云人工智能平台PAI主导的多篇论文在EMNLP2023上入选。EMNLP是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选意味着阿里云人工智能平台PAI自研的自然语言处理算法达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
|
6月前
|
人工智能 算法
阿里云人工智能平台 PAI 扩散模型加速采样算法论文入选 CIKM 2023
近日CIKM 2023上,阿里云人工智能平台PAI和华东师范大学陈岑副教授团队主导的扩散模型加速采样算法论文《Optimal Linear Subspace Search: Learning to Construct Fast and High-Quality Schedulers for Diffusion Models》入选。此次入选意味着阿里云人工智能平台 PAI自研的扩散模型算法和框架达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。
|
9月前
|
机器学习/深度学习 人工智能 编解码
NLP领域再创佳绩!阿里云机器学习平台 PAI 多篇论文入选 ACL 2023
阿里云机器学习平台PAI主导的多篇论文在ACL 2023 Industry Track上入选。
|
9月前
|
机器学习/深度学习 算法 自动驾驶
YOLOX-PAI 详细解读(一)论文解读
YOLOX-PAI 详细解读(一)论文解读
140 0
|
10月前
|
机器学习/深度学习 数据采集 弹性计算
阿里云机器学习平台PAI论文入选 SIGMOD 2023
阿里云机器学习平台PAI和北京大学杨智老师团队合作的论文被SIGMOD 2023录用。
|
11月前
|
机器学习/深度学习 5G 计算机视觉
【机器学习】引用次数在1.5w次以上神仙论文!(下)
【机器学习】引用次数在1.5w次以上神仙论文!
【机器学习】引用次数在1.5w次以上神仙论文!(下)

热门文章

最新文章