本篇文章1830字,读完约5分钟
viacheatssheet
最近,关于自然语言处理的顶级国际会议emnlp在丹麦哥本哈根举行。Emnlp是三大自然语言处理会议(acl,emnlp,naacl)之一,最佳论文和最佳论文的列表已经发布了一段时间。详情请参阅雷锋的前一篇文章。(公开号码:雷锋。人工智能技术评论:
万字长的文字,深入解读2017年11月11日emnlp特聘论文,
2017年最佳长论文揭晓,《男人也爱逛街》获得最佳长论文
其中,弗吉尼亚大学的赵婕妤、王天禄、文森特·奥登内兹、张凯威和华盛顿大学的马克·耶茨卡以“男人也喜欢购物:利用语料库水平的约束减少性别偏见的放大”获得了最佳长篇论文。《雷科技评论》邀请第一作者对本文进行独家解读。
原始地址:arxiv/ABS/1707.0944
摘要
涉及视觉语言识别的任务,如图片标题标注、视觉问答系统和视觉语义角色标注,已经成为从图片中获取信息的不同方式。这些任务通常依赖于大量的数据集、结构化的预测方法和深度学习来从图片和语言中提取丰富的信息并解决这些问题。其中,结构化预测方法允许机器学习模型使用注释之间的关系来提高预测精度。例如,视觉语义角色标注任务(vsrl)需要预测给定图片中显示的动词和几个角色(工具、位置等)的值。)与动词有关。例如,在图1中,考虑到铲是一种常见的烹饪工具,结构化预测模型很有可能将“工具”预测为“铲”。
图1
虽然结构化预测方法可以为我们提供更好的预测结果,但是这种方法可以学习数据集中的偏差。如果模型不被修改和限制,这种模型将做出有偏见的预测。例如,在上图中,模型从数据集中学习女性和烹饪之间的关系,即使给出了描述男性烹饪的图片(1.4),模型仍会预测他们是女性。这种情况将女性与烹饪更紧密地联系在一起,反映了一种社会偏见,对不同性别产生了不利影响。
在这篇论文中,我们研究了男性和女性的性别。通过实验,我们发现该模型不仅学习了数据集中的偏差,而且加大了偏差。我们提出了rba算法来解决放大偏差问题,并验证了我们的算法能够在几乎保持原模型性能的同时有效地减小放大偏差。
该模型加大了偏差。我们研究了以下两个任务:基于imsitu数据集的视觉语义角色标注(vsrl)任务和基于coco数据集的多标签对象识别(mlc)任务。本文将以vsrl(如上图1所示)为例进行说明。这项任务的目标是预测给定图片中的动词和图片中的其他角色。
在研究模型放大偏差的过程中,我们定义了度量集和属性集。前者包含可以预测的动词,如烹饪、洗涤等;后者是一些人口统计学特征,如性别、年龄等。我们定义一个动词的性别比例。这个比值为[0,1],越接近1,动词越倾向于男性。
我们还定义了如何计算放大的偏差。例如,在训练集中,烹饪的性别比例为33%,这是偏向女性的,但是在预测结果中,该比例变为16%,表明这种偏向被放大了17%。实验结果如下图2所示:不同的动词对不同的性别表现出不同程度的偏见。例如,上面提到的烹饪更倾向于女性,此外,“购物”和“洗衣”更倾向于女性;“驾驶”、“射击”和“指导”更多的是男性。分析结果表明,在vsrl任务中,所有动词的平均偏误放大率为5%,在mlc任务中为3%。
图2
模型的修订
在验证了模型对偏差的放大后,我们提出了rba算法来修正模型以减小放大后的偏差。我们首先从训练集中获取每个动词的性别比例作为参考标准,并对预测结果进行限制,即每个动词的性别比例应该在相应参考标准的特定范围内。通过引入这些约束条件,我们将原来的模型转化为带有约束条件的预测模型。
我们建议用拉格朗日松弛法来求解这类模型。这种方法的优点是可以不用重构算法训练模型就可以使用原有的预测方法,并且算法可以保证在所有约束条件都满足的情况下得到最优解。具体来说,我们为每个约束条件设置一个拉格朗日算子,根据当前预测结果循环更新所有算子,并根据这些新的拉格朗日算子更新预测算法使用的因子值,从而获得新的预测结果。当所有约束条件都满足或循环次数足够多时,算法停止。
实验结果(图3)表明,我们的算法可以有效地减少放大的偏差,而不损失原始模型的精度。具体来说,在vsrl中,我们将平均扩增偏差值降低了40.5%,而在mlc任务中,则降低了47.5%。在精度方面,两种模型基本保持了原有的精度,应用该算法前后的差异仅为0.1%。
不带rba的vsrl偏置
图3 vsrl数据集上的算法结果
雷锋的特别贡献。严禁擅自转载。详情请参考转载说明。
标题:EMNLP最佳长论文作者独家解读:别让机器学习放大性别偏见,其实男人也喜欢购
地址:http://www.hcsbodzyz.com/hcxw/11704.html