编辑:三石
【新智元导读】根据美国政府测试发现的结果,即使是表现最佳的人脸识别系统,黑人的错误识别率比白人高 5 至 10 倍。那么到底是什么原因导致不同人种之间人脸识别效果差距如此之大呢?又该如何应对呢?
法国有一家名叫 Idemia 的公司,它的人脸识别软件已经在为美国、澳大利亚和法国的警方提供服务。
例如,这个软件会根据海关或者边境保护局的记录,检查一些在美国着陆乘客的面部特征。
2017 年,FBI 一名高级官员向国会报告称:“面部识别系统使用 Idemia 技术扫描 3000 万张照片,有助于‘保护美国公民’。”
但即便如此,Idemia 的算法并不能对所有面孔都做到精准识别。
美国国家标准与技术研究所(National Institute of Standards and Technology,NIST) 7 月份的测试结果显示,比起白人和黑人男性,系统更容易混淆黑人女性。
NIST 用两张相同的面部照片去测试算法,结果表明,Idemia 的算法错误匹配白人女性面孔的概率约为万分之一,而错误匹配黑人女性面孔的概率却为千分之一,概率增长了 10 倍之多。
而在人脸识别系统中,错误识别概率超过万分之一是一个评判标准。
Idemia 美国公共安全部门主管 Donnie Scott 表示:
“NIST 测试的算法尚未在商业上发布,该公司在产品开发过程中会检查人口统计学差异。人与人之间存在身体差异,算法将以不同的速度对不同的人进行改进。”
最先进的人脸识别算法依旧无法应对深色皮肤面孔
目前,计算机视觉算法在人脸识别任务中可以说是达到了巅峰。
NIST 去年表示,在 2010 年到 2018 年期间,算法在大型数据库精准识别人脸的能力提升了 25 倍,只有 0.2% 的概率会出现无法匹配人脸的情况。这将有助于推动在政府、商业或者手机等电子产品中的广泛使用。
但 NIST 的测试以及其它研究反复发现,算法在识别深色皮肤人脸方面的能力是较差的。该机构 7 月份的报告涵盖了 50 多家公司的代码测试。
自 2017 年初以来,NIST 已经公布了人脸识别算法的人口统计学测试结果。研究还一致发现,识别女性的结果比识别男性的结果差一些,造成这种差距的一部分原因是由化妆造成的。
报告指出,白人男性的错误匹配率通常比较低,而黑人女性的错误匹配率通常会比较高。NIST 计划在今年秋季详细报告该技术如何在不同的人口群体中发挥作用。
NIST 的研究被认为是评估人脸识别算法的黄金标准。那些在人脸识别做的较好的公司将其成果在市场上进行营销。
许多人脸识别算法更容易混淆黑人面孔。每个图表都代表了 NIST 测试的不同算法。
国土安全部还发现,深色皮肤对商业化的人脸识别任务也具有挑战。今年 2 月,国土安全部的工作人员公布了 11 个商用系统的测试结果。结果表明,接受测试的系统需要更长的时间来处理肤色较深的人,而且准确率也相应较低。
政府报告也称:亚马逊、微软和 IBM 的算法在深色皮肤上的识别并不太准确。
人脸识别技术引发隐私、种族歧视等舆论
这些发现引发了一场关于正确和不正确使用面部识别的全国性辩论。
一些公民自由倡导者、立法者和政策专家希望政府限制或禁止使用该技术,就像最近在旧金山和其他两个城市所做的那样。
他们担心的问题包括隐私风险、公民与州之间的权力平衡以及结果中的种族差异。一些批评人士说,即使人脸识别对所有面孔都同样有效,仍然有理由限制这项技术。
尽管争论日益激烈,但人脸识别已经深入到许多联邦、州和地方政府机构中,并且正在传播。美国政府在边境检查和寻找非法移民等任务中使用人脸识别技术。
今年早些时候,洛杉矶警察局对一起入室盗窃案做出回应,这起案件后来升级为致命的枪击事件。一名嫌疑犯被逮捕,但另一名逃跑了。警方通过一张在线照片在人脸识别系统中搜索到了逃犯。
这起案件显示了人脸识别系统的价值,该系统被 50 多个县级机构使用,并在一个包含 1200 多万张面部照片的数据库中进行搜索。警长办公室的中尉 Derek Sabatini 说:“如果没有面部识别,警察们可能不会那么快找到嫌疑人。”
LA County 系统是根据 Cognitec 公司的人脸匹配算法建立起来的。Cognitec 是一家德国公司,和 Idemia 一样,为世界各国政府提供人脸识别服务。
NIST 同样也对 Cognitec 算法做了测试,结果表明,对于女性和有色人种,这些算法的准确率可能会更低。在敏感阈值下,NIST 测试的两种 Cognitec 算法误判黑人女性的概率大约是前者的五倍。
Cognitec 算法开发总监 Thorsten Thies 承认两者存在差异,但表示很难解释。他说,其中一个因素可能是,“与白人相比,给深色皮肤的人拍一张好照片更困难。”
Sabatini 对这种担忧进行了反驳,即不管潜在的原因是什么,有偏差的算法都可能导致警务工作中的种族差异。并且表示警方在采取行动前会仔细检查建议的匹配项,并寻找确凿的证据。他说:“我们从 2009 年开始就在这里使用它,没有任何问题:没有诉讼,没有案例,没有投诉。”
其实,对于人脸识别和种族相关的新闻并不新鲜。
2012 年,美国联邦调查局(FBI)首席面部识别专家合著了一篇研究论文,发现商业面部识别系统对黑人和女性的准确率较低。乔治敦大学的研究人员在 2016 年一份有影响力的报告中警告了这个问题,报告称 FBI 可以搜索大约一半美国人的脸。
随着人脸识别变得越来越普遍,政策专家和决策者对技术的局限性越发感兴趣,这个问题获得了新的关注。MIT 研究员、活动家 Joy Buolamwini 的工作尤其具有影响力。
2018 年初,Buolamwini 和他的人工智能研究员 Timnit Gebru 指出,微软和 IBM 试图检测照片中人脸性别的服务,对于肤色白皙的男性来说近乎完美,但对于肤色黝黑的女性来说,失败的几率超过 20%。
随后的一项研究发现亚马逊服务也有类似的模式。这些研究没有测试试图识别人类的算法(亚马逊在一篇激进的博客文章中称其为“误导”)。
今年 5 月,在众议院监督和改革委员会(House Oversight and Reform Committee)举行的听证会上,Buolamwini 是一位明星证人。马里兰州民主党主席 Elijah Cummings 表示,测试结果中的种族差异加剧了他对警察在 2015 年巴尔的摩抗议黑人男子 Freddie Gray 在警察拘留期间死亡时使用面部识别技术的担忧。
后来,Jim Jordan (俄亥俄州共和党人)宣布,国会需要对政府使用这项技术“做点什么”。他说:
“如果一个面部识别系统犯了错误,而这些错误对非洲裔美国人和有色人种的影响更大,那么在我看来,这就直接违反了美国宪法第一修正案和第四修正案赋予的自由。”
为什么面部识别系统对深色皮肤的识别效果不同?
Buolamwini 告诉国会,许多公司用于测试或训练面部分析系统的数据集并不具有代表性。最容易收集大量面孔的地方是网络,那里的内容偏向白人、男性和西方人。
根据 IBM 的一份评论,在学术研究中引用最多的三种面部图像收集中,81% 或更多的人肤色较浅。
领导 NIST 测试的 Patrick Grother 是人脸识别领域广受尊敬的人物,他表示,可能还有其他原因导致有色皮肤的识别效果较差。
一个是照片质量。从彩色胶片开始到数字时代,摄影技术和技术已经针对较浅颜色的皮肤进行了优化。
在 11 月的一次会议上,他还提出了一个更具挑衅性的假设:从统计数据上看,黑人的脸比白人的脸更相似。他说:“你可能会猜测,这与人性有关。不同的人口群体可能在我们基因的表型表达上存在差异。”
佛罗里达理工学院(Florida Institute of Technology)副教授 Michael King 则不那么肯定。King 此前曾为美国情报机构管理包括人脸识别在内的研究项目。“这是我目前不准备讨论的问题。我们的研究还远远不够,”他说。
King 与 FIT 和圣母大学的同事们的最新研究结果表明,解释人脸识别算法中人口统计学上的不一致性,以及如何解决这一问题,是一项挑战。
他们的研究测试了 4 种面部识别算法(两种商业的和两种开源的),共计 53000 张脸部照片。
在黑人面孔中,错误地匹配两个人的情况更为常见,而在白人面孔中,没有发现匹配面孔的情况更为常见。黑人的大头照中有很大一部分不符合身份证照片的标准,但仅凭这一点无法解释这种扭曲的表现。
研究人员确实发现,他们可以让算法对黑人和白人“一视同仁”,但前提是对两组人使用不同的敏感度设置。
这在实验室之外是不太可能实现的,因为要求侦探或边境特工为不同的人群选择不同的环境会带来歧视风险,并可能引发指控种族定性的诉讼。
当 King 和其他人在实验室里仔细研究算法时,围绕人脸识别的政治斗争正在迅速展开。两党国会议员都承诺采取行动控制这项技术,理由是担心少数族裔的准确性。周二,奥克兰成为继马萨诸塞州萨默维尔和旧金山之后,自 5 月以来第三个禁止其机构使用该技术的美国城市。
King 表示:
“让这些系统对不同的人口统计数据同样有效,甚至理解这是否可能实现,或为什么可能实现,这确实是一个长期目标。”
原文链接:
https://www.wired.com/story/best-algorithms-struggle-recognize-black-faces-equally/?verso=true
来自:
新智元(ID:AI_era)