美國麻省理工學院MIT研究、臉部辨識科技有嚴重種族性別偏見

MIT學者揭露 臉部辨識科技有嚴重種族性別偏見

臉部辨識科技的應用範圍越來越廣,但美國麻省理工學院(MIT)研究人員布蘭維妮發現,就算是知名科技業者開發的軟體,在辨識深色人種臉部時,錯誤率也偏高。

布蘭維妮(Joy Buolamwini)的研究發現,包括亞馬遜(Amazon)等科技巨頭開發的臉部辨識軟體,在辨識深膚色女性的性別時,錯誤率較辨識淺膚色男性的性別高出許多。

布蘭維妮已成功刺激微軟(Microsoft)、IBM等企業改善自家系統,但亞馬遜卻大為光火,公開批評她的研究方法。一群人工智慧(AI)領域專家昨天公開力挺布蘭維妮,呼籲亞馬遜停止銷售自家臉部辨識軟體給警方。

除了專業人士和企業界,布蘭維妮的研究成果也引起政治人物注意,其中有些人主張,應為臉部辨識技術使用範圍設限。

布蘭維妮曾指出,目前相關技術多是在未受監督、甚至秘密情況下被使用,而一旦民眾有所警覺,可能為時已晚。

另外有許多研究人員也指出,人工智慧系統透過大數據尋找並識別規律、模式,但在過程中卻也複製了隱含在這些數據中的制度性偏見。

舉例來說,若人工智慧系統的學習材料多為白人男性影像,則它最適合用來辨識白人男性臉部。

這樣的差別性有時可能攸關生死。一份近期發表的研究顯示,幫助自駕車「看路」的電腦視覺系統,在偵測深膚色行人方面,明顯有困難。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏

美國政府研究:多數臉部辨識演算法存在種族偏見

美國國家標準暨技術研究院(NIST)研究了近兩百種的臉部辨識演算法,發現亞裔和非裔美國人臉孔,在一對一配對偽陽性誤判率比高加索人高出10到100倍,而在一對多配對上,非裔美國女性錯誤率則明顯較高。NIST提到,一對多配對的使用案例,偽陽性誤判通常會把錯誤的人擺進需要審查的名單中,可能造成錯誤的指控,因此開發人員和系統使用者應該了解這些系統的限制。

NIST進行臉部辨識供應商測試,由業界和學界開發者提交的臉部辨識演算法,判斷這些演算法在執行不同任務的能力。NIST研究了99位開發人員所提交的189種演算法,並研究這些演算法在一對一配對和一對多配對的表現。一對一配對通常用於智慧型手機解鎖或是護照查驗,以一張照片配對同一人的另一張照片,而一對多配對,則是以一張照片在資料庫中尋找同一人的其他照片,通常用於搜尋特定人選的使用案例。

演算法的誤判有兩種狀況假陽性與假陰性,可能將兩個不同的人辨識為同一個人,或是無法正確將同一個人的兩張照片辨識為同一人。NIST研究團隊總共使用了來自849萬人的1,827萬張照片,這些照片來自美國國務院、國土安全部和聯邦調查局的資料庫,沒有使用社交媒體等網際網路資源或是影像監控的圖像。由於這些資料庫除了照片之外,還有年齡、性別、種族和出生國家的元資料資訊,因此可以精確地知道各種屬性所造成的差異。

研究發現,在一對一配對中,亞裔和非裔美國人臉部的偽陽性誤判率,依不同演算法高於高加索人10到100倍,這可能會增加臉部辨識系統的安全性問題,因為系統可能允許非本人存取系統。特別是美國開發的演算法,對亞洲人、非裔美國人和包括美洲印第安人、阿拉斯加印第安人和太平洋島民等原住民,一對一配對偽陽性誤判率特別高,其中最高的是美洲印第安人。

但是亞洲國家所開發的部分演算法,亞洲人和高加索人在一對一配對上,辨識錯誤率沒有很大的差異,儘管NIST在整個研究並沒有仔細探討誤判發生的原因,但是以部分亞洲演算法的案例推斷,演算法效能與訓練資料有很大的關聯,多樣化的訓練資料可能可以產生更公平的結果。

而在一對多配對上,非裔美國女性的偽陽性誤判率明顯較高,研究人員提到,偽陽性對一對多配對使用案例的影響特別重要,因為可能牽涉錯誤的指控。不過,也不是所有演算法都在一對多配對上對種族有高誤判率,在這次研究中調查的演算法中,公平性評價最高的那一項演算法,精確度也最高。

臉部辨識被大量的用在執法和邊境控管等應用中,雖然過去一些研究早就提出商業系統使用的演算法存在種族和性別偏見,但是NIST這個研究是目前最全面的評估,且印證了早前一些研究的結果。雖然NIST敦促開發者應該進行更多研究,以解決演算法的偏見,但這項研究結果也顯示,人們應該對這些臉部辨識系統的可信度有所保留,並質疑在部分用途的合理性。

🍎たったひとつの真実見抜く、見た目は大人、頭脳は子供、その名は名馬鹿ヒカル!🍏