人工智慧逆天 竟已學會種族和性別歧視

2021-09-23 14:46:18 字數 1811 閱讀 9137

讓計算機具備理解人類語言的人工智慧(ai)工具已經出現了明顯的種族和性別偏見。

這些發現令人擔憂現有的社會不平等和偏見正在以新的、不可預知的方式得到強化,因為影響人們日常生活的大量決策正越來越多地由機械人做出。

然而,最新研究顯示,隨著機器越來越接近於掌握人類的語言能力,它們也在吸收隱藏於語言中的根深蒂固的偏見。

巴斯大學的計算機科學家、**合著者喬安娜·布萊森(joanna bryson)說:「很多人都認為這表明人工智慧(ai)存在偏見。不,這表明我們有偏見,人工智慧正在有樣學樣。」

但布萊森警告說,人工智慧有可能強化現有偏見,因為演算法與人類不同,可能無法有意識地抵制學到的偏見。

「危險在於,你擁有的人工智慧系統沒有一處零部件明確需要依靠道德觀念驅動,這就不好了。」她說。

上述研究發表在《科學》雜誌上,重點關注一種名為「單詞嵌入」機器學習工具,後者已經改變了計算機解讀語音和文字的方式。有人認為,下一步科技發展將自然而然地涉及到開發機器的類人化能力,如常識和邏輯。

「我們選擇研究單詞嵌入的乙個主要原因是,近幾年來,它們已幫助電腦在破解語言方面取得了巨大成功。」這篇**的資深作者、普林斯頓大學計算機科學家阿爾文德·納拉亞南(arvind narayanan)說。

這種方法已經在網路搜尋和機器翻譯中使用,其原理是建立一套語言的數學表示式,依據與每個單詞同時出現的最常用單詞,將這個詞的意思提煉成一系列數字(也就是詞向量)。也許令人驚訝的是,這種純粹的統計方法似乎能夠捕捉到每個詞所在的豐富的文化和社會背景,這是字典無法定義的。

例如,在數學「語言空間」,與花朵有關的詞彙往往與描繪心情愉悅的話語聚集在一起,而與昆蟲相關的詞彙則往往與心情不愉快的詞彙同時出現,反映出人們對昆蟲與花朵的相對特點所達成的共識。

最新的檔案顯示,人類心理實驗中一些更令人不安的隱性偏見也很容易被演算法捕獲。「雌性」和「女性」與藝術、人文職業和家庭的聯絡更緊密,「雄性」和「男性」與數學和工程專業更為接近。

而且,人工智慧系統更有可能將歐美人的名字與諸如「禮物」或「快樂」之類的愉快詞語聯絡在一起,而非裔美國人的名字通常與不愉快的詞語聯絡在一起。

研究結果表明,演算法與隱式聯想測試擁有同樣的偏見,也就是把表示愉快的單詞與(美國和英國的)白人面孔聯絡起來。

這些偏見會對人類行為產生深遠的影響。一項先前的研究表明,相對於非洲裔美國人,如果申請者的名字是歐洲裔美國人,即使簡歷內容相同,後者所能獲得的面試邀請將比前者多出50%。最新的研究結果表明,除非採用明確的程式設計來解決這個問題,否則,演算法將與現實社會一樣,充斥著相同的社會偏見。

「如果你不相信種族主義與姓名存在聯絡,這就是例證。」布萊森說。

研究中使用的機器學習工具是在被稱為「通用爬蟲」語料庫的訓練資料集中接受訓練的,其中的8400億個詞語都是從網上公布的材料中選取的。當研究人員把訓練資料集換成谷歌新聞的資料對機器學習進行訓練時,也出現了類似結果。

牛津大學資料倫理和演算法領域的研究人員桑德拉·沃徹(sandra wachter)說:「世界存在偏見,歷史資料存在偏見,因此,我們得到帶有偏見的結果,不足為奇。」

她補充說,演算法不僅代表一種威脅,也可能為採取適當方式解除和對抗偏見提供機會。

「至少利用演算法,我們可能知道演算法會在什麼時候出現偏差,」她說,「例如,人類會在解釋為何不僱傭某人時說謊,與此相反,演算法不會撒謊,不會欺騙我們。」

然而,沃徹說,問題在於如何從旨在理解語言的演算法中消除不恰當的偏見,同時又不剝奪它們的解讀能力,這將是具有挑戰性的工作。

「原則上,我們可以建立一些系統對帶有偏見的決定進行檢測,然後採取行動,」沃徹說,並與其他人一起呼籲建立乙個人工智慧監管機構。「這是一項非常複雜的任務,但作為一種社會責任,我們不應迴避。」

現在的人工智慧逆天到什麼地步了?

上週盤點過那些蠢萌的人工智障之後 人工智慧一定高大上?盤點那些讓人哭笑不得的人工智障,吃瓜群眾們紛紛表示,這也太蠢了吧,人工智慧不可能就這樣吧,是的,其實現在人工智慧已經逆天到了乙個新的境界,足以令人震撼。它們現在是這樣的 可以獨立穿越氣候條件惡劣的雪地,並且能夠在崎嶇不平且被雪覆蓋的山坡自如地行走...

21天實戰人工智慧系列 人工智慧產品經理最佳實踐

感謝關注天善智慧型,走好資料之路 歡迎關注天善智慧型,我們是專注於商業智慧型bi,人工智慧ai,大資料分析與挖掘領域的垂直社群,學習,問答 求職一站式搞定!課程名稱 21天實戰人工智慧系列 人工智慧產品經理最佳實踐 課程目標 洞察ai業務能力 熟悉ai基礎理論 發展趨勢 面臨問題和當前現狀 熟悉ai...

人工智慧 第一天

1.人類學習 學而不思則罔,思而不學則殆 2.機器學習 模仿人類學習的過程,本質就是計算機通過大規模的資料集中尋找一般性規律的過程 1.為什麼要學習機器學習 因為機器學習可以解決一些很難直接用程式設計解決的問題 2.用途 1.按照用途分類 1.分類 把乙個沒有類別的東西,劃分到乙個對應的類別 2.回...