李飛飛等人的新研究,可能讓人工智慧真的不需要人了

2022-09-28 14:12:12 字數 2341 閱讀 1790

你可能聽說過,在河南的農村裡,在非洲的城市中,每乙個你想象不到的地方,有著大量的資料標註員。

他們手動在裡把每乙隻花瓶和每一輛汽車框出來,並且標上「花瓶」和「汽車」。一段時間後,這些人把成千上萬張標記好的打包,傳送給遠在北京、上海甚至舊金山的 ai 公司。

gq 將這些人稱為《那些給人工智慧打工的人》。

人工智慧發展迅速,大大小小的網際網路科技公司相繼開展研究,投入商用。然而訓練乙個可用的 ai,需要大量準確標記好的、**等資料。

正因為此,市場對資料標註的需求如此之大,吸引「那些給 ai 打工的人」爭相加入,其中不乏原來找不到工作的閒散人員——畢竟這份工作只需要動動滑鼠,用不上太多知識。

但是,恐怕不久後,這些人就將再次失業。

上週,來自約翰霍普金斯大學、史丹福大學和 google 的專家聯合發布了一篇**,介紹了他們使用神經網路來自動搜尋神經網路,將其投入影象分割方面www.cppcns.com的研究,並且取得的重要進展:

研究人員採用神經架構搜尋 (neural architecture seartch, nas) 技術設計了乙個神經架構 (a),放任它去自動搜尋/設計出新的神經架構 (b),投入到影象語義分割 (semantic image segmentation) 的任務中。

研究人員發現,這個被自動搜尋出來的神經架構 b,在主流的小規模影象資料集上,未經訓練就直接使用,表現已經超過了現有人類設計的、預先訓練好的模型。

以往人們一直相信,設計 ai 需要大量知識和經驗,簡而言之就是需要人來設計。

但現在,ai 設計出的 ai,已經比人設shnskxew計出的 ai 更強。

**的標題叫做 auto-deeplab: hierarchical neural architecture search for semantic image segmentation

研究人員將這個能夠自動搜尋(設計)神經架構的技術命名為auto-deeplab。這個名字來自於 deeplab,google 人工開發的影象語義分割技術。前面加上 auto,意思是在 deeplab 的基礎上,新的技術可以實現了很大程度的自動化。

**署名作者當中,兩人來自www.cppcns.com約翰霍普金斯大學,其中第一作者是 chenxi liu,曾在 google 實習;有四人來自 google;剩下的一人來自史丹福大學,正是原 google cloud 首席科學家,在計算機視覺學術和業界知名的李飛飛教授。

「本著 automl(編者注:google 主導的 ai 計畫,將演算法選擇,模型的超引數調整,迭代建模和模型評估等工作自動化。)和人工智慧普及化的精神,對於不依賴專家經驗知識,自動設計神經網路架構,人們的興趣有了顯著提公升。」作者提到。

在「ai 自動設計 ai」這件事上,auto-deeplab 有幾個比較重要的新嘗試。

首先,神經架構搜尋 nas 技術是 ai 領域的新興物種,主要用於簡單的分類。而在這篇**裡,研究者首次嘗試將 nas 投入到高密度的**任務上(也就是對更複雜的高解析度進行語義分割,比如 cityscapes 城市街景資料集、pascal voc 2012 和ade20k 等資料集)。

其次,在計算機視覺領域內的神經網路架構,通常分為內層、外層的兩級架構,自動化的神經架構設計往往只能設計內層,外層仍需要人來設計和手調。而 au程式設計客棧to-deeplab 是第乙個讓 ai 掌握外層設計和調參能力,並在影象語義分割任務上得到優異結果的嘗試。

「影象語義分割」六個字聽上去有點拗口,其實很好理解:對於一張圖劃分幾個類別,然後將所有的畫素點歸類。

比如下面這張圖,可以簡單分為三類。影象語義分割的任務,就是判斷每乙個畫素點屬於人程式設計客棧、自行車,還是背景。

需要明確的是,影象語義分割的任務純粹是判斷畫素點屬於哪個類別,它不能識別和區分獨立的物體。

不過影象語義分割仍然有很重要的意義,比如在它可以用於手機拍照的「人像模式」。採用更優秀的影象語義分割技術,手機能夠在更高精度的**裡確認每乙個畫素點,屬於人,亦或是背景。

目前 google、小公尺等公司都在手機拍照上使用這一技術。理論上,未來的「人像模式」可以在毛髮、衣物邊緣實現更好的效果。

以及在自動駕駛的場景裡,神經網路需要判斷擋在前面的是車、行人還是建築物,進而採用不同策略進行躲避,這同樣需要影象語義分割來打基礎。

從該**體現的效果來看,auto-deeplab 還可以被轉移到其他任務上。言外之意,讓 ai 自動設計 ai 這件事,可能還會有很大的想象空間。

比如作者在**最後提到,在目前的研究框架內,他們可以繼續在物體識別的方向進行研究。

如果能夠取得類似的結果,大規模使用,沒準有一天,在資料標註(特別是影象標註)這件事上,人類標註員的成本等優勢可能也會消失。

如果人工智慧可以給人工智慧打工,打工效率比人還高……

「那些給人工智慧打工的人」,會失去工作嗎?

本文標題: 李飛飛等人的新研究,可能讓人工智慧真的不需要人了

本文位址:

人工智慧與閱讀能力的關係研究

研表究明,漢字的序順並不能影閱響讀,比如當你看完這話句時,你會發這現裡面的字全是都亂的!有誰中招了?原因在這裡 從人工智慧的角度來講,這是最基本的貝葉斯理論。雖然很多人永遠意識不到,但人類時時刻刻都在利用貝葉斯理論做出判斷,也就是利用相關資訊總結出未知資訊。不只是漢語不影響閱讀,很多語言 甚至不是語...

人工智慧 金融科技發展的新動力

隨著alphago再次於今年5月的烏鎮圍棋峰會獲勝後,人工智慧 artificial intelligence,簡稱 ai 在全球範圍內又一次被引爆,各行各業開始出現人工智慧應用的身影,部分行業領頭企業紛紛啟動人工智慧戰略,目的是利用人工智慧改造產品及服務,在特定領域內模仿人類專家思維解決創新服務過...

李傑 人工智慧與工業4 0在智慧型製造的應用

至頂網cio與應用頻道 07月20日 北京訊息 在2017中國大資料應用大會上,美國辛辛那提大學特聘講座教授 美國白宮資訊物理系統與美國挑戰專案顧問李傑,分享了對工業大資料,以及人工智慧怎麼改進工業大資料分析的見解。美國辛辛那提大學特聘講座教授 美國白宮資訊物理系統與美國挑戰專案顧問 李傑 工業大資...