ai正在一步步趨於成熟,但標註師群體卻在一步步遠離舞台……
據**報道,截至今年3月,百度山西人工智慧資料產業基地中,就擁有超過3000位標註師,主要涉及自動駕駛、人臉識別等內容標註,其中86%的員工為90後;位元組跳動在北京、天津、濟南、武漢各地,也招募了4萬名資料標註師;騰訊更是直接把平台放到了線上,讓標註師變成了一種「全民兼職」,稱為「眾包」。
巨頭的加入一方面是為了市場和成本,另一方面也是出於資料安全考慮,所以在內部搭建專門的標註團隊顯然是乙個好選擇。但是,「模型的訓練和資料需求是週期性的,任務不持續,今天有活、明天沒活,人員容易流失,管理成本很高」,劉夢緣能理解大廠擺出「眾包」的原因,「我讓手下的人去試過平台的兼職標註,單個標註幾分錢,乙個月的收入在2000元左右,比起讓外包來做,省了一半還多。」
「大廠出手之後,市場最後拼的就是成本」,那段時間劉夢緣所在公司業績下滑了40%,而且做出的標註資料質量也差很多。
據懂懂筆記了解,2018-2023年資料標註師行業平均薪資為5000-6000元,如果晉公升為項www.cppcns.com目主管或者更高階別的專案總監後,月薪才能向5位數靠攏。而這一薪資標準到了2023年, 在一些求生的外包「小廠」內,不公升反降。
巨頭湧入,薪資縮水的「大趨勢」下,能窺探出標註師行業的「小趨勢」:許多資料標註就像被人精心種下的水稻,還未到秋收季節稻穗就掉進了土裡。
年初,劉夢緣單獨接了乙個「私單」,賺了2萬元。
那是乙個大廠「丟」出來的單子,做無人駕駛的資料標註工作,由於公司手頭上的人員都撲在另乙個專案上,她拉了之前的一些老同事和10個兼職學生,幹了個「包工頭」的活。
已經快1年沒有親自上陣標註檔案的劉夢緣,只能硬著頭皮和所有人一樣移著滑鼠,頭頂、脖子、肘部、手腕、膝蓋……都要乙個個地標出來。整整一周,一群人完成了幾萬個點位的標註——他們看似在科技的潮頭,幹的卻是苦力活。
本以為這單生意之後,可以繼續接小單,可好景不長。「4月份開始,很多新團隊出現,壓價特別狠,原來是標註的**按毛算,現在**單上都出現幾分錢了」。
資料標註行業有一套分工流程:巨頭把任務交給中游的資料標註公司,再由中游包給下游的小公司、小作坊,有的小作坊還會進一步眾包給「**」:比如兼職程式設計客棧學生。一單生意幾經轉手,就造成了行業眾包中介層疊越來越嚴重,利潤所剩無幾。
「ai 肯定是未來的大趨勢,但我們這些小公司很迷茫,聽說很多公司都不幹了。」劉夢緣本想著「私單」做得差不多了之後就出來單幹,可這樣的行業情況下,她www.cppcns.com能感受到的只有壓力。
困境、掙扎
儘管目前的情況不樂觀,劉夢緣依舊相信,資料標註行業最終會大浪淘沙,而他們,是走到最後的那一批。
從好的局面來看,下游市場陷入混戰的同時,上游的 ai 市場從未停止過發展,ai正在成為人們進入這個社會的「入口」,這讓劉夢緣和其他從業者們感到充滿希望。
但行業也顯露出嚴峻的一面,資料標註在迭代:大模型慢慢替代標註師,一些門檻更高、學科更細分的領域正露出頭角。比如,醫療健康領域需要對病理切片等進行標註,以腰椎間盤突出的 ct 片為例,標註員必須準確識別並標註出間盤的輪廓。不過,很多醫療專家並沒有時間和精力做資料標註,而這類工作又是普通的標註師無法勝任的,通常需要請醫生或醫學院的學生來做,結果就是成本居高不下,這些專業人員的成本是普通標註員的10倍。
像劉夢緣之前那樣手把手教人工智慧學習的方式,被稱為「有監督」的機器學習。但當人工智慧被逐漸成熟,它自身的識別能力與模型擬合準確度將不斷提高,進入人機協作模式。直至人工智慧會在模型的注準確度與效率上完全超過人類,此時它便要離開人工標註,進入無監督機器學習。
理論上說,每乙個垂直場景隨著技術發展,人工智慧都有可能進入無監督學習狀態。ai的核心在於**,ai的下乙個變革是無監督學習、常識學習。也就是說,「老師」們正在努力讓 ai 不依賴人類訓練,自己去觀察世界是如何運轉的,並學會**,最終ai要甩掉「老師」。
但劉夢緣並沒有很強的危機感:「我帶領我們的人在做一件最有意義的事,在將每乙個個體的智慧型轉化為 ai。我能保證,如果未來www.cppcns.com ai 取代人類,他們也會是最後一批被取代的。」
為什麼是最後一程式設計客棧批?「因為總會有乙個新的行業需要引入 ai ,需要我們(標註師)為他們來做資料準備。」
劉夢緣一直認為:「最大的一塊市場是審核」。隨著 ai 技術的發展,早年一些基本的標註工作正被逐漸被淘汰。以自動駕駛模型為例:以前靠人工來識別車、行人,如今則是由機器先標出來,然後人再去檢查標註是否正確。
她考慮過自己的職業規劃:「非常想進大廠,可是簡歷不夠漂亮,門檻都邁不進去」。
網際網路大廠對於資料的重視,最直接的反應就是薪資,尤其是管理崗,優厚的薪資福利讓很多人都羨慕不已,劉夢緣也是其中一員。除此之外,她還考慮過自己單幹去開個小公司,然後以被收購的方式進入大廠的管理體系。
「不過,那都是非常遙遠的未來,還是抓緊現在吧。」如今,劉夢緣已經公升級為公司主管,名片上的職位是資料總監。她也不再像剛入職時那樣累了,「每天工作結束,累得不行,還要在內部對比誰今天完成的任務多。」
在科技急速發展的年代,各類人工智慧的應用如雨後春筍一般閃現,隨之而來的是職場的多變。劉夢緣現在能依靠的,就是自己在「教學」生涯中的經驗,至於那些新入行的標註師們,他們剛踏上了人工智慧的列車,卻已經駛向乙個模糊的未來。
本文位址:
人工智慧資料標註平台推薦
在做推薦之前,先做個簡單的自我介紹吧。本人是一家小公司的產品,公司之前一直是做金融業務的,從去年開始決定做人工智慧 金融的智慧型金融解決方案,而我就是主要負責這一部分的產品。既然決定開始做ai,為了提公升演算法模型的識別準確率,肯定少不了和資料打交道。由於公司規模較小,預算也不高,所以我們初期嘗試了...
人工智慧 智慧型安防 資料採集與資料標註
智慧型安防是人工智慧與資訊科技結合的關鍵領域,對於城市與民生發展有重要的意義。通過生物識別 行為監測等技術手段,廣泛地應用於城市道路監控 車輛 監測 公共安全防範等領域。智慧型安防資料採集與標註,為智慧型安防等研發企業提供所需演算法訓練場景的資料採集與標註服務,覆蓋智慧型安防主流應用場景,自建標註基...
有了人工智慧,還要大資料麼?
人工智慧 ai 和先進的機器學習技術是被廣泛關注的新興技術,將在企業甚至整個行業中掀起革命浪潮。它們能夠大幅度降低勞動力成本,產生意想不到的新見解,從原始資料中發現新模式,並建立 模型。gartner在2017年度10大戰略技術發展趨勢中陳述了上述觀點,其實無需gartner ai能夠帶來的對人類社...