鑑黃那些事

2021-07-24 15:47:38 字數 1160 閱讀 5999

from:

雲從科技高階演算法工程師周翔:

至於技術問題,其實鑑黃在演算法層面難度並不高,利用深度學習演算法訓練後,就能達到不錯的鑑黃效果。

圖普科技工程師則在計算能力和演算法要求上做了一些小補充:

至於是遮蔽、刪除或者禁播等方面的處理,主要是看業務方,可以選擇由機器自動處理或者人工介入。

雲從科技高階演算法工程師周翔:

一方面是他們不太願意做。

剛提到大批量資料用深度學習來訓練,而訓練小批量資料一般採用傳統的特徵分析加分類器演算法來做,但效果和精度沒有目前的深度學習高。

圖普科技工程師:

這與演算法能力關係不大,在演算法和工程能力都已經達到最優的情況下,這個是屬於企業的成本預算問題。

雲從科技高階演算法工程師周翔:

人類對於色情的定義較為廣泛,多種情況下對於色情的鑑定標準也會有不同。在這基礎上其實對於黃色和非黃色的區分,有時候不是特別明顯,很難判斷。舉個通俗的例子,赤裸上身的男子**(屬於膚色比例大),這種本質上屬於非黃色,但很多時候,因為訓練資料裡有類似被判定為黃色影象,存在判錯的問題。因此需要利用大量樣本去不斷地訓練它,讓機器不斷糾正,學習更多特徵避免這種「低階錯誤」。

這也正是上面提到部分 cv 公司不涉入鑑黃業務的原因,因為一直需要大量樣本去不斷訓練、糾正,工程量挺大。

圖普科技工程師:

通俗講,可以把深度學習理解為乙個空白的大腦,海量資料就是灌輸進來的經驗。當我們把大量的色情、**、正常的樣本的屬性告訴深度學習的引擎, 讓引擎不斷學習,然後把他們做對的進行獎勵,做錯的就懲罰,當然這些獎勵和懲罰都是數學上的,最後空白的腦袋就會學成了一種連線的模型,這種模型就是為了鑑別色情與非色情而生的。

遮蔽、刪除或者禁播等方面的處理,主要是看業務方,可以選擇由機器自動處理或者人工介入。

最後,鑑黃的棘手之處主要是難以掌握色情和非色情的臨界點,機器容易把正常(如男生上身半裸)誤判為色情,因此需要大量的資料不斷去訓練和糾正,是個慢熬的苦差事,這也是部分 cv 公司不涉入鑑黃業務的一大原因

華為雲與鑑黃師不得不說的那些事

相傳,在當今時代中有乙個神秘的職業 鑑黃師。他們閱片無數,能聽聲辨位並精準審核並識別出各類違規內容加以處置。但鑑黃師工作量巨大而且人力有限難免有所紕漏,那麼如何還網際網路乙個清靜之地,真正實現精準 統 一 全面的鑑別違規內容呢?華為雲的內容審核服務就可以幫助鑑黃師擺脫當下面臨的這一煩惱。那麼如何選擇...

聲音鑑黃師飽受摧殘,AI聲音鑑黃師為何沒幫上忙?

文 雷宇 智慧型相對論 aixdlun 聲音鑑黃師是乙份不足以為外人道也的工作 由於這份工作實在是太過於枯燥,很多男生都受不了,因此聲音鑑黃師多為女性且離職率高。一般枯燥且重複率高的工作都是ai的拿手好戲,那麼ai有沒有辦法實現聲音鑑黃呢?聲音鑑黃之殤,ai難以克服雞尾酒效應 這是因為社交平台的語音...

那些人,那些事

很久沒有整理一下自己的思緒,聽著熟悉的歌,那歌聲會讓我想起那些人,那些事.乙個標點,乙個符號,乙個個早已在歲月深處冰封的眼神,一段沒有伴侶的歸途。一直以來我都認為我的人生就是這樣,平平淡淡,安安靜靜,波瀾不驚地在歲月的 眼角劃過,不留絲毫痕跡。現在看來,原來我寫的東西在很大程度上是是在滿足自己的某種...