怎麼解決資料屏障？楊強教授提出聯邦遷移學習

2021-09-20 05:04:36 字數 804 閱讀 6405

2018中國人工智慧大會今天28日在深圳舉行。會上，國際人工智慧聯合會（ijcai）主席、aaai/acm/ieee fellow、香港科技大學教授楊強發表了題為《ai面臨的挑戰和遷移學習所帶來的機遇》的演講，談到了ai發展遇到的大資料的困境以及解決辦法。

楊強表示，我們正處於大資料驅動的ai時代，人們將工作數位化，然後通過人工智慧自動化，從而提高效率。但是，現在我們越來越多的遇到了資料的困擾，很多企業的資料都是孤島沒有辦法打通，同時受制於歐盟gdpr等法案的制約，增大了這種困境。

楊強教授具體講解了大資料面臨的兩大困境。

一大困境是面臨隱私、安全和監督。以歐盟的gdpr為例，gdpr明文規定了使用者的「被遺忘權」，對使用自動化模型決策全面禁止，這對機器學習有重大影響，因為讓使用者同意使用並不容易，使用自主決策合法要滿足三點，包括合同處理的必要性、其他法律另行授權，資料主體明確同意。

在資料隱私的監管的大趨勢下，解決這一問題並不容易。楊強教授提出了聯邦遷移學習思路，這種思路希望建立起機器學習的企業生態，各個企業自有資料不出本地，模型效果不變，在不違規的情況下建立乙個虛擬模型。楊強教授表示，利用聯邦遷移學習加密技術，協同建模，學習模型過程不交換使用者數，不侵犯隱私。

另一大困境是小資料的困境，楊強教授提出了遷移學習，並列舉了跨領域輿情分析的案例。

楊強最後表示，面對資料發展的困擾，希望利用聯邦遷移學習技術建立聯合建模解決方案，克服資料障礙。在法律規範的基礎上，各個參與方理解一致的共識機制，保障安全合規性。比如在金融領域，可以建立金融業聯邦遷移學習聯盟。

怎麼解決資料傾斜問題？

本文面向的讀者是從事資料分析資料處理 etl 等相關工作的朋友們，相信大家在工作中一定遇到過資料傾斜的問題，讀完本文，你會了解到資料傾斜的定義及其危害產生的原因及應對措施常見傾斜場景及解決辦法等知識，相信對你今後處理資料傾斜問題會有一定的幫助。目前流行的大資料相關的計算框架之所以能夠處理大量的...

什麼是資料傾斜，怎麼解決資料傾斜？

相信很多接觸mapreduce的朋友對資料傾斜這四個字並不陌生，那麼究竟什麼是資料傾斜？又改怎樣解決這種該死的情況呢？何為資料傾斜？正常的資料分布理論上都是傾斜的，就是我們所說的2 8原理 80 的財富集中在20 的人手中，80 的使用者只使用20 的功能，20 的使用者貢獻了80 的訪問量，不...

資料溢位怎麼解決大資料輿情監測怎麼做的解決方案

對於不了解輿情大資料的，可能不太清楚輿情大資料是什麼意思？甚至可能不知道大資料輿情監測要怎麼做？而對於還沒運用大資料技術，還在用傳統的人工的方式監測輿情的，會有大資料輿情監測如何快速高效做好之類的疑問等。下面蟻坊軟體就重點這對這些問題來一一解答。輿情大資料其實指的是網際網路上海量的網路輿情資料資訊...