1.只能根據寄有的資料來學習;不會判斷資料正確性。
深度學習可以在不理解資料的情況下模仿資料中的內容:它不會否定任何資料,不會發現社會上的偏見,而只是「學習資料」。
深度學習只相信它在資料中頻繁看到的事物、底層模式和趨勢,因此它會放大人類社會的偏見和問題。
如果資料顯示被逮捕的黑人比白人多,
那麼一旦有人犯罪,深度學習將首先懷疑黑人。資料顯示公司董事會董事中
男性比例高於女性,深度學習將在招聘中更傾向於男性應聘者。
這個缺點會導致僱傭乙個人類員工,專門建立來自理想社會的假的、公正的資料,在這裡白人與黑人被逮捕的頻率相同,董事會中50%的董事都是女性,等等。
2.無法修正學習結果,除非重新訓練。
你無法通過在訓練之後新增補丁,來修復乙個帶有偏見、種族和性別歧視的深度學習模型。深度學習是乙個神經網路,與其他人工智慧方法不同,你無法通過區域性補救來修改某個答案,而是必須使用不同的、完全平衡以及公正的、稀有的真實世界資料對該網路進行重新訓練。
3.無法解釋做出的決策。
深度學習給出的是非自然(合法)語言解釋的結果。深度學習的**容易獲得,卻很難為人類所理解接受,因為
即使最好的數學家或其他演算法也無法
搞明白它。
比如乙個銀行 審批貸款的深度學習 系統,在拒絕了客戶的貸款申請之後,而無法給出合理的解釋,那麼
被自動拒絕了貸款的使用者集體起訴銀行
的自動決策單元,將會變成常態,所以無法解釋便意味著「無以辯護」、
被罰款以及一場品牌公關災難。
4.應用市場較狹窄。
在那些決策結果會造成財政、健康的影響,或者存在歧視的領域,因為深度學習無法幫助人們理解決策是否公正以及為什麼
公正的時候,這些領域都可能遭到法院的處罰
。自動駕駛
領域或許也是有風險的。
似乎在藝術、遊戲或高階幽默以外
的領域使用深度學習都有法律風險。
目前只有影象識別、
或如何贏得很多遊戲方面
做的還不錯。
深度學習的四個部分
優化 optimization 深度學習的問題最後似乎總能變成優化問題,這個時候數值優化的方法就變得尤其重要。從實踐方面來說,現在最為推崇的方法依舊是隨機梯度遞減,這樣乙個極其簡單的方法以其強悍的穩定性深受廣大研究者的喜愛,而不同的人還會結合動量 momentum 偽牛頓方法 pseudo newt...
譯文 學習深度學習的四個步驟
可選但強烈推薦 如果不了解機器學習,可以從andrew ng在coursera上的機器學習公開課開始學習 國內的網易公開課上有andrew ng授課時的版本,相對較難一點,但更推薦 他在課程裡不僅教授了各種各樣的機器學習演算法,更重要的是,他還詳細講解了一般的機器學習研究方法,如資料預處理 調參等等...
大資料4個明顯的特徵,大資料思維四個遞進的層次
大資料4個明顯的特徵,大資料思維四個遞進的層次 大資料4個明顯的特徵 1.資料量足夠大,要大到讓統計的結果具有非常高的置信度 2.具有多維度的特徵,而且各個維度最好是正交的 3.資料的完備性,完備性使得大資料可以算無遺策 4.在一些場景下的實時性,比如堵車資訊一定時間過了資料就失去意義了 大資料思維...