近日,「連衣裙」惹出一場來去倏忽的小風波。
微博網友「風中的廠長」表示,電商行業找女朋友有乙個「鐵律」:**好評率低於98%、滴滴好評率低於4.8、搜尋連衣裙客單價低於128元——滿足這三條的人不能找,因為「難伺候」。其中連衣裙這條讓許多人不解,他解釋道:「這個消費區間的人群,被**系統打上低價人群標籤,經過分析各種行為後,做成了大資料。」
我循著指南去**搜了一下「連衣裙」,發現系統推薦給我的都是幾千塊的。正為自己被系統定義為「有錢人」高興之餘,卻看到了**的闢謠——「壓根不存在128元這條線」。**負責演算法的小二解釋道,個性化推薦的初衷是滿足使用者多樣化和實時變動的需求。
這也許是一則烏龍訊息,但牽動了人們繃緊已久的一根神經,所以才會引起喧嘩。關於大資料,關於隱私,關於未來社會的模樣。「每個人都有自己的**」,曾經這只是乙個粗略的比喻,如今在大資料的幫助下,則可以精確到一分一厘。哪怕128元的連衣裙這條線不存在,電商**的伺服器上也一定給每個使用者都畫了一幅異常精細的數字肖像,**敏感度只是其中乙個維度。
我們本不該感到驚訝。當網際網路公司在談論人工智慧、大資料乃至毫不忌諱地談論使用者畫像的時候,圍在邊上吃瓜的人意識不到自己已淪為資料砧板上的一塊肉。
但「美麗新世界」還有另一面。2023年,「大資料殺熟」進入公眾的視野。許多網友發現,同樣的商品或服務,老客戶看到的**反而比新客戶要貴。雖然被指控的公司都發表了否認宣告,但人們紛紛以自身經歷證明傳言非虛。
**歧視是商業世界中存在已久的現象,並非所有的**歧視都是不合理的,比如便利店的礦泉水就是比超市貴,但消費者願意為了少跑腿而多花錢。不過,**歧視一旦**上大資料這個「火箭」,便會產生質變式的驚人威力,消費者也就難以淡定了。
當前的大資料是乙個一僕二主式的遊戲,資料有兩個效忠物件:乙個是網際網路公司,乙個是使用者。資料是使用者的行為產生的,理論上使用者應該對自己的資料擁有掌控權。但實際上,哪些資料被收集,資料存於何處,資料何種用途,這些關鍵問題使用者一無所知。所以就產生了「管家」取代「主人」的局面。
大資料的黑箱狀態除了造成反噬其主的憂慮,還產生資料交叉混用的風險。電商、網約車上的資料如果被用於相親,可能還真有效,比如乙個喜歡給賣家打差評的買家有很大概率在生活中是不易相處的人,但這麼做合適嗎?
資料科學家賽思·史蒂芬斯-達維多維茨在《人人都在說謊》一書中提出了類似的問題:企業是否有權根據與其提供的服務不直接相關的抽象統計學**標準來判斷人們是否可以享受其服務呢?
《人人都在說謊》書中還有乙個例子:劍橋大學和微軟的研究人員發現,臉譜網的點讚常常與智商、外向的性格和責任心相關。例如,臉譜網上喜歡莫扎特、雷雨天氣和捲曲薯條的人往往智商較高。喜歡哈雷摩托的人往往智商較低。如果有企業利用這個規律,在招聘時把「喜歡哈雷」當成排除項,顯然是不公平的。但有什麼手段能確保企業拒絕此類**呢?
現在的問題在於,大資料在技術層面突飛猛進的時候,其在倫理與合法性上的隱患卻沒有得到充分的重視與討論。我們正站在資料的懸崖上,請記住,下面不一定是世外桃源。
(作者系資深**人)
開放的另一面
每次只要一有機會,google就會宣稱他們從android的開源中獲得了巨大利益,勝過ios,這顯然不尊重事實 android在走下坡路了,從使用者體驗角度來說,這個系統真的讓人有點不爽。亞馬遜霸佔了android,並為了實現自己的目的而逐漸將其關閉,google現在面臨的問題就是亞馬遜的這些目的非...
九 矽谷的另一面
矽谷 1 無數的圖書 報紙 電視和今天的網際網路,講述著這樣乙個關於矽谷的故事 有兩 三個綴學的大學生 最好是斯坦福的 有一天在車庫裡甚至是不經意發明了乙個什麼東東,馬上來了幾個 沒頭沒腦的 風投資本家,隨手給了他們幾百萬美元。兩年後,這幾個年輕人辦起的 burnmoney.com 公司就上市了,華...
扶貧,巨頭下沉的另一面
文 科技唆麻 有些事情向上,有些事情向下。有些事情正在飽和,有些事情正在生長。今年初,騰訊企鵝智庫以寥寥數語描述了廣袤的中國市場逐漸 圈層化 的特徵,也引出了長達 205 頁的 2019 2020 中國網際網路趨勢報告 所要 的核心命題 2019 年到 2020 年,當我們期望於科技和網際網路時,我...