大資料能做什麼?

2021-08-08 23:02:51 字數 1915 閱讀 9519

**:

什麼是大資料?

大資料是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。

新處理模式具有兩層含義:1、由於海量資料,需要更高效的儲存和處理技術,hadoop。2、大資料明顯標誌是資料探勘和人工智慧的緊密結合。資料統計只是對已有的資料進行縱向歸類,大資料是基於已有的資料,對未產生的資料進行**和推薦。

**和推薦是如何實現的?

目前的推薦推薦演算法可以分為兩類,乙個是基於行為,乙個是基於內容的。1、基於行為的分析,即使用者在網際網路、移動網際網路留下的「」痕跡「」,得出未來會選擇購買的**和推薦結果。基於行為的分析,屬於群體智慧型,綜合利用群體使用者行為偏好/  2、基於內容的分析,包括對文字、、音訊等資訊的分析,得出**和推薦的結論。

大資料到底能做什麼?

科技的進步讓人變得更懶,也就是我們自身的處理能力降低,無論是主觀的還是客觀的。而可被選擇的物件卻在日益增多。從紛繁複雜的商品(電商),到海量曲庫中的樂曲;從婚戀**的男女朋友,到交通管理的訊號燈。

基於人工智慧下的大資料,就是可以使人們「變懶」的乙個手段。基於你的歷史行為,判斷出你可能的喜好,乃至需求,將最佳結果,推薦給你。這就是大資料,她是你的貼心管家,或者說是最懂你的朋友。

乙個最經典的案例是沃爾瑪曾經做過的「啤酒」和「尿布」調研:沃爾瑪在研究中發現,一類顧客經常在購買尿布的同時也購買啤酒。尿布跟啤酒自然是毫無關聯的兩個品類的商品,從個人經驗上來看,根本想不到二者的聯絡。後來發現,這是一類社會現象所導致的。美國有很多年輕夫婦,尿布用完後,女主人在家帶孩子,而男主人就去超市買尿布。買完尿布之後,男主人通常會順帶著買些啤酒。

上述例子說明,資料經常可以讓你發現看似不合理不合邏輯但卻存在,並且經常發生的現象。

再舉個例子,北京的交通擁堵是地球人都知道的事情。尤其是早晚高峰,這已經不需要**了。但如果根據歷史交通資料,再經過數學模型,計算出乙個全北京最佳的交通訊號燈管理系統,這就屬於大資料的範疇了。

大資料不是萬能的

不要以為是海量資料就一定會有價值,在過往的工作中,我們經常發現來自甲方的資料來源有80-90%的資料都是無用的。只有10%-20%的資料才會產生一定的價值。這就又讓我想到marry meeker打的那個比喻,「大資料的工作就像在一堆稻草中尋找一根針」。

何況,大多數領域本身業務屬於早期,所擁有的資料非常貧乏。冷啟動、稀疏性是大資料在諸多領域面臨的挑戰。

另一方面,對於不同領域,不同專案,沒有放之四海而皆準的演算法,必須要根據具體問題具體分析解決。在實際的工作中發現,不只是不同的領域(如文章推薦與商品推薦),甚至同一領域的不同單元(同屬電商但不同類電商,如母嬰類和服裝類或者奢侈品類)也有所不同。

資料的交叉利用

上面提到的兩個大資料在實際應用中面臨的最大問題,即冷啟動時資料的匱乏和業務早期資料的稀疏性問題,並不是無藥可救。業界一直討論的資料打通,就是解決這兩問題的出路。

對於一些新興領域,缺乏資料是必然的,而另一方面,正由於缺乏資料的支援,所以才更需要有強大決策支援的系統對其業務做指導和支撐,以實現少走彎路,利益最大化的目的。

移動網際網路領域的專案,尤為代表。雖然在過去的兩三年裡,移動網際網路得到了高速的發展,但畢竟在各個方面的積累,都無法與網際網路相比。尤其在人們形成穩定的使用習慣之前,資料還不具備更多的價值和意義。

但如果能把網際網路的資料與移動網際網路資料打通,那麼我們就掌握了這個人的喜好等多方面資訊,從而為移動網際網路業務做出更有效的指導和幫助。

當然,資料的打通絕不僅限於網際網路和移動網際網路。每個資料來源的資料往往刻畫了乙個人的不同方面。正如巴拉巴西教授在《爆發》一書中描繪的那樣,如果資料充分,人類93%的行為是可以預知的,是有規律的。

也只有將這些不同**的資料重新組織,才能挖掘出更有意義的資訊。

大資料能做什麼

技術角度的大資料。原始出處 作者資訊和本宣告。否則將追究法律責任。hadoop和大資料是這兩年最火的詞兒們之一,越來越多的公司對這個東西感興趣,但是我接觸到的大多數公司裡的人,無論是技術人員還是老闆。都不知道怎麼能把這些東西用於改善自己公司的業務。在解答的過程中,提煉出幾個要點,記錄一下。大資料和雲...

大資料能做什麼

hadoop和大資料是這兩年最火的詞兒們之一,越來越多的公司對這個東西感興趣,但是我接觸到的大多數公司裡的人,無論是技術人員還是老闆。都不知道怎麼能把這些東西用於改善自己公司的業務。在解答的過程中,提煉出幾個要點,記錄一下。大資料和雲是不是一回事?這是最容易混淆的概念之一,我個人認為這是兩回事,雲服...

大資料能做什麼

hadoop和大資料是這兩年最火的詞兒們之一,越來越多的公司對這個東西感興趣,但是我接觸到的大多數公司裡的人,無論是技術人員還是老闆。都不知道怎麼能把這些東西用於改善自己公司的業務。在解答的過程中,提煉出幾個要點,記錄一下。大資料和雲是不是一回事?這是最容易混淆的概念之一,我個人認為這是兩回事,雲服...