進入大資料時代後,資料統計、分析被視作兼具「前景」和「錢景」的行業。一時間,擅長發布各種資料的機構和單位如雨後春筍般層出不窮。可是,大資料真的那麼可信嗎?
之所以有這麼一問,是因為近期連續遇到幾起資料「烏龍」事件。例如,某網路平台發布報告稱,平安、民生、廣發、天津等4家銀行在上海停止發放房貸,停貸銀行佔按揭銀行總數的13.33%。可真相是工、農、中、建、交五大行約佔上海所有銀行網點的六成,這些網點都正常接受房貸申請;而天津銀行在上海的網點總共才7個,其他3家所謂停貸的銀行也是從年初起就調整經營戰略、壓縮房貸業務。從這些基本的情況不難推斷出,13.33%的停貸比例是站不住腳的。還有乙個資料是今年「雙十一」過後第二天,某網際網路機構稱「雙十一」退貨率已達25%。然而,當時大多數**還沒開始發貨,消費者又怎麼可能退貨呢?
大資料時代,搶著挖掘金礦的企業和機構越來越多,應聲而動的商業敏感自然值得讚賞。但對他們提供的資料乃至一些所謂完整的調查報告,則需要謹慎分析。
一方面,那些資料發布方是否嚴格按照統計學的原則進行調查研究依舊值得商榷。據筆者了解,資料統計和分析行業內的企業和機構多如牛毛,規模大小不一,水平參差不齊。有些調查機構為了盡快完成資料收集和調查報告,不惜違背隨機、客觀採集樣本的根本原則,通過花錢買樣本的方式進行資料收集。根據這些資料得到的報告,顯然與事實有很大的誤差。
另一方面,很多資料發布方的立場也值得商榷。絕大多數發布方都標榜自己中立第三方的身份,可不要忘了,發布的根本目的是用資料換金錢。所以實際運作時不可避免地會牽扯各種商業利益,從而可能影響資料的準確性。更有些不靠譜的發布者,則把資料變成商戰中的**,或者以發布聳人聽聞的資料來擴大自身影響。
與其他評價方式和表述手段相比,資料無疑最直觀。也正因為此,社會對資料的真實準確性抱有很高的期待。大資料時代需要我們拿出更加謹慎的態度,對資料的收集、統計以及發布者立場多問幾遍「準確嗎」,而不是一味貪圖資料的簡明扼要。只有這樣,才能從浩瀚的資料海洋中找出真正有價值的部分。
bingdata優網助幫匯聚多平台採集的海量資料,通過大資料技術的分析及**能力為企業提供智慧型化的資料分析、運營優化、投放決策、精準營銷、競品分析等整合營銷服務。
大資料之大資料時代
下面,開啟第一講 大資料之大資料時代 講大資料一定脫離不開乙個大的背景。下面先從大資料背景講起。縱觀整個it發展史,也不過短短幾十年,在這幾十年裡,我們這個資訊化社會經歷了三次大的資訊化浪潮。第一次浪潮是在上個世紀90年代前,1980年前後,pc機進入市場,ibm公司制定了全球的pc標準,即一台電腦...
大資料時代
大資料 巨量資料 big data 指的是需要新處理模式才能具有更強的決策力,洞察力和流程優化能力的海量 高增長率和多樣化的資訊資產。4v特點 volume 大量 velocity 高速 variety 多樣 value 價值 資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。...
大資料時代
不斷的從 發現這個很具廣告特色的語句,他們總是鼓吹大資料時代的來臨,好像如果你沒抓住他,你就要立馬落後別人好幾條馬路。各種公司企業對他們的產品也宣稱產品是大資料時代不可或缺的科技 乙個錢學森相當於10個王牌師。國內到處充斥著浮躁,不管是大學還是業界,大家都想賺點錢一夜暴富然後過上高富帥的生活。大資料...