今天聽了乙個資料分析的培訓:資料的深度與假象。也沒有聽太懂,總結幾個點分享下:
1. 資料的含義只有和人的行為聯絡起來才有意義;比如蘋果手機的銷量,是因為其主流使用者的想法導致的;
2. 簡單的,脫離人性的擬合**是不靠譜的,舉例,三星的手機銷量一直直線上公升,但**它明年也會上公升不太合理;
3. 對人群分類進行分析是正確分析的前提,分類的標準包括學歷水平,年齡,收入等;不加區別的統計分析,難以得出有意義的結論;推廣到其他維度(非人)也一樣;
4. 對產品使用者的穩定性的分析可以有效**乙個產品,乙個行業的命運;(不懂)
5. 有效的資料分析需要跨行業的知識積累,比如心理學,公共衛生學,營銷學。(再次不懂)
6. 很多錯誤的分析是基於錯誤的計算,比如統計局統計房價的變化。如果不考慮不同區域房屋面積的佔比,即使4環,5環,6環的房子分別**10%,總體均價仍然可能是下降的;
8. 大資料未必能解決所有的資料分析問題,因為大資料帶來noise和髒資料,好的抽樣能提高效率;
9. 目前大多數公司基於已有的資料做挖掘,各個公司是互相隔離的,難以形成乙個完整的人性特徵,也就難以正確的劃分乙個人,也就不能正確的分析;
10. 資料分析的4個層次:
a) 行為
b) 行為關聯
c) 關聯規律;(難)
d) 人的生活形態;(很難)
講了很多,思路比較散,大家湊合看吧。
大資料簡介與大資料分析
大資料 是乙個體量特別大,資料類別特別大的資料集,並且這樣的資料集無法用傳統資料庫工具對其內容進行抓取 管理和處理。大資料 首先是指資料體量 volumes 大,指代大型資料集,一般在10tb?規模左右,但在實際應用中,很多企業使用者把多個資料集放在一起,已經形成了pb級的資料量 其次是指資料類別 ...
大資料分析技術與應用
cda資料分析研究院原創作品 一 大資料概念 大資料 big data 指無法在一定時間範圍內用常規軟體工具進行捕捉 管理和處理的資料集合,是需要新處理模式才能具有更強的決策力 洞察發現力和流程優化能力的海量 高增長率和多樣化的資訊資產。二 大資料的特點 1 volume 大量 截至目前,人類生產的...
大資料分析工具
新 指數 清博大資料 新 指數 www.gsdata.cn 是新 大資料第一平台,為運營新 利器 現已開通賬號分鐘級監測服務,打擊粉絲造假賬號,支援使用者自主監測新 資料 定製各類榜單,並提供資料api等各類增值服務。資料視覺化工具 cytoscape 圖表秀 資料觀 微博足跡視覺化 bdp個人版 ...