資料分析概述和理論基礎

2021-08-18 21:44:39 字數 1889 閱讀 2829

什麼是資料分析?

資料分析:是指用適當的統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論,而對資料加以詳細研究和概括總結的過程。

為什麼會有資料分析?

隨著計算機技術、網際網路技術、資料庫技術等科技的高速發展,人們產生資料、獲取資料、儲存資料變得越來越容易,而這些資料裡也隱含著人們在生產生活中的一些規律。

資料分析就是為了從資料中發現這些規律性的資訊,幫助企業/個人**未來的趨勢和行為,做出具有針對的決策,從而使得商務和生產活動具有前瞻性。

"二十四節氣歌、朝霞不出門,晚霞行千里...." 對於一些簡單的自然現象,我們的老祖先們通過歸納提取得出很多經驗知識,但是現代人類世界中有太多的複雜問題,資料量極大,已經遠遠超出了人腦可處理的範圍。怎麼辦?

資料分析是 數學與電腦科學 相結合的產物,在實用應用中,人們可以人們通過計算機工具和數學知識處理資料,得出結果作出判斷,以便採取適當行動,

課外閱讀:資料分析真實故事

啤酒與尿布

有乙個叫薩姆 沃爾頓的人,大家應該都知道吧?如果不知道,那麼沃爾瑪,應該知道。是薩姆 沃爾頓將乙個百貨商店奇蹟般地經營為全球最大的連鎖零售企業。早在2023年10月就被《富比士》雜誌列為全美富豪排行榜首位,連美國**布希都讚揚他是地道的美國人,展現了企業創新精神,是美國夢的縮影…

2023年,當一般零售商還在進行資訊化建設的時候,沃爾瑪已經開始與休斯公司合作,花費了2400萬美元發**一顆人造文星,此後先後投入6億多美元建立起電腦與衛星系統,還發明了條形碼、無線掃瞄槍、計算機跟蹤存貨等技術。借助於整套的高科技資訊網路,沃爾瑪的各部門溝通、各業務流程可迅速、準確的執行,資料庫系統很快積累了海量的經營資料,包括大量的顧客消費行為記錄。

一年一度的聖誕節就要到了,沃爾瑪的工作人員按照慣例籌備節日的營銷策略。這一次它們使用了一種新的『購物籃分析』的軟體,對海量的顧客消費行為進行分析,乙個意外的發現讓人們瞠目結舌,跟尿布一起購買最多的商品竟然是啤酒!

緊接著,沃爾瑪派出市場調查人員和分析師對這一結果進行了深入研究,證實了它揭示了一條隱藏的在『啤酒與尿布』背後的美國人的一種行為模式:一些年齡在2535歲的年輕父親下班後經常要到超市去買嬰兒買尿布,而他們中由30%40%的人會順手為自己購買幾瓶啤酒。

此後,沃爾瑪馬上採取行動,將賣場內原來相隔很遠的婦嬰用品與酒類飲料區的空間距離拉近,使顧客更加方便。然後對本地區新生育家庭的消費能力進行了調查,對這兩個產品的**也做出了調整,並向一次購買達到一定金額的顧客贈送嬰兒奶嘴以及其他小禮品,結果是尿布與啤酒的銷量雙雙大增。

出奇制勝

2023年世界盃上,阿根廷和德國在1/4決賽中120分鐘難分高下,在點球大戰開始之前,老門將卡恩將一張紙條遞到萊曼手中。萊曼每次撲點球之前都要看一眼紙條。結果是,萊曼所有點球都判斷對了方向,除了兩個點球質量太高無力回天外,其餘全部撲出,阿根廷只能黯然出局。

問題是,那張紙條上究竟寫了什麼?

上面記錄著阿根廷隊的克魯茲、阿亞拉、羅德里格斯以及坎比亞索習慣的腳法。德國隊守門員教練科普克如此精確的**出阿根廷球員射出的點球方向,並不是他有什麼過人的占卜天才。那張草草的撲點球秘籍來自於德國科隆體育學院資料分析小組夜以繼日的努力。

分析小組收集了阿根廷球隊13000個點球的錄影,所有這些採集回來的點球資料被錄入資料庫中,並根據阿根廷射門練習的資料找出了一些可以描述射門動作的行為特徵,比如「阿亞拉,短助跑,右下角;里克爾梅,斜上助跑,右下角;馬克西,長距離助跑,左上角;坎比亞索,長距離助跑,右側;索林,短助跑,右下角,特維斯,短助跑,中路…….」

這些行為特徵描述了阿根廷堆誰伐點球、怎麼罰點球的規律。最終從這些特徵中提煉出很少的更具體的特徵。正是這張紙條把大力神盃交到了德國隊手中。小紙條上總結的這些規律就是資料探勘與分析的結果。

資料分析 資料分析概述

了解業務 了解資料 確認業務和資料 預期分析和管理 資料分析方式01.了解資料資料 1.測量標度型別 屬性本源並不是數字或者符號,通過測量標度將數值或者符號和物件的屬性建立關聯。屬性的型別 測量尺度 nominal 標稱 等於或者不等於 一對一的變換 ordinal 序數 大於或者小於 單調函式的變...

大資料理論基礎

python基礎 linux ubuntu 作業系統基礎 volume 大量 資料的大小決定所考慮的資料的價值和潛在的資訊 velocity 高速 指獲得資料的速度 variety 多樣 指資料型別的多樣性 value 價值 合理運用大資料,以低成本創造 值 veracity 真實性 資料的質量 1...

資料分析概述

對於資料分析,我相信每個使用了資訊系統的企業,都有自己的理解。他們有些來自書本,有些來自於工作經驗,有些來自於軟體 貨。但就我所了解的企業與資訊系統,他們對於資料包表的定義 對資料分析的一些基本的理解不盡相同。有一部分是真正的理解差異,可是有部分是由於各自的名詞不同而引起的。另外,我認為資料分析的真...