**分析中專業的工具除了google analytics,adobe sitecatalyst,webtrends,騰訊分析和百度統計等外,我想最常用的資料處理工具就是excel了,excel裡頭最基礎的就是運算和圖表的製作,稍微高階一點就是函式和資料透視表的使用了,當然你可能還會想到vba和巨集,但估計很少高手會使用這些高階的功能。
那對於高階的資料分析而言,也就是涉及統計學的專業分析方法和原理的時候,是不是就一定得求助於spss,sas這類專業的分析工具呢?資料分析從低階到高階層次的跳躍過程中有沒有可以起承接作用的工具呢?其實是有的,這就是excel的資料分析功能。貌似最近比較火的兩本excel書籍《誰說菜鳥不會資料分析》和《讓excel飛程式設計客棧》都沒有涉及這部分的內容。高階的資料分析會涉及回歸分析、方差分析和t檢驗等方法,不要看這些內容貌似跟日常工作毫無關係,其實往高處走,mba的課程也是包含這些內容的,所以早學晚學都得學,乾脆就提前了解吧,請檢視以下內容。
在使用之前,首先得安裝excel的資料分析功能,預設情況下,excel是沒有安裝這個擴充套件功能的,安裝如下所示:
1)滑鼠懸浮在office按鈕上,然後點選【excel選項】:
2)找到【載入項】,在管理板塊選擇【excel載入項】,然後點選【轉到】:
3)選擇【分析工具庫】,點選【確定】:
4)安裝完後,就可以【資料】板塊看到【資料分析】功能,如下所示:
安裝完後,首先來了解一下回歸分析的內容。
一、回歸分析
在詳細進行回歸分析之前,首先要理解什麼叫回歸?實際上,回歸這種現象www.cppcns.com最早由英國生物統計學家高爾頓在研究父母親和子女的遺傳特性時所發現的 一種有趣的現象:身高這種遺傳特性表現出」高個子父母,其後代身高也高於平均身高;但不見得比其父母更高,到一定程度後會往平均身高方向發生』回歸』」。 這種效應被稱為」趨中回歸」。現在的回歸分析則多半指源於高爾頓工作的那樣一整套建立變數間的數量關係模型的方法和程式。 這裡的自變數是父母的身高,因變數是子女的身高。
百度百科對於回歸分析的定義是: 回歸分析(regression analysis)是確定兩種或兩種以上變數間相互程式設計客棧依賴的定量關係的一種統計分析方法。運用十分廣泛:
1)回歸分析按照涉及的自變數的多少,可分為一元回歸分析和多元回歸分析;
2)按照自變數和因變數之間的關係型別,可分為線性回歸分析和非線性回歸分析。
這裡舉個電商的例子:電子商務的轉換率是一定的,**訪問數一般正比對應於銷售收入,現在要建立不同訪問數情況下對應銷售的標準曲線,用來**搞活動時的銷售收入,如下所示:
1. 首先,利用散點圖描繪圖形:
2. 新增趨勢線,並且顯示回歸分析的公式和r平方值:
從圖得知,r平方值=0.9995,趨勢線趨同於一條直線,公式是:y=0.01028x-27.424
r 平方值是介於 0 和 1 之間的數字,當趨勢線的 r 平方值為 1 或者接近 1 時,趨勢線最可靠。因為r2 》0.99,所以這是乙個線性特徵非常明顯的數值,說明擬合直線能夠以大於99.99%地解釋、涵蓋了實際資料,具有很好的一般性, 能夠起到很好的**作用。
3. 使用excel的資料分析功能
1)點選【資料分析】,在彈出的選擇框中選擇【回歸】,然後點選【確定】:
2)【x值輸入區域】選擇訪問數的單元格,【y值輸入區域】選擇銷售額的單元格,同時勾選如下所示的選項,包括殘差、標準殘差、殘差圖、線性擬合圖和正態概率圖。
3)以下內容是殘差和標準殘差:
4)以下是殘差圖:
殘差圖是有關於實際值與**值之間差距的圖表,如果殘差圖中的散點在中軸上下兩側分布,那麼擬合直線就是合理的,說明**有時多些,有時少些,總體來說是符合趨勢的,但如果都在上側或者下側就不行了,這樣有傾向性,需要重新處理。
5)以下是線性擬合圖
**性擬合圖中可以看到,除了實際的資料點,還有經過擬和處理的**資料點,這些引數在以上的**中也有顯示。
6)以下是正態概率圖
正態概率圖一般用於檢查一組資料是否服從正態分佈,是實際數值和正態分佈資料rvtvnnqy之間的函式關係散點圖,如果這組數值服從正態分佈,正態概率圖將是一條直線。回歸分析不一定得符合正態分佈,這裡只是僅僅把它描繪出來而已。
以上資料**和圖表都說明公式y=0.01028x-27.424是乙個值得信賴的**曲線,假設搞活動時流量有50萬訪問數的話,那麼**銷售將是51373,如下圖所示:
本文標題: excel中的高階資料分析(一)
本文位址: /news/exp/47304.html
Excel中的高階資料分析(二)
上篇博文已經介紹了如何安裝excel的高階資料分析功能,並且介紹了回歸分析,說實話篇幅有點長,主要是安裝那塊截圖比較多 這篇主要介紹一下描述統計 抽樣分析和直方圖。一 描述統計 中位數 眾數 資料分布區間可能還比較容www.cppcns.com易可以算出,但是標準差和方差等的計算就比較麻煩了,這些都...
Excel資料分析
資料分析主要有以下五個步驟 1 提出問題 2 理解資料 3 資料清洗 4 構建模型 5 資料視覺化 一 提出問題 為了更好了解上海二手房市場,提出以下幾個問題 1 上海房價均價如何 2 哪些地區提供 量較多 3 戶型分布如何 二 理解資料 本次練習選取的資料為上海二手房資訊,於網上,共9個字段,總計...
資料分析高階之路(一)
好久沒寫部落格,最近在朝資料分析師方面發展。本篇要講bi報表的製作。bi business intelligence 即商務智慧型,它是一套完整的解決方案,用來將企業中現有的資料進行有效的整合,快速準確地提供報表並提出決策依據,幫助企業做出明智的業務經營決策。分為傳統型bi 偏報表開發 和自助型bi...