1、學習資料分析有什麼意義?
有乙個很典型的例子我跟大家分享一下。
某次戰爭,某個國家針對飛回來戰機上的彈孔進行分析。有人建議,把飛機上彈孔多的地方進行加固,因為容易被擊中。而有人認為,應該加固彈孔少的地方,因為彈孔少的地方飛機都沒有飛回來。
所以資料分析的意義,讓你透過現象,看到本質。
2、什麼是描述統計分析?
用關鍵資料描述資料集的整體情況
平均值:在一組資料中所有資料之和再除以這組資料的個數,表示一組資料集中趨勢的量數。
缺點:如果有乙個值離散程度較大,可能導致整體差異較大。
四分位數:第一四分位數 (q1),又稱「較小四分位數」,等於該樣本中所有數值由小到大排列後第25%的數字。
第二四分位數 (q2),又稱「中位數」,等於該樣本中所有數值由小到大排列後第50%的數字。
第三四分位數 (q3),又稱「較大四分位數」,等於該樣本中所有數值由小到大排列後第75%的數字。
作用:分析資料的整體分布情況;識別異常值
標準差:分析資料的離散程度(穩定性);根據穩定性分析風險。
缺點:如果兩組資料差距特別大無法比較。
標準分:距離平均值有多少個標準差。
應用:6 σ質量管理
變異係數:標準差除以平均數。彌補標準差缺點無法比較兩個資料差距特別大的資料集。
第一關 分析背景
經濟economy:隨著國內經濟的穩定增長,2023年我國城鎮居民可支配收入增長到31195元, 同期農村居民可支配收入增長到11422元。不斷提高的人均可支配收入將提公升家庭的消費意願,2023年中國母嬰行業市場規模有望達到2萬億。
社會society:對於一線城市居民來說,隨時隨地通過手機、電腦等電子網路裝置足不出門即可完成購物的新型消費方式更能適應他們緊湊的生活節奏;而對於二三線城市以及農村居民,物流上門配送帶來的便捷也使得網購更具吸引力。
第二關 理解資料
兩個表中有哪些資料?
你想從該資料集中得到哪些描述統計資訊?
表一購買商品
表二嬰兒資訊
想獲得的描述統計資訊
購買數量的平均值,眾數,四分位數,標準差;
寶寶年齡的平均值,眾數,四分位數,標準差;
從該資料集中分析哪些業務問題?
1.不同性別嬰兒的數量佔比?字段選擇:性別
2.商品的受眾是多大年齡的嬰兒?字段選擇:生日,購買時間
3.商品總銷售量是多少?字段選擇:購買數量
4.不同類別商品的銷售數量?字段選擇:二級分類,購買數量
5.使用者什麼時間喜歡下單?字段選擇:購買時間,購買數量
6.不同性別的嬰兒購買偏好?字段選擇:使用者id,性別,購買數量,二級分類
等等......
求vector中的資料之和與平均值
向量 vector 是乙個封裝了動態大小陣列的順序容器 sequence container 在c 中vector應用較多,那如何求取vector中資料的和與均值呢?當然,我們可以利用最直接的迴圈來做 即利用vector.size 但是有沒有簡單方法呢,答案是肯定的。可利用如下函式進行處理,舉乙個簡...
兩組資料的偏差率 考試資料分析六大指標
因為工作的關係,我經常會接觸各類學校的考試資料,很多學校在每次大考後,都會基於大考的資料做一些分析,這其中平均分是眾多學校描述考試資料中最常使用的乙個指標,教師們習慣運用它來衡量班級的整體情況,比較班級在年級中的排名位置,然而考試資料中僅僅運用平均分是否科學?所獲取的資訊是否全面呢?從上面的例子,我...
asp兩組字串資料比較合併相同資料
a1 sp2 20 sp1 34 a2 sp3 2 sp2 3 sp1 4 兩組字串資料,將字串中相同的資料值相加後得到新的一組資料 即 sp3 2 sp2 23 sp1 38 p.s 乙個簡單的應用 商品二原有數量20件,商品一原有數量34件,新進貨或者新 了商品二3件,商品一4件等型別模擬情況下...