為什麼要了解統計?也即統計在生活中是怎樣被應用的?
我把它的應用主要分為兩類,即描述統計和推斷統計兩部分,來舉例幫助理解。
乙個是描述統計的應用。比如**報道的資料,有人口普查的基礎資料(如各省人數、性別比、家庭中孩子的數量等),可能呈現出的只是一些數字,像是省人口最高值就是乙個最大值,而「絕大多數家庭中孩子數量是1個」就是乙個眾數(出現最多次的數)。也有需要以圖表形式展示出來的資料,如人均年收入的逐年變化就是乙個時間序列資料。
那麼這些數字是什麼意義?給我們的參考價值有多大?比如我得知a行業職員年收入的中位數,那麼我自己就能拿到這個數字的薪酬嗎?
二是推斷統計的過程每天都在身邊上演著。在超市付款結賬時,選擇哪乙個櫃檯去排隊?要考慮到已有人數、收銀員手速、購物數量等變數,在心理給各個變數賦權,生成乙個線性回歸方程,然後估算出最優解,立馬跑過去,這都在短短幾秒鐘內無意識地完成了。比如恰逢學校公布月考成績,驚聞有乙個全科滿分的卷子,那麼這個卷子是我的可能性有多大?這時我就在心裡默默計算,已知我的平均成績是360,而標準差大概是20,看來不太有可能是我。再比如「每天吃1個蘋果平均壽命可以多1天」,就是對數值型資料間的關係做出的推斷。
那麼如何做出推斷?估計的精度如何呢?多吃1個蘋果的作用有那麼大嗎?
可以說理解了統計,變可以自己開始慢慢思考這些問題的答案,也在思考輸入和輸出的數字資訊。也幫助我們分辨那些為了迎合自己內心預設的「結論」而從資料上尋找支援的投機取巧者,資料分析的目的是尊重並探尋資料本身的規律。
所以,統計一半幫助我們輸入,去理解去讀懂每天發生的數字諮詢,一半是幫助我們輸出,去決策去判斷已經發生的事是什麼情況,沒有發生的事又有什麼樣的可能。我將統計理解為建立在資料上的對世界的另乙個角度的感知。
什麼是統計學?
什麼是描述統計、推斷統計?二者的區別與聯絡是(或通過什麼聯絡)?什麼是總體?有哪幾類?總體中的個體需要滿足什麼性質(3個)?
什麼是樣本及樣本量?什麼是引數?統計量?變數?變數可怎樣分類?
資料型別可以按什麼角度分類(3個)?都包括什麼?可否舉例?資料**有哪些(2個)?怎樣評估資料?
調查資料可以如何分類?各包括哪些抽樣方法?各自的優劣是什麼?什麼是實驗資料?什麼是對照組與實驗組?
什麼是抽樣誤差?有什麼特點(和樣本量的關係)?存在於哪些抽樣過程?什麼是非抽樣誤差?存在於哪些抽樣過程?包括哪些方面的誤差?
問題解答可見《【統計】問題解答:學科概念、資料收集篇》
p.s. 關於統計學,要系統入手去學,就要一點一點地去理解,形成框架和脈絡。
所以要特別注意概念的含義、應用,以及a和b之間有什麼樣的關係。
剛開始學習,接觸了很多關於概念的問題,但是為什麼提出這些,
或者說教科書的編寫順序為什麼是這樣,我還沒有完全搞懂,就慢慢積累吧,後面再總結。
統計機器學習 1 統計機器學習基礎
網路 演算法 機器 優化 概率 統計 資料 矩陣 資訊 模型 推理 獲知識 靠學習 we are drowning in information and starving for knowledge.john naisbitt data model knowledge mlstatistics 備註...
統計學基礎 周計畫1
資料離散程度 概念 一組資料 現次數最多的數,眾數可以是多個,也可以沒有。舉個栗子 0,0,1,1,2,3 中的眾數是0和1,0,1,2,3 中沒有眾數,0,1,2,1 中的眾數是1。概念 一組資料中,中間位置的那個數,假設n為奇數,排序之後中間的那個值就是中位數,如果n是偶數,排序之後中間兩個數的...
day 1 心理統計中常用的一些概念和統計符號
總體 指具有某些共同的 可觀測的特徵的一類事物的全體,構成總體的每乙個基本單位稱為個體 樣本 從總體中選出來的個體集合 隨機取樣 從總體中取樣本,要求總體中的每乙個個體被抽取到的概率相同,用隨機取樣抽取的樣本叫隨機樣本 描述統計 指用來整理 概括 簡化資料的統計方法,側重於描述一組資料的全貌,表達一...