一 統計與資料

2021-10-17 19:03:27 字數 1293 閱讀 2391

統計學:收集、處理、分析、解釋資料並從資料中得到結論的科學

統計分析資料分為:描述統計、推斷統計

描述統計:研究資料收集、處理和描述的統計學方法

描述統計如何獲取所需資料,如何用圖形展示資料,得出所關心的資料特徵

推斷統計:研究如何利用樣本資料來推斷總體特徵的統計學方法

推斷統計內容包括引數估計和假設檢驗兩種。引數估計利用樣本資訊推斷關心的總體特徵;假設檢驗利用樣本資訊判斷對總體的某個假設是否成立

統計資料及其型別

按照資料收集方法:觀測資料、實驗資料

按照被描述的物件和時間關係:截面資料、時間序列資料

一、分類資料、順序資料、數值型資料

1、分類資料:只能歸類於某一類別的非數字型資料【 』男『,』女『】

2、順序資料:只能歸類於某一有序型別的非數字型資料【』優『,』良『,』中『,』差『】

3、數值型資料:按數字尺度測量的觀測值

分類資料、順序資料=>定性資料|品質資料

數值型資料 =>定量資料|數量資料

二、截面資料和時間序列資料

截面資料:在相同或近似相同的時間點上收集的資料【描述的是現象在某一時刻的變化情況】

時間序列資料:在不同時間點上收集到的資料【現象隨時間的變化】

統計資料的型別

按計量層次

按收集方法

按時間狀況

分類資料 【頻數、頻率】

順序資料 【頻數、頻率】

數值型資料 【統計量】

觀測資料

實驗資料

截面資料 【同一時間】

時間序列資料 【同一時間】

一、引數和統計量

引數:用來描述總體特徵的概念性數字度量 【總體特徵】

總體平均μ、總體標準差σ、總體比例 π

統計量:用來描述樣本特徵的概括性數字度量 【樣本特徵】

樣本平均x̅(x-bar) 、樣本標準差s、樣本比例p

二、變數

1、分類變數:說明事物類別的乙個名稱【』男『,』女『】

2、順序變數:說明事物有序類別的乙個名稱【』小學『,』初中『,』高中『】

3、數值型變數:說明事物數字特徵的乙個名稱【』年齡『,』時間『】

4、離散型變數:只能取可數值的變數【取有限個值,以整位數斷開,可一一舉例,』產品數量『】

5、連續型變數:可以在直線上或者區間中取任何變數【』溫度『,』年齡『】

三、資料整理與展示

條形圖與直方圖的區別:

條形圖中的每乙個矩形表示乙個類別,寬度沒有意義

直方圖的寬度表示各組的組距

條形圖主要用於展示定性資料,直方圖展示定量資料。

統計學基礎(一)統計摘要

總體 population 包含所研究的全部個體 資料 的集合 樣本 sample 研究中實際觀測或調查的一部分個體 選擇性偏差 selection bias 在研究過程中因樣本選擇的非隨機性而導致得到的結論存在偏差,屬於系統誤差。eg.在一項身高研究中,選擇籃球運動員作為樣本。測量偏差 measu...

分享一統計資訊的備份與恢復

情景 統計資訊直接影響到oracle優化器最後的執行計畫,每次公升完級或者資料遷移成功後都會習慣性的做一次統計資訊收集。但是對於一些大表,比如資料量超過幾千萬條,表分析後卻有可能會導致應用系統一些sql執行計畫變差,比如出現大量的全表掃,嚴重影響資料庫效能。分析 1.什麼是統計資訊?統計資訊主要是描...

統計學習方法(一) 統計學習與監督學習概論

監督學習 從標註資料中學習 模型的機器學習問題。無監督學習 是指從無標註的資料中學習 模型的機器學習問題。無標註資料是自然得到的資料,模型表示資料的類別 轉換或概率。無監督學習的本質是學習資料中的統計規律或潛在結構。強化學習 是指智慧型系統在於環境的連續互動中學習最優行為策略的機器學習問題。半監督學...