用於一般統計描述---proc mean 過程
詳細統計描述過程---proc univariate 過程
正態性檢驗 proc univariate normal; nvar x; run;
兩均數的比較(t.test):一般用proc ttest; class 分組變數;var x; run;
多個樣本均數的比較(anova):一般用proc anova;class 分組變數;model x=分組變數;
多個樣本率的比較(卡方檢驗):一般用proc freq; tables r*c/chisq; run;
直線回歸與相關
回歸:proc reg; model y=x;run;
多重線性回歸:model y=x1 x2 ...; run;
相關:proc corr; var x y; run;
秩和檢驗:一般用proc npar1way wilcoxon; class 分組變數;var x;run;
logistic 回歸:proc logistic descending;model y=x1 x2;run;
生存分析:生存率估計及logrank-test:proc lifetest plots=(s);time 時間*狀態(1);*1指生存定義
strata 分組變數;
run;
cox回歸:proc phreg; model 時間*狀態(1)=x1 x2.../risklimits;run;
pandas統計分析基礎(2)
pandas描述性統計方法的常見方法 方法統計含義 方法統計含義 min最小值 max最大值 mean 均值count 非空數目 median 中位數mode 眾數std 標準差var 方差cov 協方差ptp 極差skew 樣本偏度 kurt 樣本峰度 sem標準誤差 quantile 四分位數 ...
Pandas統計分析基礎之DataFrame
3 更改dataframe中的資料 4 增加dataframe中的資料 刪除dataframe中的資料 dataframe類似於資料庫的表或者excel的 panda將資料讀取之後,以dataframe的資料結構儲存在記憶體中。下面就來介紹一下dataframe的增刪查改操作。因為dataframe...
統計分析的體會
客戶給了一張基本的資料表,然後讓我做大量的計算,並且動態 靜態的做統計分析報表,經過了長達兩個月的苦戰,終於作完了。體會如下 1 一張存放中間統計結果的表是必要的,如果能夠將客戶的統計分析需要經過計算才能顯示的字段囊括在內是最好不過了,畢竟在查詢的過程中作計算是一件很討厭的事,雖然有資料冗餘,但是簡...