大二用sas做的專案

2021-08-21 08:08:20 字數 3046 閱讀 5397

前期是將91份研究生調查問卷的資訊錄入到excel**中,每個問卷有35個選擇題,在excel**裡整理成91行35列的形式。然後將**匯入到sas軟體進行資料預處理,將選項答案的abcd轉化成1234,將缺失值找出,並重新賦值。然後通過單因素方差分析將性別與上網時間、遵守道德、是否有癮;專業類別與解決學習問題;上網玩遊戲時間比例與居住地;遊戲型別與網路言論等等。將這些關係依次計算頻率、排序、單因素方差分析,觀察p值是否大於0.05來判斷兩者之間是否有顯著性差異,有顯著性差異就說明這兩個因素之間沒有潛在的聯絡,沒有顯著性差異就說明這兩個因素之間存在聯絡。接著通過逐步回歸的方法找出下面這5個相關性將強的變數:1、乙個分型別輸出變數study(1代表積極學習型上網,0代表不積極學習型上網)2、***(性別,分型別,0表示男性,1表示女性)3、residence(居住地,分型別,0表示農村,1表示城鎮)4、income(家庭收入,數值型)5、nage(網齡,數值型)構建乙個多元logistic回歸模型。計算輸出的intercept和residence的比值來判斷學生網上遵守道德的標準的概率的值。具體說明如下:

回歸方程的形式是log(odds)=log(p/(1-p))=0.1110+1.7137*n***-1.5000*residenc。知道odds=p/(1-p),有p=odds/(1+odds)。假設有個學生,性別為男, 居住地為農村(n*** =0,residence =0),代入方程,有log(odds)=0.1110,再odds=exp(0.1110)=1.1174,p=1.1174/2.1174=0.5277,則這位男生上網是為了學習的概率為0.5277;乙個學生,性別為女, 居住地為農村(n*** =1,residence =0),同樣的步驟得log(odds)=1.8249,odds=exp(1.8249)=6.2022,p=6.2022/7.2022=0.8612則這位女學生上網是為了學習的概率為0.8612;說明性別變數對上網類別的影響很重要。

下面是部分分析**
/*英文本元轉化成英文本元*/

data date;

set sasuser.date;

if x1="a" then ***=0;

else if x1="b" then ***=1;

if x2="a" then residence=0;

else if x2="b" then residence=1;

if x3="a" then nage=3-3*ranuni(123);

else if x3="b" then nage=3+2*ranuni(123);

else if x3="c" then nage=6+4*ranuni(123);

else if x3="d" then nage=10+4*ranuni(123);

if x5="a" then income=0;

else if x5="b" then income=2000-2000*ranuni(123);

else if x5="c" then income=2000+2000*ranuni(123);

else if x5="d" then income=4000+2000*ranuni(123);

else if x5="e" then income=6000+2000*ranuni(123);

else if x5="f" then income=8000+4000*ranuni(123);

if x32="a" then label=1 ;

else if x32="b" then label=0;

keep label *** residence income nage;

run;

/*單因素方差分析*/

proc anova data=date2;

class xx18;

model xx32=xx18;

run;

data date;

set a1;

if x16="c"&x4="b" then x4="c";

run;

data b;

set a1;

keep x4 x16;

run;

proc sort data=date1;

by x1;

run;

proc contents data=date2;

run;

data sasuser.date;

set sasuser.date;

if x18="c" then x18="b";

run;

/*回歸分析*/

proc reg data=date1;

model q7=q1 q2 q5 q6;

run;

/*計算頻率*/

proc freq data=sasuser.date;

table x31;

run;

data sasuser.date;

set sasuser.date;

if x12="d" then x12="b";

else if x12="e" then x12="c";

run;

/*排序與計算頻率*/

data date;

set date;

run;

proc sort data=date;

by x11;

run;

proc freq data=date;

by x11;

run;

/*建立邏輯斯蒂回歸模型*/

proc logistic data=date descending;

model label=nage *** residence income /selection=forward;

run;

(二)用testng的groups管理用例

測試時經常有兩種場景,第一種是冒煙測試的小部分用例 一類是全部用例。package com.testcases import org.testng.annotations.test import com.pages.loginpage import com.jxl.excel.exceldata i...

第十七講 專案二 用指標玩字串 (事例)

檔名稱 grade.cpp 作 者 劉天恩 完成日期 2014年12月11日 版 本 號 v1.0 問題描述 用陣列名作形參方案,其核心是實現char astrcat char str1,const char str2 程式輸入 無 程式輸出 輸出按照要求連線後的陣列 include using n...

第十五周 專案二 用雜湊法組織關鍵字

問題及 all right reserved.檔名稱 用雜湊法組織關鍵字.cpp 版本號 v1.0 問題描述 已知乙個關鍵字序列為if while for case do break else struct union int double float char long bool,共15個字串,雜...