利用SPSS做資料分析 之資料處理2

2021-10-07 16:44:46 字數 3190 閱讀 2397

記錄合併也叫縱向合併,是將具有共同的資料字段、結構,不同的資料表記錄,合併到乙個新的資料表中。

現在有兩張表,一張「使用者明細-男」,一張「使用者明細-女」,他們擁有相同的資料字段、結構,只是記錄資訊不一樣,為了能夠進行整體的分析,我們需要將這兩張表合併到一張資料表中。

如果兩個資料集合並出現錯誤或失敗,請先返回到兩個資料集的【變數檢視】視窗中檢查:變數的資料型別、寬度、小數字數、值(標籤)、列(寬度)、測量及角色這些變數屬性設定是否一致,如有不一致,請將它們修改為一樣的設定。

資料分組:根據分析目的將資料進行等距或非等距分組,這個過程也稱為資料離散化,一般用於檢視分布,如消費分布、收入分布、年齡分布等。其中使用者繪製分布圖x軸的分組變數,是不能改變其順序的,一般按分組區間大小進行排列,這樣才能觀察研究資料的分布規律。

2.1 可視分箱-資料分組功能

excel中我們使用vlookup函式進行匹配功能進行資料分組操作;

在spss 中資料分組不通過函式操作,有專門的資料分組功能——「可視分箱」。

我們以:使用者明細 資料為例了解一下使用者年齡分布的特徵,現需將「年齡」變數進行分布操作:

為什麼要設定成:20、4、5呢?

根據年齡分布預覽圖,我們可以觀察到最小值是16,最大值是78;年齡主要分布在20-35之間,我們可以把第乙個分割點定位20,組距為5,這樣20-35之間按組距5進行分組可以得到3個組,再加上前後2各組,就是5個組,4個分割點,分割點引數大致就是這樣確定的,沒有絕對的標準,只要能達到解決問題的目的即可。

我們這個例子進行的是等距分組,那麼,如果是不等距分組,該如何操作呢?如果需要進行不等距分組,則可以在【可視分箱】第二步對話方塊下方的【網格】中,直接填入自定義的分割點,例如分別填入:20、25、35,第四個「高」會自動生成,然後單擊【生成標籤】按鈕,就可以生成對應的區間範圍標籤了:

2.2 重新編碼

對於不等距分組的操作,我們可以採用另外一種方法:重新編碼為不同變數。

重新編碼可以把乙個變數的數值按照指定要求賦予新的數值,也可以把連續變數重新編碼成離散變數。

例如:把年齡重新編碼為年齡段。

-01 開啟使用者明細資料檔案——單擊【轉換】選單——選擇【重新編碼為不同變數】——彈出【重新編碼為不同變數】對話方塊:

在【重新編碼為不同變數】對話方塊中——將年齡移至【輸入變數->輸出變數】框中,在右邊的【輸出變數】的【名稱】欄中輸入「年齡段3」:

單擊【舊值和新值】按鈕——彈出【重新編碼為不同變數:舊值和新值】對話方塊:

在【重新編碼為不同變數:舊值和新值】對話方塊中,在左邊【舊值】框中選擇【範圍】項——分別依次輸入每個分組的範圍臨界值——同時需要在右邊【新值】框的【值】欄中輸入對應的新值——並且單擊【新增】按鈕——將舊值和新值對應關係加入【舊->新】框中——對應關係輸入完畢後,如圖:

單擊【繼續】按鈕——返回【重新編碼為不同變數】對話方塊:

單擊【變化量】按鈕——使剛才輸入的對應關係生效——單擊【確定】——完成「年齡段3」變數操作。

資料標準化,是將資料按比例縮放,使之落到乙個特定區間。

資料標準化是為了消除量綱(單位)的影響,方便進行比較分析。

常用到的資料標準化方法有:0-1標準化、z標準化。

3.1 0-1標準化

0-1標準化也稱為離散標準化是對原始資料進行線性變換,是結果落到【0,1】區間。

0-1標準化還有個好處,就是很方便的做到十分制、百分制的換算,只需乘上10或100即可,其他分制同理:

計算公式:

x* = x-min / max-min

注:max是變數的最大值,min為變數的最小值。

例如:我們根據使用者明細資料為例進行介紹,對使用者的年齡進行

0-1標準化計算處理,得到乙個「標準化值」變數。

3.2 z標準化

z標準化:也稱為標準差標準化,它是將變數中的觀察值(原資料)減去該變數的平均值,然後除以該變數的標準差。經過處理的資料符合標準正態分佈,即均值為0,標準差為1,也是spss中最常用的標準化方法。

計算公式:

x*= x-μ / σ

注:μ為變數的均值,σ為變數的標準差。

我們對使用者的年齡進行z標準化計算處理,spss提供了乙個可以直接得到z標準化的功能,我們無須使用【計算變數】對話方塊手工輸入公式進行計算。

常用的資料處理方法與技巧主要是這些,只要掌握它們的原理,並且能夠做到靈活組合運用到實際工作中去就好了。

SPSS資料分析

僅僅在課堂學習spss理論知識往往是不夠的,我們要把理論知識應用於實際生活 把理論服務與實踐,樹立 資料分析價值觀 以及以資料進行決策的思維意識 要善於思考問題,要有清晰的分析思路,要有自己獨特的見解,最後要有一定的文字功底,如此才算乙個完整的資料分析過程。下面就四個板塊進行說明 一 資料分析思維的...

利用python做資料分析

3.2 資料分析的目的 主要就是為了在複雜 龐大的資料庫中提取對我們有用的資訊。讓這些資料產生一定的價值,幫助人們在日常生活中做一些決策時做一些參考。比如,在 中買東西,我們會首先看到物品的銷量 排行 以及顧客對物品的評價。這些都是經過資料分析得出來的。可見,資料分析在其中扮演著多麼重要的角色。3....

如何選擇SPSS資料分析方法

spss資料分析方法不知道如何選擇 一提到數學,高等數學,線性代數,概率論與數理統計,數值分析,空間解析幾何這些數學課程,頭疼呀。作為文科生,遇見這些課程時,通常都是各種尋求幫助,班上有位宅男數學很厲害,各種被女生 圍觀 這數學為什麼這麼難,學了有啥用呀。有用的,當做資料分析的時候,使用到spss,...