Python資料分析

2021-10-02 19:37:38 字數 765 閱讀 8536

我們在用python做資料分析的過程中,有一些操作步驟和邏輯框架是很固定的,只需要記住其用法即可。本節內容介紹pandas模組在資料分析中的常用方法。

1、資料的生成與匯入

2、資料資訊檢視

2.1、檢視整體資料資訊

2.2、檢視資料維度、列名稱、資料格式

2.3、檢視資料特殊值和數值

2.3.1、檢視空值

2.3.2、檢視唯一值

2.3.3、檢視數值

2.3.4、檢視前後資料

3、資料的清洗和預處理等步驟

3.1、空值處理

3.2、空格處理

3.3、字串大小寫處理

3.4、更改資料型別和列名稱

3.5、重複值處理

3.6、資料替換

3.7、資料合併和排序

3.8、資料分組

4、資料提取和篩選

4.1、按位置提取

4.2、按標籤提取

4.3、按條件提取

4.4、資料篩選

5、資料彙總與統計量計算

5.1、groupby用法

5.2、資料透視表用法

5.3、資料取樣

5.4、資料求均值 ,方差等

5.5、資料求相關係數

6、資料儲存

6.1、儲存到execl

6.2、儲存到csv

python資料分析

以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...

python資料分析

陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...

python資料分析

1.資料分析的含義與目標 2.python與資料分析 3.python資料分析大家族 4.python環境搭建 一 numpy 功能 ndarray 多維操作 線性代數 官網 numpy是python語言的乙個擴充程式庫。支援高階大量的維度陣列與矩陣運算,此外也針對陣列運算提供大量的數學函式庫。nu...