一、使用指引
1.資料型別series
1.1構建
a.python列表直接構建
b.通過numpy的 ndarray構建
c.通過字典構建
1.2索引
a.取單個資料
b.取連續的多個資料
c.取不連續多個資料
d.根據條件取值(布林索引)
2.資料型別dataframe
2.1構建
a.巢狀的列表 / 二維ndarray 構建
b.通過字典構建
2.2索引
2.2.1【基本索引】
a.取某列
b.取某個資料
c.取不連續的多列
d.取連續的多行
e.按條件索引
2.2.2【高階索引】
a.根據索引名取值:loc
取單行,
取單列,
取單行單列,
取連續多行,
取連續多列,
取連續的多行多列,
取不連續的多行,
取不連續的多列,
取不連續的多行多列,
布林取值
b.根據下標取值:iloc
c.混合索引:ix
3.資料操作
a.新增索引資料
b.刪除索引資料
c.索引重新命名
d.索引物件型別轉換
4.對齊運算
5.處理缺失值
a.判斷資料集是否有缺失值
b.刪除缺失值所在的行 / 列
c.填充缺失值
6.處理重複資料
a.判斷某列中是否有重複資料
b.直接刪除重複資料的行
c.替換指定資料
c.1 單值替換
c.2 多值替換
c.3 不同值做不同替換
c.4 dataframe物件指定列替換指定值
資料分析 pandas
pandas是乙個強大的python資料分析的工具包,它是基於numpy構建的,正因pandas的出現,讓python語言也成為使用最廣泛而且強大的資料分析環境之一。pandas的主要功能 具備對其功能的資料結構dataframe,series 整合時間序列功能 提供豐富的數 算和操作 靈活處理缺失...
Python資料分析 pandas 基本操作
構建資料集 import pandas as pd import numpy as np n 20 dataset pd.dataframe 顯示前五行 獲取所有元素的值 返回numpy陣列 dataset.values 獲取資料型別 dataset.dtypes 獲取行名 dataset.inde...
資料分析學習 使用Pandas進行資料分析
在對資料進行分析時,首先需要了解相關的名詞在該行業裡的含義,即查閱相關知識對題目進行整體把握。下面是進行資料分析的步驟 1 讀取資料 import pandas as pd data pd.read csv data train.csv 2 對資料進行預處理 具體包括 1 剔除空白值超過一半的列 h...