pandas
pandas 是一種列存資料分析 api。它是用於處理和分析輸入資料的強大工具,很多機器學習框架都支援將 pandas 資料結構作為輸入。
匯入 pandas api 並輸出相應的 api 版本
from __future__ import print_function
import pandas as pd
pd.__version__
pandas主要資料結構分類:
建立series
pd.series(['iterm_1','iterm_2','iterm_3',...]) #新增自定義個數item
建立dataframe物件
dataframe即是由多個series構成
如果插入的series 在長度上不一致,系統會用特殊的 na/nan 值填充缺失的值。
載入整個檔案到dataframe
其中使用了 dataframe.describe() 來顯示關於 dataframe 的統計資訊。另乙個實用函式是 dataframe.head(),它顯示 dataframe 的前幾個記錄。
繪製直方圖
借助 dataframe.hist()繪製某一series的直方圖
訪問資料
利用python的list/dict操作即可訪問dataframe中的資料。
例如:
cities = pd.dataframe()
print(type(cities['city name']))
cities['city name']
print(type(cities['city name'][1]))
cities['city name'][1]
print(type(cities[0:2]))
cities[0:2]
without output pictures,hahahah
操控資料
population / 1000.
可以匯入numpy對資料進行處理:
import numpy as np
np.log(population)
without output pictures too (dancing
dataframe修改
向現有 dataframe 新增了兩個 series:
pandas簡單應用
機器學習離不開資料,資料分析離不開pandas。昨天感受了一下,真的方便。按照一般的使用過程,將pandas的常用方法說明一下。首先,我們拿到乙個excel表,我們將之另存為csv檔案。因為檔案是實驗室的資源,我就不分享了。首先是檔案讀取 def load csv filename data pd....
pandas按條件過濾 Pandas簡單入門
本文作為pandas入門及筆記用途!1.匯入pandas及資料表 import pandas as pd df pd.read csv uk rain 2014.csv header 0 2.更改列標籤及檢視前5行資料 3.查詢資料表行數及維度 df.shape 33,7 len df 4.檢視資料...
pandas簡單處理資料
pandas處理資料 1 建立資料 建立series,讓pandas建立乙個索引 2檢視資料 檢視框架的頂行和底行 head tail 顯示索引 列 基礎numpy資料 index columns valuesdescribe 顯示快速統計摘要 3 缺少資料 刪除缺少資料的行 line.dropna...