從網頁裡抓取資料並進行操作
import numpy as np
import pandas as pd
from pandas import series,dataframe
import webbrowser
linkur2=""
webbrowser.open(linkur2) #開啟網頁
在網頁中複製想要的行和列中的資訊
df2=pd.read_clipboard() #從作業系統貼上版中解析貼上內容
如果只是想取出特定的列
想增加新的列
如果想給新增的列附上內容
#new1 10-17
#new2 隨機整數
import numpy as np
df3.new1=(np.arange(10,16))
df3.new2=(np.random.randint(0,12,6))
#重新df3.new2=pd.series([100,200,300],index=[1,2,3])
進一步來說,series(一維),dataframe(二維)
data=
#提取字典某列
生成二維的
只想要city這一列的
按行輸出
#df1.iterrows() 行集合
再強調一次,通過series建立dataframe
series :一維,index--values
dataframe :二維,由多個series組成
轉置
df1.t
pandas 2列資料合併
1 其中的trans type trans class兩列合成一列用於模糊查詢,並建立新的列。df trans type class df trans type df trans class 注 但是某一列如果為空,另一列不為空,則合併結果是為空,所以在合併之前需要對na進行預處理,替換或者刪除。2...
pandas 2索引和選擇資料
對於一種資料結構,最基本的操作就應該是增刪改查了。行選擇和列選擇有許多方法,很容易記混,常用的要記住。主要方法有三種 iloc,loc,df.loc index1 index2 price df.iloc a b price 123 4567 s.sample frac 0.5 引數 預設選擇行,n...
機器學習之pandas
import pandas as pd a pd.read csv 檔案路徑 讀取檔案 a.head 顯示的條數 顯示前部分資料 a.tail 顯示的條數 顯示後部分資料 a.columns 輸出列 a.loc 序列號 輸出乙個樣本 a.columns.tolist 將列轉換成列表 c.endwit...