需求:給定乙個dataframe和乙個list,listwww.cppcns.com中存放的是dataframe中某一列的元素,刪除dat程式設計客棧aframe中與list元素重複的行(即取差集)。
在網上搜了一圈,好像沒看到dataframe中取差集的方式,所以自己寫了乙個。方法比較繁瑣,如果有更簡便的方式,請留言。
import pandas as pd
data = [[程式設計客棧1,2,3],[2,3,4],[3,4,5],[4,5,6]]
# 建立dataframe,包含a,b,c三列
df = pd.dataframe(data, columns=['a','b','c'])
print(df)
# a 列中待刪除的元素
a_to_drop = [1, 3]
# 找到待刪除元素所在的位置,返回的是 true or false 序列
flag = df['a'].isin(a_to_drop)
# 由於我們要取差集,因此對上述序列取反
diff_flag = [not f for www.cppcns.comf in flag]
# res 為我們所需要的差集
res = df[diff_flag]
# 重置index
res.index = [i for i in range(len(res))]
print(res)
本文標題: python dataframe 取差集例項
本文位址:
python DataFrame合併方法
python 合併dataframe方法 dataframe.merge left,right,how inner on none,left on none,right on none,left index false,right index false,sort false,suffixes x ...
python dataframe數值替換
需求 將csv檔案中的值為 8888的因子值替換為當日全市場因子的中值 原始資料 解析 實現 import pandas as pd def filter2median invalid number with open r c users administrator documents wechat...
Python Dataframe 兩列相除
import pandas as pd df pd.read csv 離線資料.csv 新建乙個dataframe df data pd.dataframe columns 總數 人數 平均值 df data 總數 人數 df df data 平均值 df data.lambda x x 總數 x ...