data.drop(index=
(data[
(data[
"公司縮寫"
]==row[1]
)&(data[
"發布時間"
]==row[2]
)&(data[
"文章綜合情感"
]==row[3]
)].index)
)
for row in merge_data12.itertuples():
#迴圈titledata每一行
a = row[1]
.split(
",")
#print(merge_data12[(merge_data12["公司縮寫"]==row[1])&(merge_data12["發布時間"]==row[2])&(merge_data12["文章綜合情感"]==row[3])].index)
iflen
(a)>1:
for i in a:
#將分割後的各個公司 重新加入**中
, ignore_index=
true
)#刪除原本行
merge_data12.drop(index=
(merge_data12[
(merge_data12[
"公司縮寫"
]==row[1]
)&(merge_data12[
"發布時間"
]==row[2]
)&(merge_data12[
"文章綜合情感"
]==row[3]
)].index)
)
Dataframe 按條件選取行
我們說excel好用,在處理大型資料 的時候,excel可以非常方便地進行篩選。那麼pandas是否有類似的功能呢?答案是肯定的。下面介紹的幾個操作,返回的型別都是dataframe,因此可以進行巢狀操作,非常方便。一 選取幾列組成新的dataframe df df a列列明 s列列明 h列列明 二...
多個DataFrame的儲存
datadf型別 list中包含若干個dataframe,由於每個dataframe都很大,現在需要把每個dataframe分別儲存成乙個csv方便讀取 嘗試1 為了省記憶體,把每個dataframe轉換成str格式進行儲存 file open temp diff strline.csv w for...
DataFrame的條件過濾
series向量的操作 from pandas import read csv 載入檔案 df read csv scientists.csv print df print type df 得到年齡這一列 age df age print age print print age 100 datafr...