我認為您可以為每個關鍵字建立單獨的掩碼,然後通過&將它們與鏈結結合起來—對於每行至少乙個true使用^{}:df_rest = pd.dataframe()
cols = [0,1,2]
print (m1)
0 1 2
0 true true true
1 true true false
2 true false true
print (m2)
0 1 2
0 true false false
1 false false true
2 false true true
print (m3)
0 1 2
0 false true false
1 false false false
2 false false true
^$可能有些關鍵字被解釋為正規表示式。要避免使用regex=
false:df_rest = pd.dataframe()
print (df_rest)
0 1 2
0 xyz dd 0.9.4 openssl dd openssl t
1 dd openssl 0.9.4 dd 0.9 dd xyz
2 g 0.9.4 g xyz openssl 0.9.7
cols = [0,1,2]
r.str.contains('openssl', case=false, regex=false)))
df = df_rest[m.any(axis=1)]
print (df)
0 1 2
0 xyz dd 0.9.4 openssl dd openssl t
1 dd openssl 0.9.4 dd 0.9 dd xyz
1:['0.9.2 openssl dd','dd 0.9','g xyz'],
2:['openssl t','dd xyz','openssl 0.9.1']})
print (df_rest)
df = pd.read_csv('keywords.txt', names=('a','b'))
print (df)
a b0 openssl 0.9.1
1 openssl 0.9.2
2 openssl 0.9.4
cols = [0,1,2]
for i, x in df.iterrows():
r.str.contains(x['b'], case=false, regex=false)))
df = df_rest[m.any(axis=1)]
f = '_.txt'.format((x['a'], x['b']))
df.to_csv(f, index=false, header=false)
for i, x in dfkey.iterrows():
cols = [0,1,2,3,4,5]
r.str.contains(x['b'], case=false, regex=false)))
df_rest = df_rest[m.any(axis=1)]
pd.concat(dfs).to_csv('text.csv', index=false, header=false)
一段時間裡面的資料篩選
一段時間裡面的資料篩選 在做到一些頁面的時候我們可能需要做到一些資料的時間篩選,就比如說想篩選出當月的資料這個需要怎麼做?看下圖 當選中對應的顯示什麼時候,右邊這兩個日期就要變化。比如選中了顯示當月,然後右邊這兩個日期就要變為2019 07 01和2019 07 31,然後再把日期傳到後台就可以做時...
列印一段數字中的所有質數的演算法
簡單實現如下。演算法一 這個演算法的中心思想是迴圈所有需要判斷的數字,然後逐一進行取模判斷。public class isprime public static void printprimenumber int from,int to system.out.println from 到 to 間的...
一段分析資料的總結
業務背景 有乙個表中存在1億的資料,存著個人資訊 城市 單位 學校等內容 而這些內容在字段中儲存的是json,需要將這些資料分析後,算出這些內容的離散模型,取出top100。最先的實現方案是批量查出來1w資料,分析後一條條更新,發現更新太慢。隨後做了如下改進,也是總結 1 先查詢後更新的操作,用my...