python篩選一段資料 按多個關鍵字篩選資料

2021-10-16 20:20:47 字數 1630 閱讀 5617

我認為您可以為每個關鍵字建立單獨的掩碼,然後通過&將它們與鏈結結合起來—對於每行至少乙個true使用^{}:df_rest = pd.dataframe()

cols = [0,1,2]

print (m1)

0 1 2

0 true true true

1 true true false

2 true false true

print (m2)

0 1 2

0 true false false

1 false false true

2 false true true

print (m3)

0 1 2

0 false true false

1 false false false

2 false false true

^$可能有些關鍵字被解釋為正規表示式。要避免使用regex=

false:df_rest = pd.dataframe()

print (df_rest)

0 1 2

0 xyz dd 0.9.4 openssl dd openssl t

1 dd openssl 0.9.4 dd 0.9 dd xyz

2 g 0.9.4 g xyz openssl 0.9.7

cols = [0,1,2]

r.str.contains('openssl', case=false, regex=false)))

df = df_rest[m.any(axis=1)]

print (df)

0 1 2

0 xyz dd 0.9.4 openssl dd openssl t

1 dd openssl 0.9.4 dd 0.9 dd xyz

1:['0.9.2 openssl dd','dd 0.9','g xyz'],

2:['openssl t','dd xyz','openssl 0.9.1']})

print (df_rest)

df = pd.read_csv('keywords.txt', names=('a','b'))

print (df)

a b0 openssl 0.9.1

1 openssl 0.9.2

2 openssl 0.9.4

cols = [0,1,2]

for i, x in df.iterrows():

r.str.contains(x['b'], case=false, regex=false)))

df = df_rest[m.any(axis=1)]

f = '_.txt'.format((x['a'], x['b']))

df.to_csv(f, index=false, header=false)

for i, x in dfkey.iterrows():

cols = [0,1,2,3,4,5]

r.str.contains(x['b'], case=false, regex=false)))

df_rest = df_rest[m.any(axis=1)]

pd.concat(dfs).to_csv('text.csv', index=false, header=false)

一段時間裡面的資料篩選

一段時間裡面的資料篩選 在做到一些頁面的時候我們可能需要做到一些資料的時間篩選,就比如說想篩選出當月的資料這個需要怎麼做?看下圖 當選中對應的顯示什麼時候,右邊這兩個日期就要變化。比如選中了顯示當月,然後右邊這兩個日期就要變為2019 07 01和2019 07 31,然後再把日期傳到後台就可以做時...

列印一段數字中的所有質數的演算法

簡單實現如下。演算法一 這個演算法的中心思想是迴圈所有需要判斷的數字,然後逐一進行取模判斷。public class isprime public static void printprimenumber int from,int to system.out.println from 到 to 間的...

一段分析資料的總結

業務背景 有乙個表中存在1億的資料,存著個人資訊 城市 單位 學校等內容 而這些內容在字段中儲存的是json,需要將這些資料分析後,算出這些內容的離散模型,取出top100。最先的實現方案是批量查出來1w資料,分析後一條條更新,發現更新太慢。隨後做了如下改進,也是總結 1 先查詢後更新的操作,用my...