2 1使用多個界定符分隔字串

2022-09-21 20:33:09 字數 1442 閱讀 6952

問題

​ 你需要將乙個字串分割為多個字段,但是分隔符(還有周圍的空格)並不是固定的。

解決方案

​ string物件的split()方法只適用於非常簡單的字串分割情形,它並不允許有多個分隔符或者是分隔符周圍不確定的的空格。當你需要新增更靈活的切割字串的時候,最好使用re.split()方法:

import re

line = 'asdf fjdk; afed, fjek,asdf, foo'

res = re.split(r'[;,\s]\s*', line)

print(res) # ->['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

討論

​ 函式re.split()是非常實用的,因為它允許你為分隔指定多個正則模式。比如,在上面的例子中,分隔符可以是逗號,分號或者是空格,並且後面緊跟著任意個的空格。只要這個模式被找到,那麼匹配的分隔符兩邊的實體都會被當成事結果中的元素返回。返回結果為又給字段列表,這個跟str.split()返回值型別是一樣的。

​ 當你使用re.split()函式的時候,需要特別注意的是正規表示式中是否包含乙個括號捕獲分組。如果使用了捕獲分組,那麼被匹配的文字也將出現在結果列表中。比如,觀察一下這段**執行後的結果:

fields = re.split(r'(;|,|\s)\s*', line)

print(fields)

# ->['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']

​ 獲取分隔字元在某些情況下也是有用的。比如,你可能想保留分隔符字串,用來在後面重新構造乙個新輸出的字串;

values=fields[::2]

delimiters=fields[1::2]+['']

print(values) # ->['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

print(delimiters) # ->[' ', ';', ',', ',', ',', '']

print(''.join(v+d for v,d in zip(values,delimiters))) # ->asdf fjdk;afed,fjek,asdf,foo

​ 如果你不想保留分隔字串到結果列表中去,但仍然需要使用到括號來分組正規表示式的話,確保你的分組是非捕獲分組,形如(?:....).比如:

print(re.split(r'(?:,|;|\s)\s*',line)) #->['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

多個界定符分割字串

你需要將乙個字串分割為多個字段,但是分隔符 還有周圍的空格 並不是固定的。string物件的split 方法只適應於非常簡單的字串分割情形,它並不允許有多個分隔符或者是分隔符周圍不確定的空格。當你需要更加靈活的切割字串的時候,最好使用re.split 方法 line asdf fjdk afed,f...

2 1 多分隔符字串劃分

str.split re.split str.split 方法適用於簡單的情形,對於多分隔符的情況需要使用re.split 類似str.split 的操作 line asdf fjdk afed,fjek,asdf,foo import re re.split r s s line asdf fjd...

Oracle 根據分隔符分隔字串

為了讓pl sql 函式返回資料的多個行 必須通過返回乙個 ref cursor 或乙個資料集合來完成 ref cursor 的這種情況侷限於可以從查詢中選擇的資料 而整個集合在可以返回前 必須進行具體化 oracle 9i 通過引入的管道化表函式糾正了後一種情況 表函式是返回整個行的集 通常作為乙...