python3+
使用python製作資料處理工具時接觸到的split(),對資料提取用到str.split()。
split(sep, num)
str.split(str="", num=string.count(str)).
#!/usr/bin/python3
str=
"do what you cant\n\n\n!!"
print
(str
.split())
# 以空格為分隔符 進行全分割 如果包含了\n且多個連續的\n也會被認為是乙個
print
(str
.split(
'o',1)
)# 以 o 為分隔符 進行一次分割
print
(str
.split(
'o')
)# 以 o 為分隔符 進行全分割
[
'do'
,'what'
,'you'
,'cant'
,'!!'][
'd',
' what you cant\n\n\n!!'][
'd',
' what y'
,'u cant\n\n\n!!'
]
實際中可能還需要遇到分割字串後提取其中某個位置的資料,這就需要使用str.split()這種方法了。
split()中填寫的為位置引數,當值為正則是從左往右順序,為負則為從右往左順序
注意:該引數為空或者超過了可切割的最大值(指定分隔符個數)則會報錯。
#!/usr/bin/python3
str=
"do what you cant\n\n\n!!"
print
(str
.split()[
0])#得到第乙個空格之前的內容
print
(str
.split()[
1])#得到第乙個空格之後第二個空格之前的內容
print
(str
.split()[
2])#得到第二個空格之後第三個空格之前的內容
print
(str
.split()[
3])#得到第三個空格之後第四個空格之前的內容
print
(str
.split()[
4])#得到第四個空格之後的內容 之前有提到多個連續\n會預設為乙個空格
#如果print (str.split()[5])則會報錯
print
("-------------------"
)print
(str
.split()[
-1]+
" 倒序頭尾 "
+str
.split()[
-5])
#倒序此處-5相當於0
do
what
youcant!!-
----
----
----
----
--!! 倒序頭尾 do
LEMON原始碼分析筆記 分割原始碼
lemon 原始碼分析筆記 分割原始碼 五千多行 集於乙個檔案,這不是什麼明智之舉。根據原始碼中的提示,可以程式設計乙個分割程式。分割程式的工作是,識別出檔名,並把用它建立檔案,寫入相應內容。在處理過程式,記錄標頭檔案。在識別出原始檔時,把在其前的標頭檔案 include 進去。理論上這樣做是可行的...
git筆記 分支
當新加某個功能時,一般會建立乙個分支。git branch new feature 建立新功能的分支 git push origin new feature 發布新分支當新功能開發完畢後需要將此分支合併到主分支。git checkout master 切換到主分支 git merge new fea...
NLP筆記 分詞
分詞標註方案 分詞工具 常見模型 維護詞典 用語句中字串與詞典進行比較,找到則切分,否則不切分。相連的字反覆出現,認為它們可能組成的是乙個詞。補充 hmm 齊次馬爾科夫假設,發射概率,轉移概率 先基於詞典進行分詞,再使用統計方法輔助 處理未登入詞和歧義詞 標籤 b begin i intermedi...