1.析取
使用括號,匹配括號裡的任意字元
[abc]dee],即匹配 adee,bdee,cdee
[ww]ood,即匹配 wood和wood
使用範圍:
[a-z] 表示匹配小寫字母
[a-z] 表示匹配大寫字母
2.非析取
[^ss]
[^a-z]非大寫字母,即匹配小寫字母或其他字元。
3.更多析取
more|less,匹配more或者是less
a|b|c,即[abc],匹配a或b或c
4.正規表示式:
? ,colou?r,匹配color或者是colour,表示前乙個字元是可選項
* ,oo*p,匹配op,oop,ooop,匹配0至多個前乙個字元o
+ ,o+p, 匹配op,oop,ooop,匹配1至多個前乙個字元o
. ,beg.n,匹配begin,began,begun,beg3n.表示匹配任意字元
5.特殊字元^,$,表示開頭結尾
^[a-z],表示匹配大寫字母開頭
^[^a-z],表示非大寫字母開頭
.$,表示任意字元結尾
\$,反斜槓\+$才表示匹配真正的$,其餘時刻按結尾字元來看,
同理,\.才表示真正的點.
NLP自然語言處理
第1部分自然語言處理入門 1.1自然語言處理入門.mp4 第2部分hmm和crf 1.1crf模型簡介.mp4 1.1hmm模型介紹.mp4 1.2文字處理的基本方法 part1.mp4 2.1新聞主題分類任務 第4步 part2.mp4 第43部分rnn 1.1rnn模型小結.mp4 1.1rnn...
NLP自然語言處理
老實來講這課我一頭霧水滿腦袋問號 import numpy as np from collections import counter counttime 0 def seperate filename totalnum 0 郵件的總數 global counttime i 0 file open ...
NLP自然語言處理相關
近期需要學習一些命名實體識別的知識,記錄一下,以便以後複習 個人理解 目前的理解是,命名實體識別 ner 是自然語言處理 nlp 的乙個階段,可應用於機器翻譯 摘要形成 資訊檢索等等,個人認為,自然語言處理是一門很複雜的跨學科技術,其難點在於人類是富有思維的,人的語言寄託人的思想,因此很難準確處理。...