NLP自然語言處理1 使用正規表示式

2021-09-20 21:21:46 字數 772 閱讀 9841

1.析取

使用括號,匹配括號裡的任意字元

[abc]dee],即匹配  adee,bdee,cdee

[ww]ood,即匹配  wood和wood

使用範圍:

[a-z] 表示匹配小寫字母

[a-z] 表示匹配大寫字母

2.非析取

[^ss]

[^a-z]非大寫字母,即匹配小寫字母或其他字元。

3.更多析取

more|less,匹配more或者是less

a|b|c,即[abc],匹配a或b或c

4.正規表示式:

? ,colou?r,匹配color或者是colour,表示前乙個字元是可選項

*    ,oo*p,匹配op,oop,ooop,匹配0至多個前乙個字元o

+    ,o+p,   匹配op,oop,ooop,匹配1至多個前乙個字元o

.     ,beg.n,匹配begin,began,begun,beg3n.表示匹配任意字元

5.特殊字元^,$,表示開頭結尾

^[a-z],表示匹配大寫字母開頭

^[^a-z],表示非大寫字母開頭

.$,表示任意字元結尾

\$,反斜槓\+$才表示匹配真正的$,其餘時刻按結尾字元來看,

同理,\.才表示真正的點.

NLP自然語言處理

第1部分自然語言處理入門 1.1自然語言處理入門.mp4 第2部分hmm和crf 1.1crf模型簡介.mp4 1.1hmm模型介紹.mp4 1.2文字處理的基本方法 part1.mp4 2.1新聞主題分類任務 第4步 part2.mp4 第43部分rnn 1.1rnn模型小結.mp4 1.1rnn...

NLP自然語言處理

老實來講這課我一頭霧水滿腦袋問號 import numpy as np from collections import counter counttime 0 def seperate filename totalnum 0 郵件的總數 global counttime i 0 file open ...

NLP自然語言處理相關

近期需要學習一些命名實體識別的知識,記錄一下,以便以後複習 個人理解 目前的理解是,命名實體識別 ner 是自然語言處理 nlp 的乙個階段,可應用於機器翻譯 摘要形成 資訊檢索等等,個人認為,自然語言處理是一門很複雜的跨學科技術,其難點在於人類是富有思維的,人的語言寄託人的思想,因此很難準確處理。...