1. cc coordinating conjunction 連線詞
2. cd cardinal number 基數詞
3. dt determiner 限定詞(如this,that,these,those,such,不定限定詞:no,some,any,each,every,enough,either,neither,all,both,half,several,many,much,(a) few,(a) little,other,another.
4. ex existential there 存在句
5. fw foreign word 外來詞
6. in preposition or subordinating conjunction 介詞或從屬連詞
7. jj adjective 形容詞或序數詞
8. jjr adjective, comparative 形容詞比較級
9. jjs adjective, superlative 形容詞最高端
10. ls list item marker 列表標示
11. md modal 情態助動詞
12. nn noun, singular or mass 常用名詞 單數形式
13. nns noun, plural 常用名詞 複數形式
14. nnp proper noun, singular 專有名詞,單數形式
15. nnps proper noun, plural 專有名詞,複數形式
16. pdt predeterminer 前位限定詞
17. pos possessive ending 所有格結束詞
18. prp personal pronoun 人稱代詞
19. prp$ possessive pronoun 所有格代名詞
20. rb adverb 副詞
21. rbr adverb, comparative 副詞比較級
22. rbs adverb, superlative 副詞最高端
23. rp particle 小品詞
24. sym symbol 符號
25. to to 作為介詞或不定式格式
26. uh interjection 感嘆詞
27. vb verb, base form 動詞基本形式
28. vbd verb, past tense 動詞過去式
29. vbg verb, gerund or present participle 動名詞和現在分詞
30. vbn verb, past participle 過去分詞
31. vbp verb, non-3rd person singular present 動詞非第三人稱單數
32. vbz verb, 3rd person singular present 動詞第三人稱單數
33. wdt wh-determiner 限定詞(如關係限定詞:whose,which.疑問限定詞:what,which,whose.)
34. wp wh-pronoun 代詞(who whose which)
35. wp$ possessive wh-pronoun 所有格代詞
36. wrb wh-adverb 疑問代詞(how where when)
NLTK之詞性 POS 標註
詞性 pos 目前最先進的詞性標註演算法在 給定單詞的詞性上已經有了較高的精確度 約97 但詞性標註領域中仍有大量的研究等著我們。pos標記器 n gram標註器 正規表示式標註器 最大熵分類器 mec 隱性馬爾可夫模型 hmm 條件隨機場 crf import nltk from nltk imp...
NLTK中文詞性自動標註
學習自然語言處理,一定會參考nltk,主要是學習它的思路,從設計地角度看看能做什麼.其本質就是把語言看成字串,字串組,字串集,尋找其間規律 nltk是多語言支援的,但目前網上的例程幾乎沒有用nltk處理中文的,其實可以做。比如標註功能,它自身提供了帶標註的中文語庫 繁體語料庫sinica treeb...
詞性標註的詞性說明
1.cc coordinating conjunction 連線詞 2.cd cardinal number 基數詞 3.dt determiner 限定詞 如this,that,these,those,such,不定限定詞 no,some,any,each,every,enough,either,...