分詞 jieba.cut 三種模式
分詞的位置 jieba.tokenize
分詞的新增 jieba.add_word
import jieba.analyse
jieba.analyse.extract_tags
自定義詞典 jieba.load_userdict()
去除停用詞
stopwords={}.fromkeys(['的『,』了」]
ag形語素
形容詞性語素。形容詞**為 a,語素**g前面置以a。
a形容詞
取英語形容詞 adjective的第1個字母。
ad副形詞
直接作狀語的形容詞。形容詞** a和副詞**d並在一起。
an名形詞
具有名詞功能的形容詞。形容詞** a和名詞**n並在一起。
b區別詞
取漢字「別」的聲母。c連詞
取英語連詞 conjunction的第1個字母。
dg副語素
副詞性語素。副詞**為 d,語素**g前面置以d。d副詞
取 adverb的第2個字母,因其第1個字母已用於形容詞。e嘆詞
取英語嘆詞 exclamation的第1個字母。
f方位詞
取漢字「方」g語素
絕大多數語素都能作為合成詞的「詞根」,取漢字「根」的聲母。
h前接成分
取英語 head的第1個字母。i成語
取英語成語 idiom的第1個字母。
j簡稱略語
取漢字「簡」的聲母。
k後接成分
l習用語
習用語尚未成為成語,有點「臨時性」,取「臨」的聲母。m數詞
取英語 numeral的第3個字母,n,u已有他用。
ng名語素
名詞性語素。名詞**為 n,語素**g前面置以n。n名詞
取英語名詞 noun的第1個字母。
nr人名
名詞** n和「人(ren)」的聲母並在一起。
ns地名
名詞** n和處所詞**s並在一起。
nt機構團體
「團」的聲母為 t,名詞**n和t並在一起。
nz其他專名
「專」的聲母的第 1個字母為z,名詞**n和z並在一起。
o擬聲詞
取英語擬聲詞 onomatopoeia的第1個字母。p介詞
取英語介詞 prepositional的第1個字母。q量詞
取英語 quantity的第1個字母。r代詞
取英語代詞 pronoun的第2個字母,因p已用於介詞。
s處所詞
取英語 space的第1個字母。
tg時語素
時間詞性語素。時間詞**為 t,在語素的**g前面置以t。
t時間詞
取英語 time的第1個字母。u助詞
取英語助詞 auxiliary
vg動語素
動詞性語素。動詞**為 v。在語素的**g前面置以v。v動詞
取英語動詞 verb的第乙個字母。
vd副動詞
直接作狀語的動詞。動詞和副詞的**並在一起。
vn名動詞
指具有名詞功能的動詞。動詞和名詞的**並在一起。
w標點符號
x非語素字
非語素字只是乙個符號,字母 x通常用於代表未知數、符號。
y語氣詞
取漢字「語」的聲母。
z狀態詞
取漢字「狀」的聲母的前乙個字母。
un未知詞
不可識別詞及使用者自定義詞組。取英文unkonwn首兩個字母。(非北大標準,csw分詞中定義)
結巴分詞使用方法
1.安裝 將其解壓到任意目錄下,然後開啟命令列進入該目錄執行 python setup.py install 進行安裝 2.測試 安裝完成後,進入python互動環境,import jieba 如果沒有報錯,則說明安裝成功。如下圖所示 3 使用 1 分詞 結巴分詞支援3中分詞模式 1,全模式 把句子...
mysql使用結巴語句 SqlJieba
軟體簡介 mysql 結巴中文分詞外掛程式 sqljieba mysql,外掛程式 plugin 中文分詞,結巴分詞 jieba 全文檢索 full text sqljieba 使用方法 mysql create database sqljieba query ok,1 row affected 0...
mysql使用結巴語句 MySQL的使用語句
show databases 查詢所有的庫 drop database mldn 刪除庫 create database mldn 建立庫 use mldn 選擇用庫 show tables 查詢所有的表 desc 表名稱 檢視表結構 改變結構 alter table user change pas...