二級python基礎之jieba庫分詞

2021-10-09 03:41:06 字數 1485 閱讀 6276

jieba是優秀的中文分詞第三方庫

(cmd命令列) pip install jieba

jieba分詞依靠中文詞庫

精確模式、全模式、搜尋引擎模式

jieba.lcut(s)

精確模式,返回乙個列表型別的分詞結果

import jieba

s = jieba.lcut(

"中國是乙個偉大的國家"

)print

(s)

分詞結果

[

'中國'

,'是'

,'乙個'

,'偉大'

,'的'

,'國家'

]

jieba.lcut(s,cut_all=true)

全模式,返回乙個列表型別的分詞結果,存在冗餘

import jieba

s = jieba.lcut(

"中國是乙個偉大的國家"

,cut_all=

true

)print

(s)

分詞結果

[

'中國'

,'國是'

,'乙個'

,'偉大'

,'的'

,'國家'

]

jieba.lcut_for_search(s)

搜尋引擎模式,返回乙個列表型別的分詞結果,存在冗餘

import jieba

s = jieba.lcut_for_search(

"中華人民共和國是偉大的"

)print

(s)

分詞結果

[

'中華'

,'華人'

,'人民'

,'共和'

,'共和國'

,'中華人民共和國'

,'是'

,'偉大'

,'的'

]

jieba.add_word(w)

向分詞詞典增加新詞w,保證在分詞操作中w不會被分開

import jieba

s = jieba.lcut(

"中國是乙個偉大的國家"

)print

(s)jieba.add_word(

"偉大的國家"

)s = jieba.lcut(

"中國是乙個偉大的國家"

)print

(s)

分詞結果

[

'中國'

,'是'

,'乙個'

,'偉大'

,'的'

,'國家'][

'中國'

,'是'

,'乙個'

,'偉大的國家'

]

二級公共基礎之 程式設計

第二章 程式設計基礎 2 1 程式設計設計方法和風格 如何形成良好的程式設計風格 1 源程式文件化 2 資料說明的方法 3 語句的結構 4 輸入和輸出。注釋分序言性注釋和功能性注釋,語句結構清晰第 一 效率第二。2 2 結構化程式設計 結構化程式設計方法的四條原則是 1.自頂向下 2.逐步求精 3....

二級公共基礎(一)

1 演算法的基本概念 1.1演算法 解決方 而完整的描述。演算法不等於程式,也不等於計算方法。1.2基本特性 可行性 確定性 有窮性 擁有足夠的情報 1.3演算法設計的基本方法 例舉法 歸納法 遞推 遞迴 減半遞推法 回溯法 1.4演算法複雜度 演算法複雜度包括時間複雜度和空間複雜度。時間複雜度 執...

二級公共基礎之 軟體工程

第三章 軟體工程基礎 3 1 軟體工程基本概念 計算機軟體是包括程式 資料及相關文件的完整集合。軟體的特點包括 1 軟體是一種邏輯實體 2 軟體的生產與硬體不同,它沒有明顯的製作過程 3 軟體在執行 使用期間不存在磨損 老化問題 4 軟體的開發 執行對計算機系統具有依賴性,受計算機系統的限制,這導致...