jieba是優秀的中文分詞第三方庫
(cmd命令列) pip install jieba
jieba分詞依靠中文詞庫
精確模式、全模式、搜尋引擎模式
jieba.lcut(s)
精確模式,返回乙個列表型別的分詞結果
import jieba
s = jieba.lcut(
"中國是乙個偉大的國家"
)print
(s)
分詞結果
[
'中國'
,'是'
,'乙個'
,'偉大'
,'的'
,'國家'
]
jieba.lcut(s,cut_all=true)
全模式,返回乙個列表型別的分詞結果,存在冗餘
import jieba
s = jieba.lcut(
"中國是乙個偉大的國家"
,cut_all=
true
)print
(s)
分詞結果
[
'中國'
,'國是'
,'乙個'
,'偉大'
,'的'
,'國家'
]
jieba.lcut_for_search(s)
搜尋引擎模式,返回乙個列表型別的分詞結果,存在冗餘
import jieba
s = jieba.lcut_for_search(
"中華人民共和國是偉大的"
)print
(s)
分詞結果
[
'中華'
,'華人'
,'人民'
,'共和'
,'共和國'
,'中華人民共和國'
,'是'
,'偉大'
,'的'
]
jieba.add_word(w)
向分詞詞典增加新詞w,保證在分詞操作中w不會被分開
import jieba
s = jieba.lcut(
"中國是乙個偉大的國家"
)print
(s)jieba.add_word(
"偉大的國家"
)s = jieba.lcut(
"中國是乙個偉大的國家"
)print
(s)
分詞結果
[
'中國'
,'是'
,'乙個'
,'偉大'
,'的'
,'國家'][
'中國'
,'是'
,'乙個'
,'偉大的國家'
]
二級公共基礎之 程式設計
第二章 程式設計基礎 2 1 程式設計設計方法和風格 如何形成良好的程式設計風格 1 源程式文件化 2 資料說明的方法 3 語句的結構 4 輸入和輸出。注釋分序言性注釋和功能性注釋,語句結構清晰第 一 效率第二。2 2 結構化程式設計 結構化程式設計方法的四條原則是 1.自頂向下 2.逐步求精 3....
二級公共基礎(一)
1 演算法的基本概念 1.1演算法 解決方 而完整的描述。演算法不等於程式,也不等於計算方法。1.2基本特性 可行性 確定性 有窮性 擁有足夠的情報 1.3演算法設計的基本方法 例舉法 歸納法 遞推 遞迴 減半遞推法 回溯法 1.4演算法複雜度 演算法複雜度包括時間複雜度和空間複雜度。時間複雜度 執...
二級公共基礎之 軟體工程
第三章 軟體工程基礎 3 1 軟體工程基本概念 計算機軟體是包括程式 資料及相關文件的完整集合。軟體的特點包括 1 軟體是一種邏輯實體 2 軟體的生產與硬體不同,它沒有明顯的製作過程 3 軟體在執行 使用期間不存在磨損 老化問題 4 軟體的開發 執行對計算機系統具有依賴性,受計算機系統的限制,這導致...