分詞工具 jieba打包

2021-09-27 09:22:37 字數 431 閱讀 6262

發布的時候遇到的問題

1、需要使用檔案路徑的轉化:(打包成為exe檔案時候網執行的路徑和本地直接執行的路徑有些不同,需要轉化一下,為什麼不同呢?等我找到之後再補充,先給出解決方法)

2、使用第三方包 ,此處是jieba,找不到jieba呼叫的dict檔案的路徑 filenotfounderror:[errno 2] no such file or directory:

解決方式:參考的網頁(

3、生成exe檔案的方法

(1)  pyi-makespec -f test.py

在生成的test.spec 檔案中修改datas屬性,加上需要新增的檔案datas=[('dict','dict'),('img','img').....])

(2) pyinstaller -f  test.spec  生成exe檔案

中文分詞工具 Jieba

jieba分詞值基於規則和統計這兩類方法。其首先基於字首詞典進行詞圖掃瞄,字首詞典是指詞典中的詞按照字首的包含順序排列的,從而形成一種層級包含結構。這種字首詞典的好處便是可以快速構建包含全部可能分詞結果的有向無環圖,這個圖包含多條分詞路徑,無環是指節點間不構成閉環。然後基於標註語料,使用動態規劃演算...

jieba 利用jieba分詞

目錄 三種分詞模式 新增自定義詞典進行分詞 jieba提供了三種分詞模式,分別是全模式,精確模式和搜尋引擎模式。全模式下會將所有可能的詞語都進行分詞,精確模式下會盡可能的將句子精確切開,搜尋引擎模式實在精確模式的基礎上,對長詞再進行劃分,提高分詞的召回率。使用cut和cut for search即可...

jieba分詞工具詞性標記含義

jieba為自然語言語言中常用工具包,jieba不僅僅是乙個分詞工具,它還具有對分詞的詞性進行標註的功能,詞性類別如下 ag形語素 形容詞性語素。形容詞 為 a,語素 前面置以a。a形容詞 取英語形容詞 adjective的第1個字母。ad副形詞 直接作狀語的形容詞。形容詞 a和副詞 d並在一起。a...