jieba基礎使用

2022-07-26 16:24:12 字數 538 閱讀 9417

jieba庫分詞的三種模式:

1、精準模式:把文字精準地分開,不存在冗餘

2、全模式:把文中所有可能的詞語都掃瞄出來,存在冗餘

3、搜尋引擎模式:在精準模式的基礎上,再次對長詞進行切分

函式

功能

jieba.lcut(s)

精確模式,返回list型別

jieba.lcut(s,cut_all=true)

全模式模式,返回list型別

jieba.lcut_for_search(s)

搜尋引擎模式,返回list型別

jieba.cut(s)

精確模式,返回可迭代物件

jieba.cut(s,cut_all=true)

全模式模式,返回可迭代物件

jieba.cut_for_search(s)

搜尋引擎模式,返回可迭代物件

jieba.add_word("新增詞")

在分詞詞典中新增新詞

jieba使用教程

0 安裝 在cmd 命令列 輸入 pip install jieba 1 分詞 import jieba seg str 上海自來水廠生產的自來水來自海上 jieba.lcut seg str 精確模式 試圖將語句最精確的切分,不存在冗餘資料,適合做文字分析 上海 自來水廠 生產 的 自來水 來自 ...

jieba庫的使用

jieba是優秀的中文分詞第三方庫 中文文字需要通過分詞獲得單個的詞語 jieba是優秀的中文分詞第三方庫,需要額外安裝 jieba庫提供三種分詞模式,最簡單只需掌握乙個函式 cmd命令列 pip install jieba jieba分詞依靠中文詞庫 利用乙個中文詞庫,確定漢字之間的關聯概率 漢字...

jieba的簡單使用

直接上 吧 coding utf 8 import jieba import jieba.posseg as pseg import os,sys from sklearn import feature extraction from sklearn.feature extraction.text ...