記錄中文工具包FoolNLTK

2021-10-24 19:03:02 字數 1829 閱讀 5601

安裝foolnltk之前,電腦必須先安裝tensorflow,且 tensorflow的版本不能高於2.0, 如果高於則必須先 uninstalll, 然後在安裝1.x版本的。 我用的python 3.x, 具體如下:

import fool

import warnings

warnings.filterwarnings(

"ignore"

)# 為了防止匯入時警告報紅

fool.cut(

"小王在北京"

)# list of list , 注意jieba這個函式返回的是惰性物件

>>

>>[[

'小王'

,'在'

,'北京'

]]

傳入一句話

fool.pos_cut(

"小王在北京"

)# list of list of tuple

>>

>>

tuple

:(分詞,詞性)[[

('小王'

,'nr'),

('在'

,'p'),

('北京'

,'ns')]

]傳入兩句話時

# 用列表括起來["句子1「,"句子2", "句子3"...]

fool.pos_cut(

["小王在北京"

,"小李在吃炸雞"])

# 每句話構成乙個list

# list of list of tuple

>>

>>[[

('小王'

,'nr'),

('在'

,'p'),

('北京'

,'ns')]

,[('小李'

,'nr'),

('在'

,'p'),

('吃'

,'v'),

('炸雞'

,'n')]

]

text =

["小王在北京"

,"祖國天安門你好啊"

]words, ners = fool.analysis(text)

warnings.filterwarnings(

"ignore"

)print

("words: "

,words)

print

("ners: "

,ners)

words :

list of list of tuple

(分詞,詞性)

ners:

list of list of tuple

(實體位置,實體類別,實體名稱)

# 始終記住:每句話構成乙個 list

>>

>>

words:[[

('小王'

,'nr'),

('在'

,'p'),

('北京'

,'ns')]

,[('祖國'

,'n'),

('天安門'

,'ns'),

('你'

,'r'),

('好'

,'a'),

('啊'

,'y')]

]ners:[[

(0,2

,'person'

,'小王'),

(3,5

,'location'

,'北京')]

,[(2

,5,'location'

,'天安門')]

]

拷貝工具包

常用工具包封裝.懶得引各種雜七八的包,輕量級包.cglib還是需要的 scope provided 1.0.0 copyutils beancopier封裝.提供簡單的單一複製與list複製.不支援自定義建構函式的類的複製.abc abc copyutil copysigle abc class o...

fast align工具包使用踩坑記錄

乙個小小的任務用了兩天時間,踩了無數坑,記錄下來以作警示 構建雙語詞典,用於對新語料的質量進行評分 由已有的質量較高的語料構建雙語詞典,在新的語料上計算每句翻譯對應成功的概率,有乙個閾值,得分較低的語料認為質量差 對已有的較高質量語料進行預處理 雙語語料進行合併 利用fast align工具進行對齊...

Linux VMware tools工具包的安裝

啟動vm中的linux,選擇vmware workstation程式選單中vm install vmware tools.執行 mkdir mnt cdrom mount o ro dev cdrom mnt cdrom vmtools的安裝檔案放在vmware虛擬的cdrom中,首先要mount上...