記錄中文工具包FoolNLTK

安裝foolnltk之前，電腦必須先安裝tensorflow，且 tensorflow的版本不能高於2.0, 如果高於則必須先 uninstalll, 然後在安裝1.x版本的。我用的python 3.x, 具體如下：

import fool
import warnings
warnings.filterwarnings(
"ignore"
)# 為了防止匯入時警告報紅
fool.cut(
"小王在北京"
)# list of list , 注意jieba這個函式返回的是惰性物件
>>
>>[[
'小王'
,'在'
,'北京'
]]

傳入一句話
fool.pos_cut(
"小王在北京"
)# list of list of tuple 
>>
>>
tuple
:(分詞，詞性)[[
('小王'
,'nr'),
('在'
,'p'),
('北京'
,'ns')]
]傳入兩句話時
# 用列表括起來["句子1「，"句子2"， "句子3"...]
fool.pos_cut(
["小王在北京"
,"小李在吃炸雞"])
# 每句話構成乙個list
# list of list of tuple
>>
>>[[
('小王'
,'nr'),
('在'
,'p'),
('北京'
,'ns')]
,[('小李'
,'nr'),
('在'
,'p'),
('吃'
,'v'),
('炸雞'
,'n')]
]

text =
["小王在北京"
,"祖國天安門你好啊"
]words, ners = fool.analysis(text)
warnings.filterwarnings(
"ignore"
)print
("words: "
,words)
print
("ners: "
,ners)
words :
list of list of tuple
(分詞，詞性）
ners:
list of list of tuple
(實體位置，實體類別，實體名稱）
# 始終記住：每句話構成乙個 list
>>
>>
words:[[
('小王'
,'nr'),
('在'
,'p'),
('北京'
,'ns')]
,[('祖國'
,'n'),
('天安門'
,'ns'),
('你'
,'r'),
('好'
,'a'),
('啊'
,'y')]
]ners:[[
(0,2
,'person'
,'小王'),
(3,5
,'location'
,'北京')]
,[(2
,5,'location'
,'天安門')]
]

拷貝工具包

常用工具包封裝.懶得引各種雜七八的包,輕量級包.cglib還是需要的 scope provided 1.0.0 copyutils beancopier封裝.提供簡單的單一複製與list複製.不支援自定義建構函式的類的複製.abc abc copyutil copysigle abc class o...

fast align工具包使用踩坑記錄

乙個小小的任務用了兩天時間，踩了無數坑，記錄下來以作警示構建雙語詞典，用於對新語料的質量進行評分由已有的質量較高的語料構建雙語詞典，在新的語料上計算每句翻譯對應成功的概率，有乙個閾值，得分較低的語料認為質量差對已有的較高質量語料進行預處理雙語語料進行合併利用fast align工具進行對齊...

Linux VMware tools工具包的安裝

啟動vm中的linux，選擇vmware workstation程式選單中vm install vmware tools.執行 mkdir mnt cdrom mount o ro dev cdrom mnt cdrom vmtools的安裝檔案放在vmware虛擬的cdrom中，首先要mount上...

記錄中文工具包FoolNLTK

拷貝工具包

fast align工具包使用踩坑記錄

Linux VMware tools工具包的安裝

相關推薦