安裝foolnltk之前,電腦必須先安裝tensorflow,且 tensorflow的版本不能高於2.0, 如果高於則必須先 uninstalll, 然後在安裝1.x版本的。 我用的python 3.x, 具體如下:
import fool
import warnings
warnings.filterwarnings(
"ignore"
)# 為了防止匯入時警告報紅
fool.cut(
"小王在北京"
)# list of list , 注意jieba這個函式返回的是惰性物件
>>
>>[[
'小王'
,'在'
,'北京'
]]
傳入一句話
fool.pos_cut(
"小王在北京"
)# list of list of tuple
>>
>>
tuple
:(分詞,詞性)[[
('小王'
,'nr'),
('在'
,'p'),
('北京'
,'ns')]
]傳入兩句話時
# 用列表括起來["句子1「,"句子2", "句子3"...]
fool.pos_cut(
["小王在北京"
,"小李在吃炸雞"])
# 每句話構成乙個list
# list of list of tuple
>>
>>[[
('小王'
,'nr'),
('在'
,'p'),
('北京'
,'ns')]
,[('小李'
,'nr'),
('在'
,'p'),
('吃'
,'v'),
('炸雞'
,'n')]
]
text =
["小王在北京"
,"祖國天安門你好啊"
]words, ners = fool.analysis(text)
warnings.filterwarnings(
"ignore"
)print
("words: "
,words)
print
("ners: "
,ners)
words :
list of list of tuple
(分詞,詞性)
ners:
list of list of tuple
(實體位置,實體類別,實體名稱)
# 始終記住:每句話構成乙個 list
>>
>>
words:[[
('小王'
,'nr'),
('在'
,'p'),
('北京'
,'ns')]
,[('祖國'
,'n'),
('天安門'
,'ns'),
('你'
,'r'),
('好'
,'a'),
('啊'
,'y')]
]ners:[[
(0,2
,'person'
,'小王'),
(3,5
,'location'
,'北京')]
,[(2
,5,'location'
,'天安門')]
]
拷貝工具包
常用工具包封裝.懶得引各種雜七八的包,輕量級包.cglib還是需要的 scope provided 1.0.0 copyutils beancopier封裝.提供簡單的單一複製與list複製.不支援自定義建構函式的類的複製.abc abc copyutil copysigle abc class o...
fast align工具包使用踩坑記錄
乙個小小的任務用了兩天時間,踩了無數坑,記錄下來以作警示 構建雙語詞典,用於對新語料的質量進行評分 由已有的質量較高的語料構建雙語詞典,在新的語料上計算每句翻譯對應成功的概率,有乙個閾值,得分較低的語料認為質量差 對已有的較高質量語料進行預處理 雙語語料進行合併 利用fast align工具進行對齊...
Linux VMware tools工具包的安裝
啟動vm中的linux,選擇vmware workstation程式選單中vm install vmware tools.執行 mkdir mnt cdrom mount o ro dev cdrom mnt cdrom vmtools的安裝檔案放在vmware虛擬的cdrom中,首先要mount上...