pyltp目前支援puthon3.6不支援3.7
用python3.7安裝了很久都沒有安裝成功
無奈換成了3.6
frompyltp import sentencesplitter
sents = sentencesplitter.split('
元芳你怎麼看?我就趴視窗上看唄!
') # 分句
切割句子。
分詞
import osfrom
pyltp import segmentor
ltp_data_dir='
d:\python3.6\ltp3.4\ltp3.4
'cws_model_path=os.path.join(ltp_data_dir,'
cws.model')
segmentor=segmentor()
segmentor.load(cws_model_path)
words=segmentor.segment('
熊高雄你吃飯了嗎')
使用awk sort uniq進行文字分析
問題 處理一下檔案內容,將網域名稱取出並根據網域名稱進行計數排序處理 root web01 cat access.log 此類問題是運維工作中最常見的問題。可以演變成分析日誌,檢視tcp各個狀態連線數,檢視單ip連線數排名等等。root web01 awk f access.log sort uni...
使用python進行文字分類
coding utf 8 author lishuai importnumpy defloaddataset postinglist my dog has flea problems help please maybe not take him to dog park stupid my dalma...
使用filter進行文字替換
問題描述 filter的使用很簡便,如下示例為檔案拷貝過程中進行文字替換。可以很簡便的設定begintoken及endtoken來定義要被替換的文字的前後定界符,預設為 可以自定義其他定界符。然而,當我們的文字中沒有!等特殊符號時該怎麼辦呢,如下面的oldfile.txt.fowjow was ho...