--------------------------2017.4.18更新-----------------------------
因為pypi的官網並不全。。並不全。。。不全。。。。(抑或是並沒有上面這個鏈結這麼使用方便、一目了然導致我找不到)
--------------------------原文-------------------
1.nltk:
[命令]pip install nltk
2.numpy:
[命令]pip install numpy
3. (一不留神下下來五個包,是被**安裝了麼。本來只想下matplotlib~~qwq)
cycler-0.10.0functools32-3.2.3.post2 matplotlib-2.0.0 python-dateutil-2.6.0 pytz-2016.10
[命令]pip install -u pip setuptools
pip install matplotlib
4.結巴分詞:
命令:pip install jieba
二、學習資源彙總(部分資源需要csdn積分)
自然語言處理學習記錄
v set text1 long words w for w in v if len w 15 找出長度大於7並且出現頻率大於7的單詞 fdisi5 freqdist text5 sorted w for w in set text5 if len w 7 and fdist5 w 7 檢視文字中詞...
《Python自然語言處理》學習筆記(二)
今天的內容涉及對語言簡單的統計和python基本控制流程 if,for 一.計算語言 1.頻率分布 freqdist函式 需要乙個文字作為引數,返回一組鍵值對,鍵是單詞,值時單詞在文中出現的次數。fdist1 freqdist text1 plot函式 通過引數,可以繪製單詞的頻率圖,或者累積頻數圖...
自然語言處理學習筆記 006
常用的分詞方法 自然語言處理常用的分詞方法有正向和逆向最大匹配 最短路徑 全切分 最大概率 n 最短路徑等方法。現在流行起來的還有最大熵模型 hmm模型 決策樹 bp神經網路 n gram等方法。現在我很想把它們在分詞中的聯絡和區別都一一搞清楚。最大匹配分詞方法簡單 容易實現,但是無法解決上面提到的...