python自然語言處理學習資源彙總

2021-07-28 06:58:55 字數 766 閱讀 3132

--------------------------2017.4.18更新-----------------------------

因為pypi的官網並不全。。並不全。。。不全。。。。(抑或是並沒有上面這個鏈結這麼使用方便、一目了然導致我找不到)

--------------------------原文-------------------

1.nltk:

[命令]pip install nltk

2.numpy:

[命令]pip install numpy

3. (一不留神下下來五個包,是被**安裝了麼。本來只想下matplotlib~~qwq)

cycler-0.10.0functools32-3.2.3.post2  matplotlib-2.0.0 python-dateutil-2.6.0 pytz-2016.10

[命令]pip install -u pip setuptools

pip install matplotlib

4.結巴分詞:

命令:pip install jieba

二、學習資源彙總(部分資源需要csdn積分)

自然語言處理學習記錄

v set text1 long words w for w in v if len w 15 找出長度大於7並且出現頻率大於7的單詞 fdisi5 freqdist text5 sorted w for w in set text5 if len w 7 and fdist5 w 7 檢視文字中詞...

《Python自然語言處理》學習筆記(二)

今天的內容涉及對語言簡單的統計和python基本控制流程 if,for 一.計算語言 1.頻率分布 freqdist函式 需要乙個文字作為引數,返回一組鍵值對,鍵是單詞,值時單詞在文中出現的次數。fdist1 freqdist text1 plot函式 通過引數,可以繪製單詞的頻率圖,或者累積頻數圖...

自然語言處理學習筆記 006

常用的分詞方法 自然語言處理常用的分詞方法有正向和逆向最大匹配 最短路徑 全切分 最大概率 n 最短路徑等方法。現在流行起來的還有最大熵模型 hmm模型 決策樹 bp神經網路 n gram等方法。現在我很想把它們在分詞中的聯絡和區別都一一搞清楚。最大匹配分詞方法簡單 容易實現,但是無法解決上面提到的...