python自然語言處理實戰(一) NLP基礎

2021-09-16 18:53:19 字數 736 閱讀 2548

從建模角度講,為了方便計算機處理,自然語言處理成符號的集合來傳遞資訊,然後通過建立計算機框架來實現語言模型,並且不斷完善這樣的語言模型,還需要根據語言模型來設計各種使用的系統,並且討論這些使用技術的評測技術。從自然語言的角度出發,nlp基本可以分為兩個部分:自然語言處理自然語言生成,演化為理解和生成文字的任務。—這些話理解還不透徹 <__>

nlp的研究任務

機器翻譯、情感分析、智慧型問答、文摘生成,文字分類、**分析、知識圖譜。

nlp相關知識

1.分詞 ( segment ):中文沒有空格作為分隔,中文詞語分析是中文分詞的基礎和關鍵。中文分析最常用的手段是基於字典的最長串匹配。

2.詞性標註 ( part-of-speech tagging ):標註的目的是表證詞的一種隱藏狀態

3.命名實體識別:從文字中識別具有特定類別的實體(通常為名詞)

4.句法分析:往往是一種基於規則的專家系統。目的是解析句子中各個成分的依賴關係,可以解決傳統詞袋模型不考慮上下文的問題。

5.指代消除:中文中代詞出現的頻率很高。

6.情感識別:本質上是分類問題,通常可以基於詞袋模型+分類器,或者現在流行的詞向量模型+rnn,後者比前者準確率略高。

7.糾錯:可以基於n-gram進行糾錯,也可以通過字典樹、有限狀態機等方法進行糾錯。

8.問答系統:往往需要知識識別、合成、自然語言理解、知識圖譜等多項技術配合。

python自然語言處理(一)

1.從nltk的book模組載入所有東西 fromnltk.book import 2.詞語索引檢視。顯示乙個指定單詞的每一次出現,連同上下文一起顯示。text1.concordance monstrous 3.通過索引看到monstrous上下文中有the pictures和the size,查詢...

《Python自然語言處理》

python自然語言處理 基本資訊 出版社 人民郵電出版社 isbn 9787115333681 出版日期 2014 年6月 開本 16開 頁碼 508 版次 1 1 所屬分類 計算機 軟體與程式設計 python 更多關於 python自然語言處理 內容簡介 書籍計算機書籍 自然語言處理 natu...

自然語言處理

自然語言處理主要步驟包括 2.詞法分析 對於英文,有詞頭 詞根 詞尾的拆分,名詞 動詞 形容詞 副詞 介詞的定性,多種詞意的選擇。比如diamond,有菱形 棒球場 鑽石3個含義,要根據應用選擇正確的意思。3.語法分析 通過語法樹或其他演算法,分析主語 謂語 賓語 定語 狀語 補語等句子元素。4.語...