1. 文字統計
len(text1)#text1從頭到尾的長度,包含單詞和標點符號
set(text2)#獲得text2的詞彙表
sorted(set(text3))#獲得text3詞彙表的排序表
len(set(text4))#獲得text4詞彙表的長度
len(text5)/len(set(text5))#獲得text5的詞彙豐富度,即,每個詞平均使用的次數
text6.count("the")#計數單詞the在文字text6中出現的次數
100*text7.count("a")/len(text7)#計數詞頻
2. 鍊錶操作
sent1=["i","go","to","park","."]#定義鍊錶sent1並賦值
sent2=text1[2:8]#取文字text1的text1[2]到text[7]作為鍊錶sent2的內容
sent3=text2[:5]#把text2[0]到text2[4]賦值給鍊錶sent3
sent4=text3[1000:]#把text3[1000]到text3末尾賦值給鍊錶sent4
sent5=sent3+sent4#連線連個鍊錶,snet3在前,sent4在後
sent5[5]#訪問sent[5]
sent5.index('the')#取乙個詞the在文字中首次出現的索引
sent5[3,7]=["a","suprise"]#鍊錶片段的替換,鍊錶中sent[3]到sent5[6]這四個元素被集體替換為a suprise
《python自然語言處理》筆記
工欲善其事,必先利其器 資源準備 python matplotlib包安裝見我的部落格 通過大量的例子和聯絡,python自然語言處理 將會幫助你 前言 為什麼使用python?操作file.txt檔案,輸出所有字尾是 ing 的詞。coding utf 8 for line in open r d...
《Python自然語言處理》
python自然語言處理 基本資訊 出版社 人民郵電出版社 isbn 9787115333681 出版日期 2014 年6月 開本 16開 頁碼 508 版次 1 1 所屬分類 計算機 軟體與程式設計 python 更多關於 python自然語言處理 內容簡介 書籍計算機書籍 自然語言處理 natu...
自然語言處理
自然語言處理主要步驟包括 2.詞法分析 對於英文,有詞頭 詞根 詞尾的拆分,名詞 動詞 形容詞 副詞 介詞的定性,多種詞意的選擇。比如diamond,有菱形 棒球場 鑽石3個含義,要根據應用選擇正確的意思。3.語法分析 通過語法樹或其他演算法,分析主語 謂語 賓語 定語 狀語 補語等句子元素。4.語...