NLTK簡單入門函式小彙總

2021-10-05 08:40:33 字數 976 閱讀 8965

說明:本文**均來自 natural language processing with python

1. concordance(" ")

搜尋某個特定詞語在文章**現的位置,並顯示上下文

2. similar(" ")

搜尋文章中與目標用法、意義相似的詞

3. common_contexts([" "," "])

這個函式和similar有點類似,但是不同的是,這個函式是用來搜尋list中的所有單詞的上下文.即: word1,word2 相同的上下文

4. generate( )

用來自動生成文章,其中輸出時,標點符號被從前面的詞**出去

5. 統計詞彙

(1)len(text):計算text, list等的長度

(2)set(text):去掉list, text中的重複元素

(3)sorted(set(text)):將list, text中的元素按首字母排序(先標點符號再大寫後小寫)

(4)count( ):計算某個特定詞在text,list**現的次數(頻數)

(5)簡單函式:

#建立函式測算某個文字中所有單詞出現的平均次數

def lexical_diversity(text):

return len(text) / len(set(text));

#建立函式測算某個單詞在某個文字中所佔的百分比

def percentage(count, total):

return 100 * count / total;    

print(lexical_diversity(text3));

print(percentage(text4.count("a"), len(text4)));

工具小函式彙總

在前端開發過程中,經常需要運用一些工具小函式來驗證 格式化一些資料,獲取一些引數等等,在這裡整理一下。資料合法性驗證 var legal return reg.test data phone function data d 0 d d 0 d2 d 0 d3 d return reg.test da...

NLTK之搜尋文字的相關入門函式(二)

計數函式 1.len 計算文字長度 以單詞和標點符號為單位 len text1 44764 2.set 用於獲取文字詞彙表 去重 3.sorted 得到乙個詞彙條目的排序表,這個表以各種標點開始,然後接著是以a開頭的詞彙,大寫排在小寫之前。sorted set text3 a abel abidah...

vue router 簡單入門小例項

用vue.js vue router建立單頁應用,是非常簡單的。使用vue.js我們已經可以通過組合元件來組成應用程式,當需要把vue router新增進來,我們需要做 將元件 components 對映到路由 router 然後告訴vue router在 渲染它們。下面例子 於vue官方文件get...