詞條:類似於「car.n.01.machine"這樣的結構
詞集:類似於「car.n.01」這樣的結構
詞彙:類似於"car", 「machine」, "motorcar"等等
這裡有很多細節需要留意,乙個是每個函式的使用方法,其是由什麼型別的物件呼叫的,是乙個詞集還是乙個詞條,有沒有引數,引數是乙個詞集還是乙個詞彙等等;此外需要留意的,書上很多方法、函式的呼叫都沒有帶最後的空括號,結果並不是預期的輸出,比如lemmas() ,examples()等,下面有具體的解釋。
0. 首先匯入使用的模組:
>>
>
from nltk.corpus import wordnet as wn
1.引數為乙個詞彙的函式(方法)1.1 wn.synsets( ) 同義詞集,引數為某個詞彙
>>
> wn.synsets(
'motorcar'
)[synset(
'car.n.01'
)]
1.2 wn.lemmas( ) 將顯示所有包含該詞彙的詞條、引數為某個詞彙
>>
> wn.lemmas(
'car'
)[lemma(
'car.n.01.car'
), lemma(
'car.n.02.car'
), lemma(
'car.n.03.car'
), lemma(
'car.n.04.car'
), lemma(
'cable_car.n.01.car'
)]
2.由乙個詞集呼叫的函式(方法)2.1synset(『car.n.01』) 這裡是synset不是synsets,其引數是某個詞集,如果只是簡單呼叫這個函式,結果是這樣的:
>>
> wn.synset(
'car.n.01'
)synset(
'car.n.01'
)
2.2 definition( ) 定義,由乙個詞集呼叫
>>
> wn.synset(
'car.n.01'
).definition(
)u'a motor vehicle with four wheels; usually propelled by an internal combustion engine'
2.3 examples( ) 例句,由乙個詞集呼叫
>>
> wn.synset(
'car.n.01'
).examples(
)[u'he needs a car to get to work'
]
2.4 lemma_names( ) 輸出同義詞集中的所有詞,由乙個詞集呼叫
>>
> wn.synset(
'car.n.01'
).lemma_names(
)[u'car'
, u'auto'
, u'automobile'
, u'machine'
, u'motorcar'
]
2.5 lemmas( ) 輸出詞集和詞的配對——詞條,此時沒有引數,可以得到指定同義詞集的所有詞條
>>
> wn.synset(
'car.n.01'
).lemmas(
)[lemma(
'car.n.01.car'
), lemma(
'car.n.01.auto'
), lemma(
'car.n.01.automobile'
), lemma(
'car.n.01.machine'
), lemma(
'car.n.01.motorcar'
)]
3. 由乙個詞條呼叫的函式(方法)3.1 lemma(『詞條』).synset() 顯示所在詞集
>>
> wn.lemma(
'car.n.01.machine'
).synset(
)synset(
'car.n.01'
)
3.2 lemma(『詞條』).name() 顯示該詞條的「名字」>>
> wn.lemma(
'car.n.01.machine'
).name(
)u'machine'
《Python自然語言處理》
python自然語言處理 基本資訊 出版社 人民郵電出版社 isbn 9787115333681 出版日期 2014 年6月 開本 16開 頁碼 508 版次 1 1 所屬分類 計算機 軟體與程式設計 python 更多關於 python自然語言處理 內容簡介 書籍計算機書籍 自然語言處理 natu...
1 自然語言處理描述
資訊時代最重要的技術之一,理解複雜的語言表達方式也是人工智慧重要的一部分。自然語言處理應用無處不再,因為人們基本上所有的事情都是通過語言進行交流。常見的應用 在自然語言處理技術背後有大量的基礎技術任務和機器學習模型。當前,深度學習方法在很多不同的自然語言處理應用中取得了非常好的效能。在深度學習技術中...
自然語言處理
自然語言處理主要步驟包括 2.詞法分析 對於英文,有詞頭 詞根 詞尾的拆分,名詞 動詞 形容詞 副詞 介詞的定性,多種詞意的選擇。比如diamond,有菱形 棒球場 鑽石3個含義,要根據應用選擇正確的意思。3.語法分析 通過語法樹或其他演算法,分析主語 謂語 賓語 定語 狀語 補語等句子元素。4.語...