文章**:
計算機語言學家羅蘋森總結了依存語法的四條定理:
乙個句子中存在乙個成分稱之為根(root),這個成分不依賴於其它成分;
其它成分直接依存於某一成分;
任何乙個成分都不能依存與兩個或兩個以上的成分;
如果a成分直接依存於b成分,而c成分在句中位於a和b之間,那麼c或者直接依存於b,或者直接依存於a和b之間的某一成分;
中心成分左右兩面的其它成分相互不發生關係。
使用斯坦福句法分析器做依存句法分析可以輸出句子的依存關係,stanford parser基本上是乙個詞彙化的概率上下文無關語法分析器,同時也使用了依存分析。
下面是對分析的結果中一些符號的解釋:
root:要處理文字的語句
ip:簡單從句
np:名詞短語
vp:動詞短語
pu:斷句符,通常是句號、問號、感嘆號等標點符號
lcp:方位詞短語
pp:介詞短語
cp:由『的』構成的表示修飾性關係的短語
dnp:由『的』構成的表示所屬關係的短語
advp:副詞短語
adjp:形容詞短語
dp:限定詞短語
qp:量詞短語
nn:常用名詞
nr:固有名詞
nt:時間名詞
pn:代詞
vv:動詞
vc:是
cc:表示連詞
ve:有
va:表語形容詞
as:內容標記(如:了)
vrd:動補複合詞
cd: 表示基數詞
dt: determiner 表示限定詞
ex: existential there 存在句
fw: foreign word 外來詞
in: preposition or conjunction, subordinating 介詞或從屬連詞
jj: adjective or numeral, ordinal 形容詞或序數詞
jjr: adjective, comparative 形容詞比較級
jjs: adjective, superlative 形容詞最高端
ls: list item marker 列表標識
md: modal auxiliary 情態助動詞
pdt: pre-determiner 前位限定詞
pos: genitive marker 所有格標記
prp: pronoun, personal 人稱代詞
rb: adverb 副詞
rbr: adverb, comparative 副詞比較級
rbs: adverb, superlative 副詞最高端
rp: particle 小品詞
sym: symbol 符號
to:」to」 as preposition or infinitive marker 作為介詞或不定式標記
wdt: wh-determiner wh限定詞
wp: wh-pronoun wh代詞
wp$: wh-pronoun, possessive wh所有格代詞
wrb:wh-adverb wh副詞
subj — 主語
nsubj — 名詞性主語(nominal subject) (同步,建設)
top — 主題(topic) (是,建築)
npsubj — 被動型主語(nominal passive subject),專指由「被」引導的被動句中的主語,一般是謂詞語義上的受事 (稱作,鎳)
csubj — 從句主語(clausal subject),中文不存在
xsubj — x主語,一般是乙個主語下面含多個從句 (完善,有些)
中心語為謂詞或介詞
obj — 賓語
dobj — 直接賓語 (頒布,檔案)
iobj — 間接賓語(indirect object),基本不存在
range — 間接賓語為數量詞,又稱為與格 (成交,元)
pobj — 介詞賓語 (根據,要求)
lobj — 時間介詞 (來,近年)
中心語為謂詞
comp — 補語
ccomp — 從句補語,一般由兩個動詞構成,中心語引導後乙個動詞所在的從句(ip) (出現,納入)
xcomp — x從句補語(xclausal complement),不存在
acomp — 形容詞補語(adjectival complement)
tcomp — 時間補語(temporal complement) (遇到,以前)
lccomp — 位置補語(localizer complement) (佔,以上)
— 結果補語(resultative complement)
mod — 修飾語(modifier)
pass — 被動修飾(passive)
tmod — 時間修飾(temporal modifier)
rcmod — 關係從句修飾(relative clause modifier) (問題,遇到)
numod — 數量修飾(numeric modifier) (規定,若干)
ornmod — 序數修飾(numeric modifier)
clf — 類別修飾(classifier modifier) (檔案,件)
nmod — 復合名詞修飾(noun compound modifier) (浦東,上海) amod — 形容詞修飾(adjetive modifier) (情況,新)
advmod — 副詞修飾(adverbial modifier) (做到,基本)
vmod — 動詞修飾(verb modifier,participle modifier)
prnmod — 插入詞修飾(parenthetical modifier)
neg — 不定修飾(negative modifier) (遇到,不)
det — 限定詞修飾(determiner modifier) (活動,這些) possm — 所屬標記(possessive marker),np
poss — 所屬修飾(possessive modifier),np
dvpm — dvp標記(dvp marker),dvp (簡單,的)
dvpmod — dvp修飾(dvp modifier),dvp (採取,簡單)
assm — 關聯標記(associative marker),dnp (開發,的)
assmod — 關聯修飾(associative modifier),np|qp (教訓,特區) prep — 介詞修飾(prepositional modifier) np|vp|ip(採取,對) clmod — 從句修飾(clause modifier) (因為,開始)
plmod — 介詞性地點修飾(prepositional localizer modifier) (在,上) asp — 時態標詞(aspect marker) (做到,了)
partmod– 分詞修飾(participial modifier) 不存在
etc — 等關係(etc) (辦法,等)
conj — 聯合(conjunct)
cop — 系動(copula) 雙指助動詞????
cc — 連線(coordination),指中心詞與連詞 (開發,與)
attr — 屬性關係 (是,工程)
cordmod– 並列聯合動詞(coordinated verb compound) (頒布,實行) mmod — 情態動詞(modal verb) (得到,能)
ba — 把字關係
tclaus — 時間從句 (以後,積累)
— semantic dependent
cpm — 補語化成分(complementizer),一般指「的」引導的cp (振興,的)
心 依在漂泊
不知何時,放下了文筆,放下了曾經的浪漫,開始尋覓,傳說中的現實。一直憧憬著外面的美好,憧憬著未來的一天,自己會驚喜的發現,原來,自己的幸福就在那個角落裡微笑 每天沿著自己的路線前進,時而散步,時而慢跑,時而疾馳,總會忽然想起,曾經的某個畫面,是那樣溫馨舒服,總會忽然失落,曾經的人,已漸漸遠去 身邊的...
依青山傍綠水
上午開了個會,會議的內容已經記不清了,但開會的地方卻讓我印象深刻。以前,遠遠的看過幾次,門口經過了幾次,只是沒有機會進去過。從公司出來,車行5分鐘就來到觀綠路,湖面微波蕩漾,湖邊楊柳依依,馬路平整寬闊,路上幾乎沒有什麼車輛,忍不住深踏油門,車子飛奔起來,開啟車窗,讓新鮮空氣充滿車廂。每次開到這裡都會...
浪花依呂波
size 18 color red 2006 06 23 color size color blue 浪花依呂波 color 友 輪 心 踴 人 人 花 浪花 節!世 楽 散 人 世 移 変 誰 何 立 立 勤 毎日 苦労 浪花根性 根性!返 返 無 空見上 笑 飛 生 幸 飛 笑 角 福 來 迷 ...