賓州中文樹庫PCTB

2021-09-26 06:20:42 字數 1860 閱讀 4221

標記 英文解釋 中文解釋

ad adverbs 副詞

as aspect marker 體態詞,體標記(例如:了,在,著,過)

ba 把 in ba-const 「把」,「將」的詞性標記

cc coordinating conjunction 並列連詞,「和」

cd cardinal numbers 數字,「一百」

cs subordinating conj 從屬連詞(例子:若,如果,如…)

dec 的 for relative-clause etc 「的」詞性標記

deg associative 聯結詞「的」

der in v-de construction, and v-de-r 「得」

dev before vp 地

dt determiner 限定詞,「這」

etc tag for words, in coordination phrase 等,等等

fw foreign words 例子:iso

ij interjetion 感嘆詞

jj noun-modifier other than nouns

lb in long bei-construction 例子:被,給

lc localizer 定位詞,例子:「裡」

m measure word(including classifiers) 量詞,例子:「個」

msp some particles 例子:「所」

nn common nouns 普通名詞

nr proper nouns 專有名詞

nt temporal nouns 時序詞,表示時間的名詞

od ordinal numbers 序數詞,「第一」

on onomatopoeia 擬聲詞,「哈哈」

p preposition (excluding 把 and 被) 介詞

pn pronouns 代詞

pu punctuations 標點

sb in long bei-construction 例子:「被,給」

sp sentence-final particle 句尾小品詞,「嗎」

va predicative adjective 表語形容詞,「紅」

vc copula 系動詞,「是」

ve 有 as the main verb 「有」

vv other verbs 其他動詞

例項一:

「理論書也能那麼好看!」盛夏七月,由中宣部理論局組織編寫的「理論熱點面對面2019」——《新中國發展面對面》與讀者見面,引發學習熱潮,贏得讀者點讚。該書靈活呈現對比、專家聲音、國外評價等內容,深入淺出解讀理論,有力展現了新中國成立70年來的偉大歷程、輝煌成就和寶貴經驗。

「/pu 理論/nn 書/nn 也/ad 能 那麼 好看/va !/pu 」pu 盛夏/nt 七月/nt ,/pu 由/p 中宣部/nr 理論/nn 局/nn 組織/nn 編寫/vv 的/dec 「/pu 理論/nn 熱點/nn 面對面/vv 2019/nt 」/pu —/pu —/pu 《/pu 新中國/nr 發展/vv 面對面/vv 》/pu 與/ 讀者/nn 見面/vv ,/pu 引發/vv 學習/vv 熱潮/nn ,/pu 贏得/vv 讀者/nn 點/nn 贊/vv 。/pu 該書/nn 靈活/va 呈現/vv /nn 對比/vv 、/pu 專家/nn 聲音/nn 、/pu 國外/nn 評價/vv 等/etc 內容/nn ,/pu深入淺出/ 解讀/vv 理論/nn ,/pu 有力 展現/vv 了/as 新中國/nr 成立/vv 70/nt 年/nn 來的/deg 偉大/va 歷程/nn 、/pu 輝煌/va 成就/nn 和/cc 寶貴/va 經驗/nn 。/pu  

心得:還有很多的詞把握地不准,不太理解和明白,還要進行學習,希望在今後的學習中提高自己。

中文無庫取詞

最近看吳軍博士的 數學之美 對自然語言處理非常感興趣,驚嘆於數學之美。於是自己抽空實現了乙個無庫取詞方法。下面針對實現方法和遇到的一些問題做一些分享。首先要知道計算機不是人,並不了解中文語句中哪些是詞語。那我們如何利用計算機得到詞語呢?很簡單,用它最基本的功能 計算。廢話不多說,讓我們一起認識數學的...

Linux裝置樹中文手冊

接下來的部分指定了5中所需要的裝置節點的基本集的需求 所有裝置樹有乙個根節點,並且在根節點下面必須列出如下節點 每個裝置樹有乙個根節點,其他的裝置節點是子節點。完整的根節點是 裝置樹可能有乙個 aliases 節點 aliases 它定義乙個或多個 aliases 屬性.aliases 節點必須在裝...

python庫 jieba 中文分詞

import jieba 精確模式,試圖將句子最精確地切開,適合文字分析 全模式,把句子中所有的可以成詞的詞語都掃瞄出來,速度非常快,但是不能解決歧義 搜尋引擎模式,在精確模式的基礎上,對長詞再次切分,提高召回率,適合用於搜尋引擎分詞。cut sentence 需要分詞的字串 cut all f 是...