摘錄一些關於ansj的一些詞性標註集,方便程式設計對文字的處理。
n 名詞
nr 人名
nr1 漢語姓氏
nr2 漢語名字
nrj 日語人名
nrf 音譯人名
ns 地名
nsf 音譯地名
nt 機構團體名
nz 其它專名
nl 名詞性慣用語
ng 名詞性語素
nw 新詞
t 時間詞
tg 時間詞性語素
s 處所詞
f 方位詞
v 動詞
vd 副動詞
vn 名動詞
vshi 動詞「是」
vyou 動詞「有」
vf 趨向動詞
vx 形式動詞
vi 不及物動詞(內動詞)
vl 動詞性慣用語
vg 動詞性語素
a 形容詞
ad 副形詞
an 名形詞
ag 形容詞性語素
al 形容詞性慣用語
b 區別詞
bl 區別詞性慣用語
z 狀態詞
r 代詞
rr 人稱代詞
rz 指示代詞
rzt 時間指示代詞
rzs 處所指示代詞
rzv 謂詞性指示代詞
ry 疑問代詞
ryt 時間疑問代詞
rys 處所疑問代詞
ryv 謂詞性疑問代詞
rg 代詞性語素
m 數詞
mq 數量詞
q 量詞
qv 動量詞
qt 時量詞
d 副詞
p 介詞
pba 介詞「把」
pbei 介詞「被」
c 連詞
cc 並列連詞
u 助詞
uzhe 著
ule 了 嘍
uguo 過
ude1 的 底
ude2 地
ude3 得
usuo 所
udeng 等 等等 云云
uyy 一樣 一般 似的 般
udh 的話
uls 來講 來說 而言 說來
uzhi 之
ulian 連 (「連小學生都會」)
e 嘆詞
y 語氣詞(delete yg)
o 擬聲詞
h 字首
k 字尾
x 字串
xx 非語素字
xu **url
w 標點符號
wkz 左括號,全形:( 〔 [ { 《 【 〖〈 半形:( [ { <
wky 右括號,全形:) 〕 ] } 》 】 〗 〉 半形: ) ] { >
wyz 左引號,全形:「 『 『
wyy 右引號,全形:」 』 』
wj 句號,全形:。
ww 問號,全形:? 半形:?
wt 嘆號,全形:! 半形:!
wd 逗號,全形:, 半形:,
wf 分號,全形:; 半形: ;
wn 頓號,全形:、
wm 冒號,全形:: 半形: :
ws 省略號,全形:…… …
wp 破折號,全形:—— -- ——- 半形:— —-
wb 百分號千分號,全形:% ‰ 半形:%
wh 單位符號,全形:¥ $ £ ° ℃ 半形:$
pip的一些命令集
記錄一下 往後忘了也可以看看 安裝模組 pip install packagename 更新模組 pip install u packagename 解除安裝模組 pip uninstall packagename 檢視已經過期的模組 pip list outdated 公升級pip版本 pytho...
資料集整理的一些技巧
如果想把資料集劃分成 訓練集 測試集的話,步驟如下 所用方式為 np.random.randint start,end,shape 和np.random.shuffle temp temp np.random.randint 1,100,100 print temp np.random.shuffl...
並查集的一些理解
從最基本的並查集之後引申到帶權並查集 抽象出種類並查集 實際上都是維護乙個又乙個集合之間的關係 並查集主要寫兩個函式find和merge find函式可以寫成路徑壓縮 或者 按秩合併 或者兩個同時寫 但一般單獨的路徑壓縮就可以了 find函式需要注意的是在find函式內維護陣列 需要等回溯時再維護 ...