mynlp的人名識別是基於結構化感知機、序列標註模型的實現。獨特之處在於特徵函式和label的設計和其他nlp工具的差別。
該人名識別演算法是基於字元輸入的,也就是說不需要預先分詞,直接從文字中提取人名,
天然具有歧義識別。在pku資料集上,最終f1達94.91,如果剔除古漢語人名的影響,f1可以更高。
呼叫非常簡單
>
>
com.mayabot.mynlpgroupid
>
>
mynlp-segmentartifactid
>
>
3.0.0version
>
dependency
>
perceptronpersonnameservice pps = mynlps.
instanceof
(perceptronpersonnameservice.
class);
list
names = pps.
findname
(" 黃英男 12345328978 湖南婁底雙峰a街道華洪水大廈a座102");
list
names2 = pps.
findname
("小明送給張賀年老師一張賀年卡");
system.out.
println
(names)
; system.out.
println
(names2)
;
輸出:
[personname(name=黃英男, offset=1)]
[personname(name=小明, offset=0), personname(name=張賀年, offset=4)]
注意:在第二句例項中,有兩次出現(張賀年),自動判斷第二個不是人名。
該模型大小為11.5m,記憶體占用45m。
C 中的高效能計時器
原帖及討論 http bbs.bccn.net thread 211272 1 1.html 簡介精確的時間計量方法在某些應用程式中是非常重要的。常用的 windows api 方法 gettickcount 返回系統啟動後經過的毫秒數。另一方面,gettickcount 函式僅有 1ms 的分辨精...
《高效能MySQL》閱讀 MySQL中的事務
20210107 22 00 23 00 承接 高效能mysql 閱讀 mysql架構和歷史 一 一頁書 詩號 世事如棋,乾坤莫測,笑盡英雄啊!9.mysql中的事務 1.mysql中提供了兩種事務型擎innodb和ndbcluster,2.mysql預設是自動提交事務的,就是如果不是顯示的開始乙個...
高效能MySQL中的三星索引
我對此提出了深深的疑問 一星 相關的記錄指的是什麼?相關這個詞很深奧,相關部門 是什麼部門 二星 如果建立了b tree b tree 索引,資料就有序了。三星 索引的列包含了查詢需要所有的列?根本不需要在where查詢條件所有的列上建立索引!我認為一星和二星的rows應該是columns,索引不關...