對分詞的一些看法,最近看到不少,不說不快

2021-08-29 06:34:22 字數 814 閱讀 4878

關於分詞得研究由來已久,最近看到裡類似文章不斷,於是想說說自己的看法。

對於分詞演算法,首先我覺得是乙個數學和文學的問題而非程式設計技術的問題,肯到很多同學不厭其煩的孜孜不倦的追求最完美的分詞程式,其實我看大可不必,當然對於程式設計技術的完美追求是好的,不過應該是力氣用錯了地方。

最先看到的是《

天書般的ictclas分詞系統**(一)

》,在此不對zhenyulu兄的post做任何評價,不過在看到很多人發布自己的分詞**,感覺很多同學在用乙個龐大的工程來鍛鍊自己寫鍊錶的能力,實在覺得浪費資源。分詞是乙個演算法問題,這個也許是只有漢語才存在的問題(英文其實不需要分詞,因為每個單詞用空格隔開了)對於演算法問題是首先需要有了優秀的演算法,才能出現優秀程式,而對於中文分詞,很多同學都用程式的眼光去看待其實是不對的,打個比方,冒泡法排序,演算法已經確定的情況下你的程式再優化也不能超過其理論上限,這個是數學理論所決定好了的,數學是所有科學的基礎,如果向基礎理論挑戰無疑是唐吉坷德挑戰風車一般。程式無非是用計算機語言去詮釋數學的理論,而

面向搜尋的中文分詞設計

一文所發布的程式,個人認為精神可嘉,但行為不可取,因為從根本上的演算法就不夠先進,所以程式出來也不會很出色,如果大家想研究演算法的話,還是先搞好演算法本身,再去用程式證明會比較好一點。

ps一下,說說自己對分詞演算法的一點看法,分次演算法首先要對中文的文法有深入的研究才能提出最優化的演算法,呵呵,所以想搞中文分詞的話最好學好語文先:}。根據自己學習母語二十多年來的一點淺薄經驗來看,中文整句的分詞識別找到謂語是最重要的,因為謂語是構成文法的謂詞結構主要組成部分,謂語一確定,主語賓語的詞分出來就好識別的。

不是自己的主攻方向,不過說點自己的見解,如果有不同意見歡迎討論

對分詞的一些看法,最近看到不少,不說不快

關於分詞得研究由來已久,最近看到裡類似文章不斷,於是想說說自己的看法。對於分詞演算法,首先我覺得是乙個數學和文學的問題而非程式設計技術的問題,肯到很多同學不厭其煩的孜孜不倦的追求最完美的分詞程式,其實我看大可不必,當然對於程式設計技術的完美追求是好的,不過應該是力氣用錯了地方。最先看到的是 天書般的...

GML的一些看法

趨勢 更紮實的理論認識,公式推導,演算法層面 最新最酷的gnn應用 知識圖譜在變得越來越流行,知識圖譜應用到gnn 圖嵌入的新框架。1 更紮實的理論認識,公式推導,演算法層面 what graph neural networks cannot learn depth vs width graph n...

SDN的一些看法

1 驅動力 2 如何改進網路來賺錢與省錢 1 賺錢 在快與精的基礎上來充分發揮創造力,最大程度挖掘網路的潛力。a 快魚吃慢魚,網路資源的建立 更改 釋放要更快。想象一下搭建網路環境進行驗證的經歷吧,需要協調多少物料,花費多少時間,如果可以加快這個驗證過程,對新業務的開發速度大有幫助。b 細節決定成敗...