自然語言處理領域的兩種創新觀念
張俊林timestamp:2023年11月26日
但是,目前nlp學術研究基本上處於發展平台期,就是說大局已定,能做的就是在一些細枝末節的方向上做些修修補補的工作,你去看acl/coling這些最高端別的國際會議的**就知道所言非虛,乙個研究領域進入平台期
的標誌是:假設你幾年不看**,等想起來去看最新的**,發現大家還是在乙個圈子裡面繞來繞去的。現在的研究圈子模式已經變成了:
各種數學模型是乙個萬能工具箱,研究人員從這個工具箱裡面取出不同的工具,然後用這些工具來進行修修補補的工作。場景基本上如下: a博士說了:你用隱馬爾科夫分詞?那我用隱馬爾科夫標註詞性;此時又跳出來一位b博士:你們太落後了,居然還在玩隱馬爾科夫?我都玩到最大熵了。話音未落,c博士飛起一腳把b博士踢**去:瞧你那熊樣,還最大熵呢?你以為現在才是二十一世紀初啊(b博士敬佩而又無辜的眼光望著台上的c博士,撓著頭想:難道現在不是二十一世紀初麼),聽說過crf麼?我不僅crf了,我都crf好幾年了。
總而言之,現在nlp研究基本上和補鞋匠的工作有的一拼。就好像用不同型號的膠水來補不同牌子的鞋子一樣,看著挺熱鬧,其實沒啥意思在補也不能把一雙布鞋補成一雙運動鞋,頂多是把一雙破布鞋補成看上去不那麼破的布鞋而已。有時候,補完乙個小洞後又露出乙個大洞,只是布鞋匠不說而已。
說說我理解的nlp的兩種創新。其實,其他領域估計也差不多,而且,我的看法看起來相當象廢話,其實基本上就是廢話,世上廢話本來就很多,
在多兩句也無妨。
一種創新是研究模式的顛覆,這需要大智慧型,是所謂的大創新。就像剛開始的規則方法的出現,後來統計方法的一枝獨秀,再到最近的大家都嚷嚷要把統計和規則結合起來搞。當然,我個人對兩者結合的效果持懷疑態度,因為以我愚鈍的智力看不出兩者到底有多大的互補性,至於是否真有效那就走著瞧吧。現在需要的是一種完全不同的處理思路,至於是什麼,估計誰也不知道,nlp呼喚愛因斯坦。
另外一種創新是應用創新,就是說大家採用的核心技術其實差不多,都那麼點貨,其實你也不用藏著掖著,你怎麼做的外人不知道,內人
還不知道麼?這個時候最好的方法是用同樣的核心技術做不一樣的應用。應用創新可能是目前更加值得關注的創新方法。
GitHub專案 自然語言處理領域的相關乾貨整理
自然語言處理 nlp 是電腦科學,人工智慧,語言學關注計算機和人類 自然 語言之間的相互作用的領域。本文作者為nlp初學者整理了乙份龐大的自然語言處理領域的概覽。選取的參考文獻與資料都側重於最新的深度學習研究成果。這些資源能為想要深入鑽研乙個nlp任務的人們提供乙個良好的開端。指代消解 自動評分 自...
GitHub專案 自然語言處理領域的相關乾貨整理
自然語言處理 nlp 是電腦科學,人工智慧,語言學關注計算機和人類 自然 語言之間的相互作用的領域。本文作者為nlp初學者整理了乙份龐大的自然語言處理領域的概覽。選取的參考文獻與資料都側重於最新的深度學習研究成果。這些資源能為想要深入鑽研乙個nlp任務的人們提供乙個良好的開端。指代消解 自動評分 自...
人工智慧自然語言處理技術處理專業領域的運用
自然語言處理 nlp 是現代電腦科學和人工智慧領域的乙個重要分支,是一門融合了語言學 數學 電腦科學的科學。這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯絡,但又有重要的區別。自然語言處理並不是一般地研究自然語言,而在於研製能有效地實現自然語言通訊的計算機系統,...