臥龍崗大學厲萬慶老師訪問ZZUNLP交流記錄

2021-10-01 17:19:00 字數 765 閱讀 6091

一定要把問題和方法區分開,不要混為一談。根據問題和方法,發文章有兩條途徑:(1)研究乙個新的問題,使用一種已有的方法;(2)研究乙個老問題,提出一種新方法。相比這兩種途徑,第一種就稍容易,因為第二種需要和已有的方法比較performance。

定義問題時一定要具體。例如,某學生說「我要做文字糾錯」,「文字糾錯」是乙個很大的範疇,要在這個範疇下,定義乙個具體的問題。

看文章的方法看不懂時,怎麼辦?看到公式懂時,怎麼辦?

要先看方法或公式的原理,補充基礎知識。原理就好比,這個方法或公式的理論思想是什麼。基礎知識就比如,看到temporal convolutional network時,convolutional network就是基礎知識。

基礎知識如何補?不要看書,看書太慢了,要看blog,大概花半天時間就補齊。在學習**的時候,如果想要讀懂,需要擴充套件很多知識,因此這個時候缺什麼就要補什麼了。

遇到實驗結果低時,怎麼辦?

要檢查是程式的問題,還是資料集的問題。如何檢查呢?若**提供有**,在**的資料集上執行**,根據實驗結果判斷:(1)若得到相似的實驗結果,說明程式基本上沒有問題,那是資料集的問題。在新的資料集上執行**,找出哪些資料使結果不好,分析這些資料。(2)若不能得到相似的實驗結果,說明程式有問題,需要debug,通過生成中間結果檢查程式。

附:關於具體方法,厲老師提到乙個網路:independently recurrent neural network (indrnn)。indrnn比較適合於語言建模,並且與rnn相比,能構建更深更長的rnn,若有要用的學生,**及技術支援都可以提供。