原文出處:
(2)做一些非常簡單的nlp入門小任務,通過小任務理解自然語言處理的流程(包括中英文nlp處理流程的差別);
(3)快速學習一門開發nlp技術的程式語言(基本就是python了,不需要學習網路程式設計等部分,重點掌握python基本語法、檔案讀寫與編碼、正規表示式、gensim、numpy、pandas、matplotlib等的使用);
(4)學習機器學習的相關概念,如:模型評估與選擇、有監督學習、半監督學習、無監督學習、強化學習、遷移學習(只需要學習和認識其原理,做到心中有數即可);
(6)了解國內外nlp的協會組織(如:中文資訊學會、中文資訊學會青年工作委員會、acl等,主要查詢和閱讀協會開闢的專欄、組織撰寫的綜述、看看最近都組織了什麼會議和比賽等)、主要的大型nlp科研團隊(斯坦福、多倫多、清華、北大、哈工大、復旦、中科、deepmind、google brain、openai等高校、院所和科研機構的自然語言處理小組,看看他們都在研究什麼);
復旦大學邱錫鵬組實驗室新生一般完成的五個nlp練習上手實驗(nlp四大類任務:分類、序列標註、文字匹配、文字生成,都需要完整實現一遍)。
自動化所宗成慶研究員:讀懂nlp的過去與現在(梳理的非常好,把各個概念之間的關係和nlp的發展都梳理清楚了)
中文自然語言處理入門實戰
自然語言處理全家福:縱覽當前nlp中的任務、資料、模型與**
中文資訊處理發展報告(綜述由中文資訊學會統籌,國內各大nlp專家撰寫,非常適合入門了解nlp)
jumping nlp curves: a review of natural language processing research [review article]
natural language processing: a review
a review of the neural history of natural language processing
鄧力和劉洋大神合著的圖書《deep learning in natural language processing
宗成慶研究員所著《統計自然語言處理》(經典之作)
steven bird所著《python自然語言處理》(快速掌握python開發nlp技術的各種能力)
機器學習 → 推薦周志華教授所著的《機器學習》
深度學習 → 推薦ian goodfellow等人合著的《deep learning》
開發框架 → 首推pytorch,推薦**的《深度學習框架pytorch入門與實踐》或者廖星宇的《深度學習入門之pytorch》
tensorflow學習 → 推薦黃文堅、唐源的《tensorflow實戰》
(注意有些情況需要「科學上網」,一定要掌握google和google scholar的使用)
零基礎入門自然語言處理的學習建議
2 做一些非常簡單的nlp入門小任務,通過小任務理解自然語言處理的流程 包括中英文nlp處理流程的差別 3 快速學習一門開發nlp技術的程式語言 基本就是python了,不需要學習網路程式設計等部分,重點掌握python基本語法 檔案讀寫與編碼 正規表示式 gensim numpy pandas m...
自然語言處理基礎學習
自然語言的處理發展以來經歷了多個階段。初期的研究主要注重於自然語言的語法。80年代初期,計算機語言蓬勃發展,形式語言理論趨向成熟,這使得自然語言的處理也求助於形式語言。但由於形式語言語法和語義的分離性,以及自然語言的上下文有關性,導致不能得到廣泛的運用。擴種轉移網路atn是一種多功能自然語言的語法表...
自然語言處理入門
1 首先,將原文本拆分為句子,在每個句子中過濾掉停用詞 可以不選 並只保留指定詞性的單詞,由此可以得到句子和單詞的集合。2 每個單詞作為pagerank中的乙個節點。設視窗大小為k,假設乙個句子所組成的單詞可以表示為w1,w2,w3,wn.則w1,w2,wk w2,w3,wk 1 w3,w4,wk ...