CS224n 課時1 NLP和深度學習入門

2021-10-01 02:05:54 字數 481 閱讀 3766

課程鏈結

人類語言並不是海量的資訊,它需要傳遞指定的資訊,具有複雜性,符號也代表情感。

人類語言都有連續性,用於自然語言處理的深度學習也應該具有連續性。

目前的機器學習,依然是通過手工構建出一系列有用的特徵,然後讓模型根據這些特徵取訓練,實際上機器並沒有學習到什麼東西,反倒是人類學習到了很多東西,做了很多的理論研究來證明哪些特徵是有用的。機器唯一在做的就是數值優化。機器學習中90%的工作都是人類如何描述資料,總結出重要的特徵。

深度學習只提供給電腦原始的資料,自己總結、構造出有用的特徵。 深度學習大部分的情況講的都是神經網路。

手動設計的特徵太過於具體,不完整,而且需要花費很長的時間來驗證,最終只能達到一定的變現水平。但是學習得到的特徵適應強,訓練速度快。但是深度學習靈活、可用、行之有效。

表達方式多樣化

表達方式歧義話,模稜兩可

人類的表達依賴於對其他知識的認知

小龍女來到桃花島:我也想去過過過過的生活。

CS224n學習筆記1 深度自然語言處理

一 什麼是自然語言處理呢?自然語言處理是計算機科學家提出的名字,本質上與計算機語言學是同義的,它跨越了計算機學 語言學以及人工智慧學科。自然語言處理是人工智慧的乙個分支,在計算機研究領域中,也有其他的分支,例如計算機視覺 機械人技術 知識表達和推理等。目標 讓計算機能夠理解人類語言來完成有意義的任務...

CS224n 詞向量模型和GloVe

語言學家j.r.firth提出,通過乙個單詞的上下文可以得到它的意思,所以我們可以定義乙個以 某個單詞的上下文的模型 p context wt 我們的目標當然是希望概率p越大越好,所以我們可以定義乙個目標函式 j t 1t m j m,j 0p wt j wt 我們的目的就是最大化上面這個目標函式。...

cs224n自然語言處理與深度學習筆記 week1

本節主要針對史丹福大學cs224n的自然語言處理與深度學習課程所做筆記,將學習過程中的一些重難點進行記錄,方便後續複習 自然語言處理是電腦科學,人工智慧和語言學的集合,該技術的目的是為了使計算機能夠理解語言.深度學習是機器學習的乙個分之,和傳統方法的區別主要在於其端到端的形式,從raw input中...