史丹福大學深度學習與自然語言處理第二講 詞向量

2021-07-10 19:34:27 字數 1505 閱讀 9003

史丹福大學在三月份開設了一門「深度學習與自然語言處理」的課程:cs224d: deep learning for natural language processing,授課老師是青年才俊 richard socher,以下為相關的課程筆記。

第二講:簡單的詞向量表示:word2vec, glove(****** word vector representations: word2vec, glove)

推薦閱讀材料:

*****1:[distributed representations of words and phrases and their compositionality]]

*****2:[efficient estimation of word representations in vector space]

第二講slides [slides]

如何來表示乙個詞的意思(meaning)

在計算機中如何表示乙個詞的意思

語義詞典存在的問題

one-hot representation

distributional similarity based representations

如何使用上下文來表示單詞

基於視窗的共現矩陣:乙個簡單例子

存在的問題

解決方案:低維向量

方法1:svd(奇異值分解)

python中簡單的詞向量svd分解

用向量來定義單詞的意思:

hacks to x

詞向量中出現的一些有趣的語義pattern

使用svd存在的問題

解決方案:直接學習低維度的詞向量

word2vec的主要思路

word2vec的主要思路

代價/目標函式

梯度的導數

有用的公式

鏈式法則

word2vec中的線性關係

計數的方法 vs 直接**

glove: 綜合了兩類方法的優點

glove的效果

word analogies(詞模擬)

glove視覺化一

glove視覺化二:company-ceo

glove視覺化三:superlatives

word embedding matrix(詞嵌入矩陣)

低維度詞向量的優點

課程筆記索引:

史丹福大學深度學習與自然語言處理第一講:引言

參考資料:

deep learning in nlp (一)詞向量和語言模型

奇異值分解(we recommend a singular value decomposition)

史丹福大學Tensorflow與深度學習實戰課程

分享一套stanford university 在2017年1月份推出的一門tensorflow與深度學習實戰的一門課程。該課程講解了最新版本的tensorflow中各種概念 操作和使用方法,並且給出了豐富的深度學習模型實戰,涉及word2vec autoencoder rnn lstm,gru s...

史丹福大學深度學習開言

歡迎來到深度學習的教程!描述 本教程將教你關於無監督式學習和深度學習的主要思想。在學習它們的過程中,你也將需要實現幾個深度學校的演算法,看著它們為你工作,並且學習怎樣使用或者應用這些思想到新的問題中。本教程假定你有機器學習的基本知識 具體而言,便是熟悉監督學習的思想,邏輯回歸,梯度下降 如果你並不熟...

史丹福大學深度學習與自然語言處理第一講 引言

史丹福大學在三月份開設了一門 深度學習與自然語言處理 的課程 cs224d deep learning for natural language processing,授課老師是青年才俊 richard socher,他本人是德國人,大學期間涉足自然語言處理,在德國讀研時又專攻計算機視覺,之後在史丹...