Task2 bayes plus學習筆記

2021-10-05 09:45:25 字數 1315 閱讀 2104

生成模型:在概率統計理論中, 生成模型是指能夠隨機生成觀測資料的模型,尤其是在給定某些隱含引數的條件下。它給觀測值和標註資料序列指定乙個聯合概率分布。在機器學習中,生成模型可以用來直接對資料建模(例如根據某個變數的概率密度函式進行資料取樣),也可以用來建立變數間的條件概率分布。條件概率分布可以由生成模型根據貝葉斯定理形成。常見的基於生成模型演算法有高斯混合模型和其他混合模型、隱馬爾可夫模型、隨機上下文無關文法、樸素貝葉斯分類器、aode分類器、潛在狄利克雷分配模型、受限玻爾茲曼機

舉例:要確定乙個瓜是好瓜還是壞瓜,用判別模型的方法是從歷史資料中學習到模型,然後通過提取這個瓜的特徵來**出這只瓜是好瓜的概率,是壞瓜的概率。

判別模型: 在機器學習領域判別模型是一種對未知資料 y 與已知資料 x 之間關係進行建模的方法。判別模型是一種基於概率理論的方法。已知輸入變數 x ,判別模型通過構建條件概率分布 p(y|x) ** y 。常見的基於判別模型演算法有邏輯回歸、線性回歸、支援向量機、提公升方法、條件隨機場、人工神經網路、隨機森林、感知器

舉例:利用生成模型是根據好瓜的特徵首先學習出乙個好瓜的模型,然後根據壞瓜的特徵學習得到乙個壞瓜的模型,然後從需要**的瓜中提取特徵,放到生成好的好瓜的模型中看概率是多少,在放到生產的壞瓜模型中看概率是多少,哪個概率大就**其為哪個。

生成模型是所有變數的全概率模型,而判別模型是在給定觀測變數值前提下目標變數條件概率模型。因此生成模型能夠用於模擬(即生成)模型中任意變數的分布情況,而判別模型只能根據觀測變數得到目標變數的取樣。判別模型不對觀測變數的分布建模,因此它不能夠表達觀測變數與目標變數之間更複雜的關係。因此,生成模型更適用於無監督的任務,如分類和聚類。

條件概率: 就是事件a在事件b發生的條件下發生的概率。條件概率表示為p(a|b),讀作「a在b發生的條件下發生的概率」。

先驗概率: 在貝葉斯統計中,某一不確定量 p 的先驗概率分布是在考慮"觀測資料"前,能表達 p 不確定性的概率分布。它旨在描述這個不確定量的不確定程度,而不是這個不確定量的隨機性。這個不確定量可以是乙個引數,或者是乙個隱含變數。

後驗概率: 在貝葉斯統計中,乙個隨機事件或者乙個不確定事件的後驗概率是在考慮和給出相關證據或資料後所得到的條件概率。同樣,後驗概率分布是乙個未知量(視為隨機變數)基於試驗和調查後得到的概率分布。「後驗」在本文中代表考慮了被測試事件的相關證據。

通過上述西瓜的資料集來看

條件概率,就是在條件為瓜的顏色是青綠的情況下,瓜是好瓜的概率

先驗概率,就是常識、經驗、統計學所透露出的「因」的概率,即瓜的顏色是青綠的概率。

後驗概率,就是在知道「果」之後,去推測「因」的概率,也就是說,如果已經知道瓜是好瓜,那麼瓜的顏色是青綠的概率是多少。後驗和先驗的關係就需要運用貝葉斯決策理論來求解。

後續補充

可汗學院統計學Task2

中心極限定理 設從均值為 方差為 2的任意乙個總體中抽取n個樣本,隨著樣本容量增大或趨近於無窮,樣本均值的抽樣分布近似服從均值為 方差為 2 n的正態分佈,隨著樣本容量n變大,抽樣分布標準差越小,越收攏。該定理良好的定義了均值和方差的分布 通過對原分布就是抽樣得到樣本均值的分布,無論原分布如何,抽樣...

動手學資料分析 Task 2

常用的函式有dropna 和fillna dataframe.dropna axis 0,how any thresh none,subset none,inplace false 屬性說明 預設引數axis 0,根據索引 index 刪除指定的行 axis 1,根據列名 columns 刪除指定的...

14天動手學深度學習 Task2

一 梯度消失 梯度 以及kaggle房價 隨機初始化模型引數 在神經網路中,通常需要隨機初始化模型引數。下面我們來解釋這樣做的原因。如果將每個隱藏單元的引數都初始化為相等的值,那麼在正向傳播時每個隱藏單元將根據相同的輸入計算出相同的值,並傳遞至輸出層。在反向傳播中,每個隱藏單元的引數梯度值相等。因此...