web搜尋學習筆記之概率模型

2021-06-01 00:37:32 字數 614 閱讀 2245

1. 為什麼概率模型?

直觀上,乙個ir系統不可能給出乙個確定的答覆:乙個文件是否滿足乙個查詢? 就算是人類,也不能給出這樣確定的回答。因此,需要進行不確定性地判斷。而概率理論正是進行不確定性推理的理論。

概率方法既是最古老的資訊獲取方法之一,也是當前最熱門的資訊獲取方法之一。

2. 跟別的模型的比較

布林模型不支援對文件集合的排序。

向量空間模型基於文件與查詢的相似度,進行排序。而相似度並不是相關度。最相似的文件可能高度相關,也可能完全無關(?)。而概率模型是對相關程度的更清晰的定義。

3. 需要使用的概率論基礎

4. 基於概率的文件排序原理

4.1 基於概率的相關程度公式及其推導過程

公式(4)表示文件x與查詢q相關的概率,其中x和q都是建立在term上的向量。

公式(5)表示文件x與查詢q不相關的概率。

公式(6)組合公式(4)和公式(5),用來計算文件x與查詢q的相關程度。

公式(7)是公式(6)中隨文件x變化的部分,公式(6)中的其餘部分,對於給定乙個查詢q來說,都是常量。

公式(8)基於公式(7),給出最終用來計算文件x與查詢q相關程度的公式。

4.2 計算公式(8)

其中,

機器學習筆記 概率生成模型

假設有兩類資料,每一類都有若干個樣本 概率生成模型認為每一類資料都服從某一種分布,如高斯分布 從兩類訓練資料中得到兩個高斯分布的密度函式,具體的是獲得均值和方差兩個引數 測試樣本輸入到其中乙個高斯分布函式,得到的概率值若大於0.5,則說明該樣本屬於該類,否則屬於另一類。演算法的核心在於獲取分布函式的...

概率之結構化概率模型

結構化概率模型 structured probabilistic model 也稱為圖模型 graphical model 是指使用圖論中的 圖 的概念來描述概率分布的分解。有兩種主要的圖模型 有向圖和無向圖。兩種圖模型都使用圖 有向 directed 模型使用帶有有向邊的圖,它們用條件概率分布來表...

概率期望學習筆記

由於自己初學概率期望,學的都是簡單題,就不分開寫部落格了.非常入門的概率期望題目。但因為題目意思比較噁心.一共有 2 n 個鞋頭,第 i 次操作前還有 2 n i 1 2 個鞋頭,由於我們選出乙個後,它不能和自己綁,也不能和和它在同一條鏈上的綁。所以 include include includeu...