概率論是用於表示不確定性宣告的數學框架。它不僅提供了量化不確定性的方法,也提供了用於匯出新的不確定性宣告的公理。在人工智慧領域,概率論主要有兩種用途。首先,概率法則告訴我們ai系統如何推理,據此我們設計一些演算法來計算或估算由概率論匯出的表示式。其次,我們可以用概率和統計從理論上分析我們提出的ai系統的行為。
概率論使我們能夠作出不確定的宣告以及在不確定性存在的情況下進行推理,而資訊理論使我們能夠量化概率分布中的不確定性的總量。
電腦科學的許多分支處理的實體大部分都是完全確定且必然的。程式設計師通常可以完全地假定cpu將完美地執行每條機器指令。硬體錯誤確實會發生,但它們足夠罕見,以致於大部分軟體應用在設計時並不需要考慮這些因素的影響。鑑於許多計算機科學家和軟體工程師在乙個相對乾淨和確定的環境中工作,機器學習對於概率論的大量使用是很令人吃驚的。
這是因為機器學習通常必須處理不確定量,有時也可能需要處理隨機(非確定的)量。不確定性和隨機性可能來自多個方面。至少從20世紀80年代開始,研究人員就對使用概率論來量化不確定性提出了令人信服的論據。
幾乎所有的活動都需要能夠在不確定性存在時進行推理。事實上,除了那些被定義為真的數學宣告,我們很難認定某個命題是千真萬確的或者確保某件事一定會發生。
在很多情況下,使用一些簡單而不確定的規則要比複雜而確定的規則更使用,即使真正的規則是確定的並且我們建模的系統可以足夠精確地容納複雜的規則。例如,簡單的規則「多數鳥兒都會飛」的描述很簡單並且使用廣泛,而正式的規則-「除了那些非常小的還沒學會飛翔的幼鳥,因為生病或是受傷而失去了飛翔能力的鳥,不會飛的鳥類包括食火鳥、鴕鳥等等,鳥會飛」,很難應用、維護和溝通,即使經過所有這些的努力,這些規則還是很脆弱的,並且容易失效。
儘管我們的確需要一種用以對不確定性進行表示和推理的方法,但是概率論並不能明顯地提供我們在人工智慧領域需要的所有工具。概率論最初的發展是為了分析事件發生的頻率。我們可以很容易地看出概率論,對於像在撲克牌遊戲中抽出一手特定的牌這種事件的研究中,是如何使用的。這類事件往往是可以重複的。當我們說乙個結果發生的概率為p,就意味著如果我們反覆試驗無限次,有p的比例會導致這樣的結果。這種推理似乎並不立即適用於那些不可重複的命題。如果乙個醫生診斷了病人,並說該病人患流感的機率為40%,這意味著非常不同的事情:我們既不能讓病人有無窮多的副本,也沒有任何理由去相信病人的不同副本在具有不同的潛在條件下表現出相同的症狀。在醫生診斷病人的情況下,我們用概率來表示一種信任度,其中1表示非常肯定病人患有流感,而0表示非常肯定病人沒有流感。前面一種概率,直接與事件發生的頻率相聯絡,被稱為頻率派概率(frequentist probability);而後者,涉及確定性水平,被稱為貝葉斯概率(bayesian probability)。
如果要列出一些關於不確定性的常識推理中我們希望其具有的性質,那麼滿足這些性質的唯一一點就是講貝葉斯概率和頻率派概率視為等同的。例如,如果我們要在撲克牌遊戲中根據玩家手上的牌計算她能夠獲勝的概率,我們和醫生情境使用完全相同的公式,就是我們依據病人的某些症狀計算她是否患病的概率。
概率可以被看作是用於處理不確定性的邏輯擴充套件。邏輯提供了一套形式化的規則,可以在給定某些命題是真或假的假設下,判斷另外一些命題是真的還是假的。概率論提供了一套形式化的規則,可以在給定一些命題的似然後,計算其他命題為真的似然。
為什麼要使用blog
有哥們問我,你為什麼使用blog?我總結了一下,覺得有如下幾個原因。1對自己的督促 有了blog,就會經常記得寫點東西 就會經常翻翻網上的新文章,了解一下新技術,不至於迷失在忙碌的生活中 如果把自己的所感所想所學寫出了,自己對自己也會有個概念,不至於迷迷糊糊 還有,畢竟是掛在網上的文字,心中難免擔心...
為什麼要使用XML
xml 代表擴充套件標記語言 extensible markup language 是由 world wide web consortium w 3c 的 xml工作組定義的。這個工作組是這樣描述該語言的 擴充套件標記語言 xml 是 sgml 的子集,其目標是允許普通的 sgml 在web 上以目...
為什麼要使用Nginx?
有人說這些基準測試是不準確的,因為在這樣那樣的環境下,做的比較不一致。我傾向同意基準測試只是告訴了我們其中一部分情況,你能做的是消除偏見 有人見過所有人都同意乙個基準測試是公平的嗎?我是沒見過。我們投資的一些公司把web平台切換到nginx後,可以顯著的解決擴充套件問題。nginx明顯有效的實現了今...