agent的本質,完美性,環境多樣性,分類
環境agent感知序列:該agent所接收到的是所有輸入資料的完整歷史。
agent函式:描述agent行為,將任意給定感知序列對映為行動
agent程式:人造agent函式的實現。
理性的概念
理性對每個可能的感知序列,根據已有的感知序列提供的證據和agent具有的先驗知識,理性agent應該選擇能使其新能最大化的行動。
全知、學習、自主性
全知agent明確知道他的行動產生的實際結果並做出相應的動作,現實中不可能。
agent要從它感知的資訊中盡可能地學習。
自主性使agent不只依賴於先驗知識,也依賴於自身的感知資訊。
環境的性質
任務環境的描述規範
peas描述:performance,environment,actuators,sensors
任務環境的性質
完全可觀察與部分可觀察
agent的sensors在每個時間點上都能獲取環境的完整狀態。
若監測到的資訊與行動決策相關,則該任務環境是有效完全可觀察的。
單agent與多agent
對抗,競爭性/
確定的與隨機的
環境的下乙個狀態完全取決於當前狀態和agent執行的行動則環境是確定的。
片段式與連續式
片段:下乙個片段不依賴於以前片段採取的行動(如大部分的分類任務)。
連續:當前決策會影響到所有未來決策。
靜態與動態
取決於環境在agent計算時是否會改變。
離散與連續
環境狀態,時間處理方式,agent感知資訊和行動 都有離散和連續之分。
已知與未知
結構agent = 體系結構(計算裝置) + 程式(agent程式)
簡單反射agent
基於模型的反射agent
基於目標的agent
基於效用的agent
學習agent
學習元件負責改進提高,效能原件負責選擇外部行動。問題發生器負責可以得到新的和有資訊的經驗的行動建議。
各部件的工作
原子表示 2. 要素化表示(狀態有特徵向量) 3. 結構化表示(特徵向量+其他物件的關係)
人工智慧 一種現代方法 第1章 緒論
人工智慧 ai artificial intelligence is the science of machines that think humanly 認知建模 think rationally 思維法則 act humanly 圖靈測試 act rationally 理性agent 上面這個定...
人工智慧 一種現代方法的總結
這本由stuart 和 peter 寫的ai經典入門之作,洋洋灑灑的有1千多頁,被我用一年的業餘時間終於看完了。有何收穫?很難用一兩句話說清,好在都記錄在筆記本上。整本書的結構是先介紹搜尋演算法,搜尋可以用於找出從初始狀態到目標狀態的一系列動作變化。在第二部分主要介紹邏輯,基於邏輯的機械人也稱為以知...
人工智慧 一種現代方法 第4章 超越經典搜尋
2018.3.23 很多現實生活中的最優化問題目標與路徑是不相關的,諸如布局問題 八皇后問題。區域性搜尋演算法對於解決純粹的最優化問題十分有效,根據目標函式找到全域性最優狀態。即代價的全域性最小值,目標函式的全域性最大值。定義 不斷向值增大的方向移動,直到到達區域性最優 也被稱為貪婪區域性搜尋,貪婪...