終極演算法 第八章 無師自通

2021-09-10 04:57:31 字數 1919 閱讀 7813

本文為閱讀總結個人認為書裡概念性的、對本人有幫助的內容,僅供參考。

如果我們能重新回憶嬰兒和蹣跚學步時期的自己,然後從新生兒的角度看待這個世界,那麼許多關於學習的疑問,甚至關於存在本身,都會突然變得清晰明朗。

雖然孩子理所當然從父母那裡獲得了許多幫助,但很多時候他們在沒人監督的情況下進行學習,這才是最不可思議的地方。

對事物進行聚類,這是人類的天性,也是獲取知識的第一步。

大資料和機器學習的全部要點在於避免粗糙思考。

有乙個更大的問題,那就是k均值演算法只有在集群易於區分的情況下才能起作用:在超空間中,每個集群可看作乙個球團,每個團距離彼此都很遠,而它們都有相似的體積,幷包含想近數量的物體。

無論何時,當我們想掌握某個統計模型,但又缺乏一些關鍵資訊時(如例子的類別),就可以利用em。這使它在所有機器學習中成為最受歡迎的演算法。

機器學習演算法稱該過程為維數約減,因為該過程將大量的可見維度(畫素)簡化稱幾個**維度(表情、面部特徵)。維數約減對於應對大資料來說很關鍵。

尋找主要成分的整個過程,可以利用線性代數一次性完成。

主要成分分析(pca),正如人們對該過程的了解,是科學家的工具箱中關鍵的工具之一。pca屬於線性演算法。

pca完全沒有解釋資料的形狀,而是獎其模糊化了。

對於非線性降維演算法來說,最受歡迎的演算法——等距對映演算法,就可以實現這一點。

等距對映演算法有驚人的能力,可以對準複雜資料中最重要的維度。

時間,換句話說,就是記憶的主要成分。

聚類和維度簡化雖然使我們更加靠近人類學習,但仍丟失了一些很重要的東西——互動。

在任何情況下,步進監督都不應該被採用(用於互動)。家長不糊教自己的孩子爬、走或者跑,他們都是自己摸索。目前為止,所有的學習演算法都不能做到這一點。

人類確實有穩定的嚮導:情感。我們追求快樂,躲避痛苦。

有乙個機器學習的子域致力於這樣的演算法:進行主動探索,偶然得到獎勵,然後弄清楚將來怎樣才能再得到獎勵。這個過程稱為「強化學習」。

強化學習的乙個重要先驅是跳棋遊戲程式,這是ibm的研究員阿瑟·塞繆爾於20世紀50年代編寫的。棋盤遊戲是強化學習問題的典範:你得走好多步棋,卻得不到任何反饋,獎勵或懲罰都是在最後一刻揭曉,其形式也就是嬴和輸。

強化學習的首要思想是:並不是所有的狀態都有獎勵,但每種狀態都會有價值。

強化學習通過估算每種狀態的價值來做到這一點,從該狀態開始你所期望得到的全部獎勵,然後選擇能將獎勵最大化的行為。

強化學習面對利用——探索困境的解決方法是:時而選擇最佳行動,時而隨機選擇。

實際上,強化學習就是一種加速進化過程——嘗試、丟棄,然後在單個生命的一生而不是幾代中改進行動——有了這個標準,它的效率就會很高。

對於強化學習的研究自20世紀80年代早期才正式開始,麻薩諸塞大學的里奇·薩頓和安迪·巴爾托參與了研究工作。他們認為學習取決於與環境的互動,這一點很關鍵,但監督演算法並沒有發現這一點。

2023年,當時劍橋大學的克里斯·沃特金斯在兒童學習實驗發的的推動下,實現了強化學習的現代形式,即在未知環境中進行最優控制。

在監督式學習中,某個狀態的目標價值總是一樣的;但在強化學習中,它會不斷變化。

諷刺的是,人在最痛苦時學到的東西往往最多。

通過練習你會做的更好,但不會以恆定覅人速度進步:一開始你進步很快,接下來就沒那麼快了,最後你變得很慢。

組塊是乙個來自感知與記憶心理學的概念。

人類解決問題的方式是將問題分解為小問題,再將小問題分解為更小的問題,然後系統地減少初始狀態與目標狀態之間的差異。

於是紐厄爾、羅森布魯姆、萊爾德作出這樣的假設——組塊是學習所需的「唯一」機制,換句話說,就是終極演算法。

嘗試將強化學習、監督式學習,以及別的一切簡化稱組塊,基本上會製造更多的問題,而不會解決問題。

了解乙個實體的最佳方法——無論它是人、動物、網頁還是分子——就是了解它如何與其他實體進行連線。

關聯學習演算法能達到的最佳效果就是讓懶散的老師變得勤奮。

終極演算法

第八章 指標 第八章 指標

1 什麼是位址 include using namespace std int main 11 在堆中建立對像 我們既然可以在堆中儲存變數,那麼也就可以儲存對像,我們可以將對像儲存堆中,然後通過指標來訪問它 include using namespace std class human 14 在建構...

第八章(筆記)

能在 中進行記憶體單元的定址的暫存器只有4個,分別是bx si di bp 其中bx bp 是基址,bx對應的段位址是ds,bp對應的段位址是ss si di 是變址,單獨使用時段位址是ds,組合使用段位址是跟隨組合的基址對應的段位址 中進行記憶體單元定址彙總 si di bx bp 常量 si 常...

第八章 字典

d 空字典 d 這就是字典 d dict.fromkeys a b d dict zip keyslist,valslist d dict name bob age 22 建立字典的函式 d name 通過索引key獲取對應的value d.keys 返回d字典物件所有key,返回乙個列表 d.va...