經典的深度強化學習勸退文讀後感

2021-10-24 02:47:21 字數 919 閱讀 9312

』deep reinforcement learning doesn』t work yet』,18年2月的爆款文章,深度強化學習經典的勸退文,全文比較長,主要分析了drl現在存在的一些問題,說了作者認為未來可能的發展方向,非常值得一讀,作者alex irpan寫這篇文的時候是在google brain的機械人團隊,這裡是全文鏈結和對應的中文翻譯: ;

因為最近我也在思考方向,所以還閱讀了一些中美有關人工智慧的政策,這裡也分享一下吧

darpa人工智慧研究情況,這個是關於美國國防部高階研究計畫局darpa關於人工智慧研究情況的乙個介紹,也是17年前後就有了,darpa認為人工智慧分為三次浪潮:手工知識,統計學習和上下文推理,分別涉及人工設計邏輯,專家系統;資料驅動學習知識;以及考慮到統計學習只用到了相關性的資訊,進一步挖掘其他因果關係,增強智慧型體的推理屬性相關的研究。darpa在當時將準備開展兩個方面的研究,分別側重在可解釋性和終身學習上,可解釋性就更安全,更可控,終身學習感覺是更通用智慧型的研究。

通過閱讀這兩個政策,我感覺就是其實和上面第四個勸退文還是挺一致的,作為人工智慧的從業者,還是應該思考一些人工智慧對於社會的意義,同時要關注到人工智慧領域一些難啃的硬骨頭,要勇於嘗試,這樣整個行業才會發展得越來越好,現在湧入人工智慧這個行業的人才們也才都能更好地發揮自己的才幹,智慧型化社會也才會變成有可能。當然,方向的選擇還是要考慮到自身的實際能力和實際情況,博士還是碩士等等,既要仰望星空,也要腳踏實地,就我個人還是想在能力範圍內盡可能地往外試探試探,取乎其上,得乎其中。

雖然這篇文章起的名字是drl的勸退文,但是也不完全是drl的勸退,也在思考一些人工智慧相關的東西,當然學而不思則罔,思而不學則殆,也不能一直思考,還是要多看一些有內容、有理論的東西,多充電,更踏實。現在我對於研究方向有了一些概念了,後續得再和老師們討論一下,確定了方向後我會寫更多關於專業方向的文章,哈哈給自己加油!

《學習的本質》讀後感

今天讀 學習的本質 附上該書的思維導圖。學習的本質書中講到2個概念和3個高效學習方 先有概念 根據已有的知識去建構新知識,在人的大腦裡,由於對已有行為編碼,決定現在的判斷決定。但也容易先入為主,形成錯誤的認知。所以要打破認知侷限,需要再進一步的帆板模式。帆板模式 持續不均衡狀態,人的學習知識的形成就...

對深度強化學習的理解

deep mind第乙個正式提出dqn的概念並能夠做出比較有效果的實驗。一直以來,強化學習都面臨對人工提取特徵的依賴的問題,深度神經網路的發展給問題的解決帶來了希望,卷積神經網路可以從畫素矩陣中直接提取出可以和人工提取值相媲美的特徵值。就是,把一張遊戲的傳進去,卷積神經網路就可以辨識出中任務所處的狀...

兩篇OCR結合深度學習的文獻讀後感

整理出與專案進展有關的小小認識,以下按順序分別命名為文獻1和文獻2 在不同的影象字元識別背景下 文獻1背景為驗證碼 文獻2為電商 基於深度學習的模型,以上兩篇文獻分別完成了各自ocr 光學字元識別 系統的構建。同樣,對於筆者自己的課題,即完成在購物小票背景下的字元識別,同樣也需要構建與之相對應的oc...