今天學的機器學習部分,做一些總結:
機器學習的一般過程
機器學習方法
有監督學習(supervised learning):從給定的有標註的訓練資料集中學習出一 個函式(模型引數),當新的資料到來時可以根據這個函式**結果。 常見任務包 括分類與回歸。
分類:輸出是類別標籤
回歸:輸出是實數
無監督學習(unsupervised learning):沒有標註的訓練資料集,需要根據樣 本間的統計規律對樣本集進行分析,常見任務如聚類等。
半監督學習(semi-supervised learning): 結合(少量的)標註訓練資料和(大量的)未標 注資料來進行資料的分類學習。
兩個基本假設:
• 聚類假設:處在相同聚類中的樣本示 例有較大的可能擁有相同的標記。
• 流形假設:處於乙個很小的區域性區域 內的樣本示例具有相似的性質,因此, 其標記也應該相似。
增強學習(reinforcement learning):外部環境對輸出只給出評價資訊而非正確答案,學習機通過強化受獎勵的動作來改善自身的效能。
我們不需要設定具體的策略,比如先飛到上面,再飛到下面,我們只是需要給算法定乙個「小目標」!比如當計算機玩的好的時候,我們就給
它一定的獎勵,它玩的不好的時候,就給它一定的懲罰,在這個演算法框架下,它就可以越來越好,超過人類玩家的水平。
多工學習(multi-task learning):把多個相關 (related)的任務放在一起同時學習。 單任務學習時,各個任務之間的模型空間(trained model)是相互 獨立的,但現實世界中很多問題不能分解為乙個乙個獨立的子問題, 且這樣忽略了問題之間所包含的豐富的關聯資訊。多工學習就是為 了解決這個問題而誕生的。多個任務之間共享一些因素,它們可以在 學習過程中,共享它們所學到的資訊,相關聯的多工學習比單任務 學習具備更好的泛化(generalization)效果。
利用點:
資訊推薦:新聞、商品、遊戲、書籍
器翻譯、摘要生成……
生物資訊學……
機器學習準備
資料清洗:
資料取樣
資料集拆分
特徵選擇:
特徵降維
特徵編碼
規範化舉例子:
以下是擴充套件:
人工智慧機器學習
機器學習是從資料中自動分析獲得規律 模型 並利用規律對未知資料進行 資料處理 首先將所有資料放在一起,然後將其順序打亂。由於順序不是判斷酒水的依據,我們並不期望順序影響到模型學習到的內容。換言之,我們判斷一種酒是紅的還是啤的,並不需要知道前一種或是接下來有什麼酒出現。這時,可以著手繪出視覺化的資料分...
機器學習和人工智慧
機械人和人工智慧這個領域確實已進入了瓶頸階段,因為現在的存在的各種人工智慧和機器裝置,都是人工程式設計控制的,再精密的動作都是在按照人工方式模擬下進行的,因此已經進入誤區。試想下 我們生下來就被遺傳了1 1 2的計算功能嗎?一生下來就能有意識的抬起手臂嗎?而目前再簡單的人工智慧都可以完成,但這僅僅侷...
人工智慧與機器學習
現如今,人工智慧與機器學習受到了各行各業的廣泛關注,大眾對其態度不一。但是人工智慧與機器學習對不同的人來說其代表的東西並不相同。通常人工智慧與機器學習會引起人們的恐懼與不確定性,因此一些專家對這兩個術語相關的風險表示擔憂。事實上,人工智慧與機器學習已經成為了我們日常生活中不可分割的一部分,即使在有些...