機器學習 機器學習資料積累

2021-07-09 08:02:34 字數 1213 閱讀 5817

前面我曾經發帖推薦過網上的一些做「影象處理和計算機視覺的」有料部落格資源,原帖位址

1、首先,是豆瓣上的資料鋪子主頁

因為我個人多是用r來做資料探勘和分析,所以主頁菌的內容很對我的胃口。這個主頁裡有大量用r做資料探勘的內容。我也向博主偷師了很多。儘管主頁菌已經停止更新內容了,但是現有的部分(其實文章量很大)已經可以令後來者學到很多了。

2、jerrylead在上的主頁

3、pluskid的主頁

博主是浙大本碩,後來貌似應該去了美國讀博。這個部落格跟jerrylead的很類似,大量數學推導,讓你從本質上認識和理解很多晦澀的資料探勘演算法。網路上很多人推崇csdn上的july,尤其是那篇svm三重境界。殊不知,july的三重境界也不過是jerrylead和pluskid左一段右一段的移花接木之作罷了。最開始我看這幾篇文章的時候,就發現內容像極了,尤其是pluskid畫的圖基本原模原樣地出現在了july的文章中。後來在知乎上看了帖子差不多也就明白裡面的事了。總之,希望大家還是能夠尊重原創吧。july的部落格也可以看,畢竟超千萬的訪問量,他東搜西湊的不斷整理沒有功勞也有苦勞,大家可權當乙個合集來看了。

4、龍心塵&寒小陽 的主頁

資料探勘和機器學習部落格中的新生力量,看了幾篇博文,感覺實力不俗。神經網路和深度學習部分的內容比較推薦。

其他公共資源

r、weka、python和matlab都是用來做資料探勘的利器(甚至spss、stata、sas也能用來完成一些資料探勘任務)。因此,事實上這些軟體或語言的公共主頁或論壇上也包含有大量不錯的內容(包括一些程式**和應用例項)。

最後,網上還有很多關於機器學習和資料探勘的公開課。如果你想一點一點系統的學習,那麼這些資源你都不應該錯過。我主要推薦兩個:

乙個是斯坦福的公開課——機器學習

如果你還是覺得聽英語很彆扭,那麼由台灣大學林軒田教授錄製的中文coursera課程(也就是傳說中的mooc)——機器學習系列就是乙個絕佳的資源。該課程分上下兩個部分,對於初學者可以學習——「機器學習基石」課程

聽這個名字你也能知道上面的課程講的是基礎。如果你想學習高階內容(當然,前提是基石部分的知識你已經統統掌握了),那麼你便可以選擇林教授的另外一門mooc課程——「機器學習技法」課程

最後,感謝上述資源提供者的無私奉獻。也衷心希望各位讀者學有所得,學有所成!

機器學習 機器學習目錄

注 後期有時間的話會對每乙個演算法進行講解。1 普通線性回歸 2 廣義線性模型 3 邏輯回歸 4 線性判定分析1 決策樹基本原理與構建 2 cart演算法 3 回歸決策樹 4 分類決策樹1 貝葉斯定理與樸素貝葉斯 2 高斯貝葉斯分類器 3 多項式貝葉斯分類器 4 伯努利貝葉斯分類器 5 遞增式學習1...

機器學習 機器學習概論

3 模型評估與模型選擇 4.具體應用 統計學習 是關於計算機基於 資料 構建概率統計模型並運用模型對資料進行 分析 統計學習的三要素 模型在監督學習中,模型就是所要學習的條件概率分布或決策函式。這在後面的章節中會重點介紹。策略 評價模型的標準 用損失函式和代價函式來度量 錯誤的程度。1 幾種損失函式...

機器學習 機器學習基礎

資料集劃分的api 返回值 訓練特徵,測試特徵,訓練目標,測試目標 方式1 獲取小規模的資料集 importsklearn.datasets as datasets iris datasets.load iris 提取樣本資料 feature iris data target iris target...