出於對資料分析、資料探勘方面的興趣,以及在未來工作上的幫助。本博打算多看一些相關書籍與部落格,總結及翻譯相應的知識點。使得自己對這塊的知識越來越了解,總結的文章初步分為以下章節:
第一章,eda-資料探索
第二章,線性回歸與模型診斷
第三章,從線性概率模型到廣義線性模型
第四章,模型中特徵子集的選擇
第五章,維度歸約
第六章,資料缺失與不平衡的處理
第七章,廣義相加模型(gams)
第八章,longitudinal data或panel data模型
第九章,監督學習
第十章,基於樹的方法
第十一章,從感知機到支援向量機
第十二章,從感知機到神經網路
第十三章,從神經網路到深度學習
第十四章,語音特徵
第十五章,影象特徵
第十六章,文字特徵
第十七章,非監督學習
第十八章,異常檢測
第十九章,推薦系統
第二十章,圖模型
第二十一章,隨機過程
第二十二章,時間序列
以此部落格鼓勵自己,繼續學習,fighting…
從one hot到語言模型
文中僅代表個人觀點,如有異議,歡迎 在機器學習的研究中,從我們的處理物件上來看可以分為 影象 語音 文字。本文重點討論對文字的處理。也就是說,我們處理的物件是文字,但是機器不像人啊!沒辦法像人類一樣對文件進行閱讀。所以!我們要做的就是把文字進行表示,而我們的這種表示方法可以讓機器讀懂文件的內容。於是...
從DTO到充血模型
充血模型是marting fowler提出的概念,表示乙個包含領域知識 業務邏輯 的物件。與充血模型相對的是貧血模型。貧血模型是偽裝成領域模型的資料容器 data holder 貧血模型只包含getter setter,沒有任何領域知識。乙個和貧血模型非常相近的概念是dto。dto只有getter ...
Python從入門到精通(目錄)
python從入門到精通 目錄 001 計算機基礎之程式設計 002 計算機組成原理 003 計算機作業系統 004 程式語言分類 005 網路瓶頸效應 006 計算機基礎小結 007 python和python直譯器 008 python直譯器的安裝 009 anaconda的安裝 010 pyt...