1:特徵理解,看看資料裡有什麼。拿到資料的第一件事情當然是看資料怎麼樣了,也就是看裡面有什麼特徵,這些特徵是什麼意思,這個過程叫做特徵理解。看看資料是不是結構化的,是不是有空缺資料,用一些圖形看看資料長什麼樣?
2:特徵提公升 清理資料。 這一步要做的是在資料理解的基礎上,得到乙個比較整齊的資料。把未結構化的資料結構化、填充空值、對資料標準化。其中標準化包括z-socre標準化,min-max標準化,還有l1和l2正則化。 這一步完成以後,我們基本上得到了乙個乾淨、整齊一點的資料。但是這並不能保證我們的資料是和我們的模型強相關的,我們還不能把這些資料用在模型裡面,還需要後續的處理。
4:特徵構造 構建未有的特徵。 從我們已有的特徵裡面構建未有的特徵,比如從影象的畫素裡面構建出來是哪類物體的特徵。還有一種特徵構建是從另外乙個已有的資料集裡面構建,比如匹配某個人的資訊,這個過程叫做實體匹配。
5:特徵轉換。 這一步裡面重要的一步是特徵約減,比如使用pca演算法進行降維處理。
6:特徵學習。 讓我們使用機器學習演算法來進行特徵的學習,典型的如神經網路,它裡面就有這種思想。
Tomcat架構包含哪些內容
bin目錄 這個目錄檔案裡的主要作用是控制tomcat的啟動與關閉 使用catalina或者startup指令碼 以及啟動關閉有關的安全管理 uli 的等 常用命令 啟動tomcat 執行.startup.sh 關閉tomcat 執行.shutdown.sh 檢視tomcat程序 ps ef gre...
程式測試包含哪些內容?
1 得到需求 功能設計 內部設計說書和其他必要的文件 2 得到預算和進度要求 3 確定與專案有關的人員和他們的責任 對報告的要求 所需的標準和過程 例如發行過程 變更過程 等等 4 確定應用軟體的高風險範圍,建立優先順序 確定測試所涉及的範圍和限制 5 確定測試的步驟和方法 部件 整合 功能 系統 ...
docker包含哪些內容 1
如下圖,三大塊 下面分別介紹各部分包含的內容。啟程 會介紹容器的生態系統,讓大家先從整體上了解容器都包含那些技術,各種技術之間的相互關係是什麼,然後再來看我們的教程都會涉及生態中的哪些部分。為了讓大家盡快對容器有個感性認識,我們會搭建實驗環境並執行第乙個容器,為之後的學習熱身。這是教程的主要內容,包...