可定義為:機器學習是從資料中自動分析獲得的模型,並利用模型對未知資料進行**。可分為:
監督學習:
主要特點是要在訓練模型時提供給學習系統訓練樣本以及樣本隊員的類別標籤,因此又稱為有導師學習。例:學生從老師那裡獲取知識,資訊,老師提供對錯知識、告知最終答案的學習過程。
典型的監督學習方法:決策樹,支援向量機(svm),監督式神經網路等分類計算法和線性回歸等回歸演算法。
監督學習目標:利用一組帶有標籤的資料,學習從輸入到輸出的對映,然後將這種對映關係應用到未知資料上,達到分類(輸出時離散的)或回歸(輸出時連續的)的目的
監督學習:
示例:
**明天的氣溫是多少度?
**明天天氣是晴是雨或陰
人的年齡**?
人臉識別?
無監督學習
半監督學習
強化學習輸入:一組有標籤的訓練資料(也稱觀察和評估),標籤表明了這些資料(觀察)的所屬類別。
輸出:分類模型根據這些訓練資料,訓練自己的模型引數,學習出乙個適合這組資料的分類器,當有新資料(非訓練資料)需要進行類別判斷,就可以將這組新資料作為輸入送給學學習號的分類器進行判斷。
資料集:
訓練集/測試集劃分方法:
根據已有標註資料,隨機選出一部分資料(70%)作為訓練資料,餘下的作為測試資料,此外還有交叉驗證法等用來評估分類模型
假設我們手上有60個正樣本,40個負樣本,我們要找出所有的正樣本。
tp:將正類**為正類數40,tn:將正類**為負類數20;fp:將負類**為正類數10,fn:將負類**為負類數30.
準確率(accuracy)= **對的/所有
=(tp+fn)/(tp+fn+fp+tn)=(40+30)/100=70%
精確率(precision):tp/(tp+fp)=40/(40+10)=80%
召回率(recall):tp/(tp+tn)=40/(40+20)=66.7%
樸素貝葉斯:p(
a∣b)
=p(b
∣a)p
(a)/
p(b)
p(a|b)=p(b|a)p(a)/p(b)
p(a∣b)
=p(b
∣a)p
(a)/
p(b)
統計學分析資料的方法,目的在於了解兩個或多個變數間是否相關、研究其相關方向與強度,並建立數學模型以便觀察特定變數來**研究者感興趣的變數
回歸分析可以幫助人們了解在自變數變化時因變數的變化量。一般來說,通過回歸分析我們可以由給出的自變數估計應變數的條件期望。
回歸方法適合對一些帶有時序資訊的資料進行**或者趨勢擬合,常用在金融及其他設計時間序列分析的領域:
房價與房屋尺寸關係的線型擬合:
背景:我們可以根據已知的房屋成交**和房屋的尺寸進行線性回歸,繼而可以對已知房屋尺寸,而未知房屋成交價的例項進行成交**的**。
目標:對房屋成交資訊建立回歸方程,並依據回歸方程對房屋**進行**。
Python 機器學習基礎
pandas matplotlib reference numpy 的資料結構 numpy的基本操作 當進行 和 等邏輯判斷時,numpy會對array中所有元素進行判斷。import numpy vector numpy.array 5,10,6,7 vector 10 output array ...
python基礎(機器學習)
高階函式 import time def deco func starttime time.time func endtime time.time msecs endtime starttime 100 print time is d ms msecs def func print hello ti...
機器學習基礎環境 Python基礎
用途 python應用例項 編碼方式 在python2中使用python3的函式 輸入方式 輸出方式 anaconda資料科學開發環境 版本 anaconda3 5.2.0 py36 windows x86 64 jupyter notebook 修改jupyter的檔案路勁 ipython spy...