什麼是機器學習?
機器學習的乙個重要的目標就是利用數學模型來理解資料,發現資料中的規律,用作資料的分析和**。
通常在乙個資料表dataframe裡面,一行表示乙個樣本??,一列表示乙個特徵。
根據資料是否有因變數(響應變數,y,結果集),機器學習的任務可分為:有監督學習和無監督學習。
根據因變數的是否連續,有監督學習又分為回歸和分類:
為了更好地敘述後面的內容,我們對資料的形式作出如下約定:
第i個樣本:??=(??1,??2,...,???,??)?,?=1,2,...,?
因變數?=(?1,?2,...,??)?
第k個特徵:?(?)=(?1?,?2?,...,???)?
特徵矩陣?=(?1,?2,...,??)?
回歸klearn中所有內建資料集都封裝在datasets物件內: 返回的物件有:
%matplotlib inline的含義
用在jupyter notebook中具體作用是當你呼叫matplotlib.pyplot的繪圖函式plot()進行繪圖的時候,或者生成乙個figure畫布的時候,可以直接在你的python console裡面生成影象。
(什麼是seaborn
seaborn是基於matplotlib的圖形視覺化python包。它提供了一種高度互動式介面,便於使用者能夠做出各種有吸引力的統計圖表。
import和from...import的區別
(import 語句:比如要引用模組 math,就可以在檔案最開始的地方用 import math 來引入。在呼叫 math 模組中的函式時,必須這樣引用:模組名.函式名
from…import 語句:
from fib import fibonacci
這個宣告不會把整個 fib 模組匯入到當前的命名空間中,它只會將 fib 裡的 fibonacci 單個引入到執行這個宣告的模組的全域性符號表。
from…import*
把乙個模組的所有內容全都匯入到當前的命名空間。
np.unique( )的用法
該函式是去除陣列中的重複數字,並進行排序之後輸出。
python enumerate() 函式
(enumerate() 函式用於將乙個可遍歷的資料物件(如列表、元組或字串)組合為乙個索引序列,同時列出資料和資料下標,一般用在 for 迴圈當中。python 2.3. 以上版本可用,2.6 新增 start 引數。
sklearn的make_circles和make_moons生成資料
(make_circles:生成環形資料
make_moons:生成半環形圖
pandas dataframe的基本屬性詳解
(import pandas as pd 導入庫
df = pd.dataframe(data=none, index=none, columns=none, dtype=none, copy=false)
** 功能
1 dataframe() 建立乙個dataframe物件
2 df.values 返回ndarray型別的物件
3 df.index 獲取行索引
4 df.columns 獲取列索引
5 df.axes 獲取行及列索引
6 df.t 行與列對調
7 df. info() 列印dataframe物件的資訊
8 df.head(i) 顯示前 i 行資料
9 df.tail(i) 顯示後 i 行資料
10 df.describe() 檢視資料按列的統計資訊
sklearn內建資料集boston房價資料集:
iris資料集:
iris 鳶尾花資料集是乙個經典資料集,在統計學習和機器學習領域都經常被用作示例。
資料集內包含 3 類共 150 條記錄,每類各 50 個資料
每條記錄都有 4 項特徵:花萼長度、花萼寬度、花瓣長度、花瓣寬度
可以通過這4個特徵**鳶尾花卉屬於(iris-setosa, iris-versicolour, iris-virginica)中的哪一品種。
機器學習Task01
x,y 輸入資料,array like,shape n,s 點的大小 標量或array like,shape n,可選 大小以點數 2。預設是rcparams lines.markersize 2。c 點的顏色 順序或顏色順序,可選,預設 b c可以是單個顏色格式的字串,也可以是一系列顏色 規範的長...
Task01 機器學習的三大主要任務
接觸可挺久的機器學習了,這次有機會重頭開始學習機器學習,感覺機器學習的發展史需要再梳理一下了 機器學習階段 年份主要成果 代表人物 人工智慧起源 1936 自動機模型理論 阿蘭 圖靈 alan turing 1943 mp模型 沃倫 麥卡洛克 warren mcculloch 沃特 皮茨 walte...
整合學習(上)Task01 熟悉機器學習的主要任務
這算是我第一次正式 系統學習 機器學習 和 整合學習 言外之意我就是個小白 交通專業,不過對用python進行資料分析還是有基礎的 關於打卡,我只想把自己最關心的 對我最有價值的部分提取出來,一方面算作給自己的回憶,另一方面也算做給和我同樣水平的小夥伴的分享吧!一句話概括機器學習 利用數學模型來理解...