所謂人工智慧,通俗地講是指由人工製造出來的系統所表現出來的智慧型
機器學習簡單來講就是通過演算法,使機器能從大量歷史資料中學習規律,從而對新的樣本做出智慧型識別或對未來做**
機器學習是基於概率統計、矩陣或圖模型而得出的分析結論
機器學習是人工智慧的乙個分支
深度學習是機器學習的乙個新領域
監督學習
邏輯回歸、k近鄰、樸素貝葉斯、隨機森立、支援向量機
無監督學習
k-means、dbscan、協同過濾、lda
半監督學習
標籤傳播
強化學習
隱馬爾可夫
監督學習法supervised learning
通過過往的一些資料的特徵以及最終結果來進行訓練的方式就是監督學習法
分類演算法 k近鄰、樸素貝葉斯、決策樹、隨機森林、gbdt和支援向量機等
回歸演算法 邏輯回歸、線性回歸等
無監督學習unsupervised learning
是指訓練樣本不依賴於打標資料的機器學習演算法:無監督學習主要是用來解決一些聚類場景的問題,因為當我們的訓練資料缺失了目標值之後,能做的事情就只剩下比對不同樣本間的距離關係
聚類演算法 k-means、dbscan等
推薦演算法 協同過濾等
半監督學習semi-supervised learning
對樣本的部分打標來進行機器學習演算法的使用,這種部分打標樣本的訓練資料的演算法應用,就是半監督學習
目前很多半監督學習演算法都是監督學習演算法的變形,本書將介紹一種半監督學習演算法——標籤傳播演算法
強化學習reinforcement learning
強調的是系統與外界不斷地互動,獲得外界的反饋,然後決定自身的行為。強化學習目前是人工智慧領域的乙個熱點演算法種類,典型的案例包括無人汽車駕駛和阿爾法狗下圍棋。本書介紹的分詞演算法隱馬爾科夫就是一種強化學習的思想。
無人汽車駕駛和阿爾法狗, 分詞演算法隱馬爾科夫
場景解析是資料探勘流程的第1步
過擬合(over-fitting),
精確率、召回率、f1值
資料探查
資料量的大小
資料缺失或亂碼
字段型別
是否含有目標佇列
etl操作(描述將資料從**端經過抽取(extract)、轉換(transform)、載入(load)至目的端的過程),稱為「資料清洗
場景抽象
商品推薦
疾病**
人物關係挖掘
把商品購買行為抽象成了「是」或者「否」這樣的二分類問題
對應症狀,所以只要挖掘每個時期的不同病變特徵,就可以實現**,進而可以把癌症**抽象成乙個多分類的場景
演算法選擇
確定演算法範圍
多演算法嘗試
多視角分析
資料預處理是資料探勘流程的第2步
取樣隨機取樣
系統取樣
分層取樣
歸一化公式y=(x-minvalue)/(maxvalue- minvalue)
歸一化是指一種簡化計算的方式,將資料經過處理之後限定到一定的範圍之內,一般都會將資料限定在[0,1]。
可以加快演算法的收斂速度
資料過濾
去除雜訊
人工智慧 機器學習和深度學習
注 本文翻譯自網上的一篇文章,有刪節,原文 人工智慧 這個術語大家都比較熟悉。畢竟,它一直是電影中的熱門焦點,例如 終結者 黑客帝國 等等。但您最近可能還聽說過其他術語,如 機器學習 和 深度學習 有時它們與 人工智慧 交替使用。結果,人工智慧 機器學習和深度學習之間的區別可能非常不明確。接下來,我...
人工智慧 機器學習和深度學習
人工智慧定義 努力將通常由人類完成的智力任務自動化。人工智慧是乙個綜合性的領域,不僅包括機器學習與深度學習,還包括更多不涉及學習的方法。機器學習 給定包含預期結果的示例,機器學習將會發現執行一項資料處理任務的規則。機器學習的技術定義 在預先定義好的可能性空間中,利用反饋訊號的指引來尋找輸入資料的有用...
人工智慧機器學習
機器學習是從資料中自動分析獲得規律 模型 並利用規律對未知資料進行 資料處理 首先將所有資料放在一起,然後將其順序打亂。由於順序不是判斷酒水的依據,我們並不期望順序影響到模型學習到的內容。換言之,我們判斷一種酒是紅的還是啤的,並不需要知道前一種或是接下來有什麼酒出現。這時,可以著手繪出視覺化的資料分...