YS 20190815 機器學習

2021-09-26 05:18:33 字數 1892 閱讀 6189

演算法講解:

機器學習、人工智慧和深度學習的關係

機器學習的開發流程

機器學習的核心思想 -----------------很重點

進行演算法講解 (8種人工智慧、機器學習的演算法)+高數進行資料分析

建立人工智慧模型,module

大量的利用資料集進行資料的交易 (輸入資料 )-------通過模型去校驗資料的維度《魯棒性》—通過機器輸出到外界!

資料集收集----**未來

開發乙個會聊天的機械人—模仿人類~~~ (卷積神經網路 、影象影象處理 、自然語言識別)

精準營銷:從使用者群眾中找出特定的要求的營銷物件。

客戶細分:試圖將使用者群體分為不同的組,根據給定的使用者特徵進行客戶分組。

**建模及分析:根據已有的資料進行建模,並使用得到的模型**將來

重點模型數學模型:

判別式模型 g:x__y 對"聯合條件概率p(x|y)"進行建模,----一次函式、二次函式、tan函式、cothans、cos函式…常見判別模型有: 線性回歸、決策樹、支援向量機svm、k近鄰、神經網路等;----重點技術!

生成式模型(generative model):對"聯合分布概率p(x,y)"進行建模,—>正態分佈、常見生成式模型有: 隱馬爾可夫模型hmm、樸素貝葉斯模型、高斯混合模型gmm、lda等;

核心思想:生成式模型關注資料是"如何產生"的,尋找的是"資料分布模型";判別式模型關注的資料的 差異性,尋找的是分類面

切記:由生成式模型可以產生判別式模型,但是由判別式模式沒法形成生成式模型-----思想:資料集的採集思想

無監督學習試圖學習或者提取資料背後的資料特徵,或者從資料中抽取出重要的特徵資訊。常見的演算法有"聚類"、「降維」、"文字處理(特徵抽取)"等。

與監督學習相比,無監督學習的訓練集中沒有人為的標註的結果,在非監督的學習過程中, 資料並不被特別標識,學習模型是為了推斷出資料的一些內在結構。

例如:超市的機器結賬機 :通過產品的標誌直接返回結賬資訊—節省了很大的人力成本問題!

分類2分類:通過分類模型,將樣本資料集中的樣本對映到某個給定的類別中

聚類:通過聚類模型,將樣本資料集中的樣本分為幾個類別,屬於同一類別的樣本相似性比較大

回歸:反映了樣本資料集中樣本的屬性值的特性,通過函式表達樣本對映的關係來發現屬性值之間的依賴關係

關聯規則:獲取隱藏在資料項之間的關聯或相互關係,即可以根據乙個資料項的出現推導出其他資料項的出現頻率。

分類決策樹演算法,決策樹的核心演算法,id3演算法的改進演算法。

c4.5演算法:回歸演算法是基於 c4.5的決策資料集的返回結果 ---------結果是乙個維度空間向量的值?list、元組、字典如:—>資料集

(knn)k近鄰分類演算法;如果乙個樣本在特徵空間中的k個最相似的樣本中大多數屬於某乙個類別,那麼該樣本也屬於該類別。

深度學習是機器學習的子類;

深度學習是基於傳統神經網路演算法發展到「多隱層」的一 種「演算法」體現。

深度學習的核心:「多隱層」的一 種「演算法」體現。

資料"預"處理:指的是將採集的 "資料集"通過 演算法,變為滿足無監督 、有監督、半監督的學習過程資料!

特徵提取:根據業務不同:例如:進行人臉識別 —提取?----呼叫介面(公安系統)----影象識別。例如:去新公司入職:打卡機人臉識別錄入資訊:示下動作(眨眨眼睛、張張嘴巴(因為張嘴巴會無法識別影象、導致特徵無法提取!–將張嘴巴的資料特徵儲存到資料集裡面)、搖搖頭…)----因為人的全部特徵提取不到,尤其是耳朵!證明無法**!導致資料集缺失!

備註:人工智慧是一門整合了很多學科的技術(特徵、影象等屬於生物;演算法屬於數學,物理;自然語言處理----語文等)

模型構建 ----上官網看原始碼案例!

模型測試評估 p

投入使用(模型部署與整合) 迭代優化表示的是資料集完整的交給機器學習處理!

機器學習 初識機器學習

1.什麼是機器學習?對於機器學習到現在都還沒有統一的定義,但是,通過乙個例子和較權威的定義來理解機器學習,最後附上我個人對機器學習的理解 2.監督學習 1 監督學習基本思想 我們資料集中的每個樣本都有相應的 正確答案 即每個樣本都是真實值,再根據這些樣本作出 舉乙個房價預售的例子來說明 eg 下面圖...

機器學習 機器學習目錄

注 後期有時間的話會對每乙個演算法進行講解。1 普通線性回歸 2 廣義線性模型 3 邏輯回歸 4 線性判定分析1 決策樹基本原理與構建 2 cart演算法 3 回歸決策樹 4 分類決策樹1 貝葉斯定理與樸素貝葉斯 2 高斯貝葉斯分類器 3 多項式貝葉斯分類器 4 伯努利貝葉斯分類器 5 遞增式學習1...

機器學習一 機器學習概要

回歸 是指把實函式在樣本點附近加以近似的有監督的模式識別問題。對乙個或多個自變數和因變數之間關係進行建模,求解的一種統計方法。分類 是指對於指定的模式進行識別的有監督的模式識別問題。異常檢測 是指尋找輸入樣本ni 1i 1 n中所包含的異常資料的問題。常採用密度估計的方法 正常資料為靠近密度中心的資...