我自學系列的第1講之機器學習概述

2021-10-20 08:25:22 字數 1993 閱讀 8679

1 人工智慧概述  

1.1 人工智慧起源

1.圖靈測試

2.達特茅斯會議

1.2 人工智慧三個階段

1.2023年代是正式形成期

2.1990

-2023年代是蓬勃發展期

3.2023年之後是深度學習期

1.3 人工智慧、機器學習和深度學習

1.機器學習是人工智慧的乙個實現途徑

2.深度學習是機器學習的乙個方法發展而來

1.4 主要分支介紹

1.4.1 計算機視覺

1.人臉識別

1.4.2 自然語言處理

1.語音識別

2.語義識別

1.4.3 機械人

1.5 人工智慧必備三要素

1.資料 2

.演算法 3

.計算力

1.6 gpu, cpu

1.gpu -

- 計算密集型

2.cpu -

- io密集型

2 機器學習工作流程

2.1 定義

1.資料 2

.自動分析獲得模型

3.** 4

.從資料中自動分析獲得模型,並利用模型對未知

5.資料進行**

2.2 工作流程

1.獲得資料

2.資料基本處理

3.特徵工程

4.機器學習(模型訓練)

5.模型評估

2.3 獲取到的資料集介紹

2.3.1 專有名詞

1.樣本 2

.特徵 3

.目標值

4.特徵值

2.3.2 資料型別構成

1.特徵值+目標值(目標值分為是離散還是連續的)

2.只有特徵值

2.3.3 資料劃分

1.訓練資料(訓練集)-

- 構建模型 0.7--

0.82

.測試資料(測試集)-

- 模型評估 0.2--

0.32.3

.4 資料基本處理

1.對數進行缺失值,去除異常值等處理

2.3.5 特徵工程

2.3.5.1 定義

1.把資料轉換成機器學習更容易識別的資料

2.3.5.2 為什麼需要特徵工程

1.資料和特徵決定了機器學習的上限,而模型和演算法只是逼近這個上限而已

2.3.5.3 包含內容

1.特徵提取

2.特徵預處理

3.特徵降維

2.3.6 機器學習

1.選擇合適的演算法對模型進行訓練

2.3.7 模型評估

1.對訓練好的模型進行評估

3 機器學習演算法分類

3.1 監督學習 -

- 有特徵值,有目標值

1.目標值連續 -

- 回歸

2.目標值離散 -

- 分類

3.2 無監督學習 -

- 僅有特徵值

3.3 半監督學習 -

- 有特徵值,但是一部分資料有目標值,一部分沒有

3.4 強化學習12

.四要素:agent, action, environment, reward

4 模型評估

4.1 分類模型評估

1.準確率

2.精確率

3.召回率

4.f1-score

5.auc指標

4.2 回歸模型評估

1.均方根誤差

2.相對平方誤差

3.平均絕對誤差

4.相對絕對誤差

5.決定係數

4.3 擬合

1.欠擬合

2.過擬合

問題一:為什麼喜歡用**塊的背景來寫文件?

因為它開頭能輸入空格,方便按照序號檢視,主要是習慣了黑底白字,重點是好看呀!

Linux自學系列 常用指令的使用

1.檢視目錄下內容 ls 列出目錄下的檔案資訊 ls l 以 詳細資訊 檢視目錄檔案 ls a 檢視目錄 全部 包括隱藏檔案 檔案 ls al 以 詳細資訊 檢視目錄 全部 包括隱藏檔案 檔案 2.進行目錄切換 cd dirname 進行目錄切換 dirname為當前目錄下資料夾名稱 cd 切換到上...

SAS自學系列 SAS語句的語法

sas是現今非常流行的資料分析和資料探勘軟體,想從事資料分析行業,掌握sas很有必要。雖然sas本身提供了豐富的人機互動介面,通過手動呼叫各個menu能方便地完成資料統計分析的任務,但是,通過 來呼叫各個功能模組無疑能為工作帶來巨大的靈活性,並顯著提高效率。本文主要是根據網上找到的乙個電子文件 sa...

第019講 函式 我的地盤聽我的

測試題 0.下邊程式會輸入什麼?def next print 我在next 函式裡.pre def pre print 我在pre 函式裡.next 結果 我在next 函式裡.我在pre 函式裡.有些程式語言不夠 聰明 向這類向前引用的方式會導致報錯,但python足夠 醒目 這段 是正確的!de...