變數,定量變數,定性變數
舉例:西瓜的色澤,敲聲,大小等
定量:數值型變數
定性:描述型變數
區分數量變數,區間變數,連續變數,離散變數
數量變數——離散變數
區間變數——連續變數:可取值數目不再有限,在一定區間內任意取值。etc:人的身高
區分名義變數,分類變數,定序變數
定序:文盲半文盲=1,小學=2,初中=3,高中=5……(受教育程度)
名義變數:性別:男,女(認為劃分的多種類別)
分類變數:有時也稱為名義變數
什麼是資料?資料和變數之間關係
關於西瓜的資料(色澤=青綠色,根蒂=蜷縮,敲聲=濁響)
什麼是觀測值,觀測值和變數有什麼關係
變數對應的值
模型是什麼?
「從資料中學到的結果」,比如說建立乙個關於**的模型,幫助我們判斷沒剖開的瓜是不是「好瓜」
構建模型的目的
遇到新的資料,,可以**出對應的結果
模型是根據什麼來建立的?
模型是根據已有的資料來建立的,在面對新情況時,模型會給我們提供相應的判斷
模型是不是絕對正確?
不是。因為**本就是一門模糊的學科,如果這個看起來像是x,那就做y操作
什麼是因變數?什麼是自變數?根據什麼來確定?什麼是有指導學習?
訓練資料擁有標記資訊(即y)
什麼是回歸?回歸的目的?回歸的具體步驟?舉例說明
**的變數是連續的,西瓜的成熟度(0.95,0.37)
目的是得到乙個通過屬性的線性組合來進行**的函式
具體步驟:什麼是分類?分類的目的?分類的步驟?
**的變數是離散值
當前樣本屬於哪乙個類別
步驟什麼是最小二乘回歸?其他回歸?
在回歸中採用最小二乘法,即均方誤差最小化來進行引數估計的方法
邏輯回歸——用於兩分類問題—–採用最大似然估計
什麼是logistic回歸?它是回歸嗎?目的是?
廣義線性模型—分類學習方法
logistic回歸得到的**結果是類嗎?
不是。是乙個概率值,通過擬合乙個邏輯函式來**乙個事件發生的概率(【0,1】)–p值
logistic回歸的結果依賴於什麼主觀選擇?
依賴於闕值的主觀選擇,一般選擇0.5
決策樹的構成?什麼是決策樹的節點?其構成是什麼?
乙個根節點,若干個內部節點,若干個葉節點。每個節點由資料構成,有乙個拆分變數。
什麼是分類節點
15.
機器學習基礎 機器學習基礎引入
機器學習 是人工智慧的核心研究領域之一,其最初的研究動機是為了讓計算機系統具有人的學習能力以便實現人工智慧。事實上,由於 經驗 在計算機系統中主要是以資料的形式存在的,因此機器學習需要設法對資料進行分析,這就使得它逐漸成為智慧型資料分析技術的創新源之一。機器學習是構建複雜系統的一種方法,也許依靠我們...
機器學習基礎學習筆記 機器學習基礎介紹
概念 多領域交叉學科,設計概率論 統計學 逼近論 凸分析 演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。學科定位 人工智慧 artificial intelligence,ai 的核心,是是計算機具有智慧型...
機器學習 二 機器學習基礎
機器學習基礎概念 關於資料 監督學習 機器學習的基本任務,具體可以做什麼?結果是乙個連續數字的值,而非乙個類別 回歸任務可以劃分成分類任務。給機器的訓練資料擁有 標記 或者 答案 例如 1.影象已經擁有了標定資訊 2.銀行已經積累了一定的客戶資訊和他們信用卡的信用情況 3.醫院已經積累了一定的病人資...