醫學生 資料狗

2021-10-01 15:35:32 字數 865 閱讀 5750

#資料探勘學習之路

##第一本書-統計學習方法第二版

###1.感知機

(1)感知機是二類分類的線性分類模型,其輸入為例項的特徵向量,輸出為例項的類別,取+1和-1值

(2)感知機學習的目的是求出將訓練資料進行線性劃分的分離超平面

(3)感知機學習的演算法分為原始形式和對偶形式,如圖

(4)感知機**是用學習得到的感知機模型對新的輸入例項進行分類

(5)感知機模型(如圖),是一種線性分類模型,屬於判別模型

(6)資料集的線性可分性----存在某個超平面s能夠將資料集的正例項點和負例項點完全正確地劃分到超平面的兩側。

(7)感知機的學習策略是定義(經驗)損失函式並將損失函式極小化,即在假設空間中選取使損失函式式最小的模型引數w,b

###k近鄰法

(1)k近鄰演算法:給定乙個訓練資料集,對新的輸入例項,在訓練資料集中找到與該例項最鄰近的k個例項,這k個例項的多數屬於某個類,就把該輸入例項分為這個類。

(2)k近鄰模型,模型是由三個基本要素組成:距離度量,k值的選擇和分類決策規則決定。

a.在距離度量中,特徵空間中兩個例項點的距離是兩個例項點相似程度的反映

b.k值的選擇對k近鄰法的結果產生重大影響,k值的減小意味著整體模型變得複雜,容易發生過擬合,k值的增大就意味著整體的模型變得簡單,因此在應用中,k值一般取乙個比較小的數值,通常採用交叉驗證法來選取最優的k

c.在k近鄰法中的分類決策規則往往是多數表決,即由輸入例項的k個鄰近的例項中的多數類絕對輸入例項的類。

(3)k鄰近法的實現----kd樹

a. kd樹:一種對k維空間例項點進行儲存以便對其進行快讀檢索的樹形資料結構

b.構造kd樹的演算法,如圖

c.kd樹的最近鄰搜尋演算法,如圖

醫學 生物 名詞

細胞 大多數動植物細胞,直徑在20 30 m間。m,微公尺。細菌沒有成形的細胞核,只有擬核,屬於原核生物。直徑一般為1 m 10 m。真菌具有真核。直徑一般為10 m 100 m 病毒無完整細胞結構,構造很簡單 蛋白質外殼 遺傳物質,遺傳物質可以是dna,也可以是rna。病毒寄生在活細胞中,掠奪別人...

對於醫學生,為何程式這麼難??

建立乙個自定義列表 如何建立乙個註腳 注釋也是必不可少的 katex數學公式 新的甘特圖功能,豐富你的文章 uml 圖表 flowchart流程圖 匯出與匯入 飛翔吧 讓我醫學的思路都轉成 吧。十幾年的外科醫生經歷讓我有如此巨大的衝動去研究 請賜予我寫 的力量吧。你好!這是你第一次使用markdow...

醫學方面的創業計畫書 醫學生創業計畫書

工作計畫是對一定時期的工作預先作出安排和打算時,工作中都制定工作計 劃,工作計畫實際上有許多不同種類,它們不僅有時間長短之分,而且有範圍大 醫學生創業計畫書 第一章專案概述 人們對美的追求永不止息。中國美容業起步晚 發展快,在短短二十幾年壯 大起來尤其是集產品和服務與一身的美容院倍受青睞。而當下,美...