機器學習周志華 機器學習的應用領域

2022-09-05 03:00:14 字數 506 閱讀 3483

多**、圖形學、網路通訊等計算機應用技術領域,尤其是計算機視覺、自然語言處理。

交叉學科的技術支撐,例如生物資訊學,它的研究涉及從「生命現象」到「規律發現」的整個過程,包括資料處理整個流程,其中「資料分析」就是機器學習的舞台。

資料科學的核心即通過分析資料獲取價值。機器學習是大資料時代必不可少的核心技術,因為收集儲存管理大資料的目的,就是利用大資料,沒有機器學習分析資料,利用則無從談起。

資料探勘與機器學習:資料探勘是從海量資料中發掘知識的技術,在20世紀90年代形成,資料庫、機器學習、統計學對其影響最大;資料庫技術提供資料管理技術,機器學習和統計學習則為資料探勘提供資料分析技術,統計學界成果通常要經由機器學習研究形成有效的學習演算法,然而用於資料探勘,因此,統計學主要通過機器學習對資料探勘發揮影響,機器學習和資料庫技術則是資料探勘的兩大支撐。

自動駕駛

機器學習已成為智慧型資料分析技術的創新源泉,另外,促進理解「人類如何學習」這個人類自我的本識認知。即機器學習不僅在資訊科學占有重要地位,還具有一定的自然科學探索色彩。

周志華《機器學習》 整合學習

boosting的工作過程是 boosting演算法的代表演算法adaboost詳解,可參照 bagging演算法的工作過程是 bagging的代表演算法是隨機森林,隨機森林是利用決策樹作為個體學習器演算法,在決策樹訓練過程中引入和隨機屬性選擇的bagging演算法。從理論上證明,個體學習器準確性越...

機器學習周志華筆記

1,監督學習 分類 回歸 無監督學習 聚類 2,決策樹 根據資訊增益的大小來確定節點 資訊熵 描述事務確定性程度的值 需要多少個bit來描述資訊 ent d pklog2pk 資訊增益 資訊熵 某個屬性劃分的平均資訊熵 該屬性劃分純度 3,支援向量機中對超平面的理解 劃分超平面用以下線性方程表示 w...

周志華 機器學習 筆記

學習演算法自身的歸納偏好與問題是否相配,往往會起到決定作用。對於上面這句話 你的輸入資料被怎麼處理,最終得到什麼結果,我認為偏好指的就是這個處理的過程。線性非線性?那些feature忽略掉?怎麼利用這些資料?更具體一些,你用網路處理,還是傳統方法,資料的分布和你的處理方法相符嗎?沒有免費的午餐定理 ...