系統思維模型看機器學習

2021-09-16 19:55:05 字數 1566 閱讀 9404

1. 機器學習的要素和深度學習的要素分別是什麼?

a: 機器學習的三要素簡單來說就是模型、策略和演算法.

模型:是乙個數學函式

策略:就是使用一種什麼樣的評價來度量模型訓練過程中學習好壞的方法,同時根據這個方法去調整模型的引數。舉個例子比如損失函式。

演算法:指模型的計算方法,比如梯度下降

在機器學習界流行這樣一句話:資料和特徵決定了機器學習演算法的上界,而模型和演算法只是逼近這個上界而已,這說明乙個事實,那就是我們不論我們的機器學習模型識別效果多麼準確,如果沒有好的特徵,也等於做無用功。也就是說,資料和特徵確定後,演算法最好能做成什麼樣基本已經確定了。此時的演算法好壞的差別可能在於誰更接近基於這個資料和特徵的的效果上限。

比如你發現一組資料符合一條直線,這個直線就是資料體現出來的特徵,根據這個特徵你發現直線的函式會比較適合,這樣你就選定了模型,然後選擇策略和演算法去求出函式的係數,最後得到確定的模型,擬合和回歸就不在話下。這是可以用條線表示的情況(在機器學習領域稱其為線性,對於非線性特徵就是到了深度學習的領域)

機器學習的風險論:而機器學習中也有經驗風險與結構風險,在這兩種風險中,實際上在真正的常見演算法的實現過程中使用的原則是結構風險最小。其中最小化損失函式對應的引數 θ 就叫做經驗風險最小化。該策略認為經驗風險最小的模型就是最優的模型,也就是minf∈f1nn∑i=1l(yi,f(xi))。在這個式子中,f是假設空間。統計學中的極大似然估計就是經驗風險最小化的乙個典型的例子。當模型是條件概率分布,損失函式是對數損失函式時,經驗風險最小化與極大似然估計等價。雖然在樣本數量足夠大的情況下,經驗風險最小化求解出來的模型能夠取得不錯的**效果,但是當訓練資料集也就是樣本容量比較小時,基於經驗風險最小化訓練出來的模型往往容易過擬合。

b:深度學習理論上要素是一致的,不過在步驟上有所不同,比如特徵的提取步驟可以跳過,比如非監督學習可以不提供特徵,讓演算法自動提取。這就是為什麼早期的神經網路大部分都是無監督學習

2. 機器學習的步驟和深度學習的步驟分別是怎樣的?

 收集資料(資料的採集這個應該不是問題,資料庫,爬蟲)

 處理資料並視覺化(總結和積累)

 根據視覺化的結果選擇合適的模型(線性還是非線性,是否有已經存在的模型,這個需要積累,對數學要非常敏感)

 訓練(這個要著重學習)

 評估模型(這個也比較容易,用適當的資料去驗證看準確率)

 引數微調(這個目前了解不多,應該也很重要)

 **

深度學習大同小異

3. 步驟中需要哪些條件?

按照步驟,需要:

 資料

 資料處理的方法及應用(資料視覺化,降維等等,影象的邊緣化….)

 合適的模型

 訓練(訓練需要合適的策略和演算法,這個也要找)

 引數微調(經驗和數學基礎)

 資料

總結:需求和市場總是掛鉤的,有些人選擇了去產生和蒐集資料去賣,有些去研究據處理的方法,也有不斷的去發現更好的模型(神經網路的發展就是從ann到bp模型到cnn,yolo這都是不斷發現的模型),也有的直接賣結果。寫下這篇文章是從系統的角度去尋找乙個學習的方向,去理解機器學習。不知道有沒有機會去做,但準備著好比書到用時方恨少。占用了少量考研複習的時間,最後對自己說一句加油。堅持堅持在堅持!

初看系統思維

今天偶看一篇文章講系統思維,本人對這方面還不是很了解,但我想既然是一種思維,會不會對我具有指導意義呢?先把部分文章貼在這裡,後面如果需要的時候再來看看。一 什麼是系統思維?一般系統論創始人貝塔朗菲認為,系統是由相互聯絡 相互作用的若干要素組成的表現為新功能的有機整體。系統並不僅僅是一些事物的簡單集合...

mysql學習思維模型

mysql是一種單程序,多執行緒的軟體 從mysql邏輯架構分析主要分為三層 1.服務層 2.核心層 3.儲存引擎層 服務層 主要是完成執行緒的管理程序中可以派生出新的執行緒,在建立和消除執行緒是一種消耗系統資源,所有mysql就建立出乙個 執行緒緩衝池,將不用的執行緒放到緩衝池中,可以解決併發量大...

機器學習模型 如何口述機器學習模型原理

重磅乾貨,第一時間送達 有時碰到跟別人聊起模型的熟悉時,不免要闡述下模型的原理,但一般口頭交流都比較難,因為腦海裡面都是一些公式,似乎從功利角度有必要把模型原理用文字表達一遍,所以自己整理了下機器學習的部分,有遺漏或者不對的地方也請多多指教 線性回歸 首先我們會定乙個函式假定y和x的關係,如y wx...