大三下學習進度日總結05

2022-07-05 18:30:17 字數 2994 閱讀 7823

希望所有溫柔又可愛的人最後都能幸福❤

今日總結:

**量400行左右

部落格量一篇

所學時間

8小時左右

了解到的知識點

機器學習week1,背單詞等

什麼是機器學習?

第乙個機器學習的定義來自於arthur samuel。他定義機器學習為,在進行特定程式設計的情況下,給予計算機學習能力的領域。

\(arthur\,\,samuel(1959).machine\,learning:\)

\(field\,of\,study\,that\,gives \,computers\,the\,ability\,to\,learn\,without\,being\,explicitly\,programmed.\)

在沒有明確設定的情況下使計算機具有學習能力的研究領域

另乙個年代近一點的定義,由tom mitchell提出,來自卡內基梅隆大學,tom定義的機器學習是,乙個好的學習問題定義如下,他說,乙個程式被認為能從經驗e中學習,解決任務t,達到效能度量值p,當且僅當,有了經驗e後,經過p評判,程式在處理t時的效能有所提公升。我認為經驗e就是程式上萬次的自我練習的經驗而任務t就是下棋。效能度量值p呢,就是它在與一些新的對手比賽時,贏得比賽的概率。

\(tom\,mitchell\,(1998)\,well-posed\,learning\,problem\)

\(a\,\,computer\,\,program\,\,is\,\,said\,\,to\,\,learn\,\,from\,\,experience\,\,e\,\,with\,\,respect\,\,to\,\,some\,\,task\,\,t\\and\,\,some\,\,performance\,\,measure\,\,p\,\,if\,\,its\,\,performance\,\,on\,\,t,\,\,as\,\,measured\,\,by\,\,p\\improves\,\,with\,\,experience\,\,e.\)

電腦程式從經驗\(e\)中學習,解決某一任務\(t\)進行某一效能度量\(p\),通過\(p\)測定在\(t\)上的表現因經驗\(e\)而提高

監督學習

假如說你想**房價。

前陣子,乙個學生從波特蘭奧勒岡州的研究所收集了一些房價的資料。你把這些資料畫出來,看起來是這個樣子:橫軸表示房子的面積,單位是平方英呎,縱軸表示房價,單位是千美元。那基於這組資料,假如你有乙個朋友,他有一套750平方英呎房子,現在他希望把房子賣掉,他想知道這房子能賣多少錢。

那麼關於這個問題,機器學習演算法將會怎麼幫助你呢?

我們應用學習演算法,可以在這組資料中畫一條直線,或者換句話說,擬合一條直線,根據這條線我們可以推測出,這套房子可能賣\(\$150,000\),當然這不是唯一的演算法。可能還有更好的,比如我們不用直線擬合這些資料,用二次方程去擬合可能效果會更好。根據二次方程的曲線,我們可以從這個點推測出,這套房子能賣接近\(\$200,000\)。稍後我們將討論如何選擇學習演算法,如何決定用直線還是二次方程來擬合。兩個方案中有乙個能讓你朋友的房子**得更合理。這些都是學習演算法裡面很好的例子。以上就是監督學習的例子。

可以看出,監督學習指的就是我們給學習演算法乙個資料集。這個資料集由「正確答案」組成。在房價的例子中,我們給了一系列房子的資料,我們給定資料集中每個樣本的正確**,即它們實際的售價然後運用學習演算法,算出更多的正確答案。比如你朋友那個新房子的**。用術語來講,這叫做回歸問題。我們試著推測出乙個連續值的結果,即房子的**。

現在來回顧一下,監督學習的基本思想是,我們資料集中的每個樣本都有相應的「正確答案」。再根據這些樣本作出**,就像房子和腫瘤的例子中做的那樣。我們還介紹了回歸問題,即通過回歸來推出乙個連續的輸出,之後我們介紹了分類問題,其目標是推出一組離散的結果。

無監督學習

在無監督學習中,我們已知的資料。看上去有點不一樣,不同於監督學習的資料的樣子,即無監督學習中沒有任何的標籤或者是有相同的標籤或者就是沒標籤。所以我們已知資料集,卻不知如何處理,也未告知每個資料點是什麼。別的都不知道,就是乙個資料集。你能從資料中找到某種結構嗎?針對資料集,無監督學習就能判斷出資料有兩個不同的聚集簇。這是乙個,那是另乙個,二者不同。是的,無監督學習演算法可能會把這些資料分成兩個不同的簇。所以叫做聚類演算法。事實證明,它能被用在很多地方。

其中就有基因學的理解應用。乙個dna微觀資料的例子。基本思想是輸入一組不同個體,對其中的每個個體,你要分析出它們是否有乙個特定的基因。技術上,你要分析多少特定基因已經表達。所以這些顏色,紅,綠,灰等等顏色,這些顏色展示了相應的程度,即不同的個體是否有著乙個特定的基因。你能做的就是執行乙個聚類演算法,把個體聚類到不同的類或不同型別的組(人)……

所以這個就是無監督學習,因為我們沒有提前告知演算法一些資訊,比如,這是第一類的人,那些是第二類的人,還有第三類,等等。我們只是說,是的,這是有一堆資料。我不知道資料裡面有什麼。我不知道誰是什麼型別。我甚至不知道人們有哪些不同的型別,這些型別又是什麼。但你能自動地找到資料中的結構嗎?就是說你要自動地聚類那些個體到各個類,我沒法提前知道哪些是哪些。因為我們沒有給演算法正確答案來回應資料集中的資料,所以這就是無監督學習。

無監督學習,是學習策略,交給演算法大量的資料,並讓演算法為我們從資料中找出某種結構。

大三下學習進度日總結06

希望所有溫柔又可愛的人最後都能幸福 今日總結 量400行左右 部落格量一篇 所學時間 8小時左右 了解到的知識點 軟體測試第一章,背單詞等 軟體測試入門基礎 軟體測試的目的是盡可能發現並排除軟體中潛藏的錯誤,提高軟體的可靠性 ieee將軟體可靠性定義為 系統在特定環境下,在給定的時間內無故障執行的概...

大三下學習進度日總結04

希望所有溫柔又可愛的人最後都能幸福 今日總結 量400行左右 部落格量一篇 所學時間 8小時左右 了解到的知識點 作業系統的四個特徵,背單詞等 作業系統的四個特徵 作業系統的特徵 併發,共享,虛擬,非同步 併發 併發指兩個或多個事件在同一時間間隔內發生。這些事件巨集觀上是同時發生的,但微觀上是交替發...

大三下學習進度日總結02

希望所有溫柔又可愛的人最後都能幸福 今日總結 量400行左右 部落格量一篇 所學時間 8小時左右 了解到的知識點 軟體質量,背單詞等 軟體質量 質量問題會增加開發和維護軟體產品的成本 軟體度量 software measurement 對軟體開發專案 過程及其產品進行定量化的過程,目的在於對其加以理...