機器學習 三 輸出

2021-09-12 03:16:57 字數 1429 閱讀 4661

機器學習:輸出

機器學習的輸出時一系列的模式的表達方式,是推斷資料輸出結構的技術

以下就是輸出結構的表達方式:

一、決策表

與輸入的**相似,從輸入表中找到一些合適的條件組合來確定最終的結果

二、決策樹

乙個決策樹上的節點包含了對某個特定屬性的測試。葉節點給到達葉子的例項給出乙個分類。當路徑採用**成幾個部分,**部分需要有權值,權值和為1

路徑:1.名詞性屬性--名詞列舉,相同名詞性屬性不能再樹種重複出現

--名詞可能的子集,可能會在一條路徑上出現不止一次

2.數值屬性  --區間範圍,可分為區間下,區間內,區間上;殘缺值有時是單獨乙個分支,或是多數原則

建立決策樹:需要觀察資料的方法來確定使用哪些屬性,哪種測試方法(區間,子集等等)。

三、分類規則

結論則給出適合指定規則所覆蓋例項的分類(1到n)  ,或是給出例項所在類上的概率分布,如

%start

if x=1 and y=1 then class = a;

if x=1 and w=1 then class =a;

otherwise class = b;

%end;

(決策樹不容易從規則轉換為樹,而且會導致重複子樹問題,如a-b-x,b-c-x,或預設值;相比決策樹,會避免重複子樹的問題,並且較容易新增新規則。但是相反,當規則不能對所有例項進行分類,必須用策略解決,如選擇出現頻率高的,而決策樹是不會出現的。而且分類規則對非布林值處理起來會很麻煩,如處理區間集合)

四、關聯規則

定義:對比分類規則,關聯規則可以**任何屬性,不僅僅是類。分類規則組合為規則集去決定結果,而關聯規則用來揭示資料集的不同規律,用來**不同的事物。只找出覆蓋例項量大,正確率高的關聯規則。

定義:覆蓋量coverage是覆蓋例項量

正確率accuracy,也成置信度confidence,覆蓋量所在比率

(注意:多結果的關聯規則包含多重含義,如條件的置信度,條件和結果的重組關聯規則)

五、包含例外的規則

定義:允許包含例外,或新發現的規則。

將與例外有關的規則取出,並用其他屬性或定義邊界新增例外的規則

六、包含關係的規則

規則中包含了其他規則,如if height(tower.top) > width(tower.top) then standing(tower.top).

七、數值**樹

在葉節點擁有平均數值的決策樹稱為回歸樹regression tree

包含回歸公式的決策樹稱為模型樹model tree

八、基於例項的表達

儲存例項的規則表示式,新例項來後尋找以後的「相似」,也就是最鄰近例項,此方法稱為最鄰近分類方法nearest-neighbor,當有多個鄰近例項,則用經距離-加權的平均值

九、聚類

當輸出是聚類,而不是乙個分類器時,則輸出是乙個新例項如何落入聚類的圖形形式。

機器學習入門(三)

今天了解的幾個概念 1 neurogrid 2014年5月13日訊息,美國研究人員日前發明了一種基於人腦構造設計的全新晶元電路板 neurogrid 據悉,neurogrid能夠模擬人腦中的100萬個神經元和數十億個突觸連線,而其運算速度已經達到了現有普通電腦的9000倍之巨。然而,同人類大腦的運算...

機器學習導論(三)

監督學習 監督 supervised 是指訓練資料集中的每個樣本均有乙個已知的輸出項 類標label 輸出變數為連續變數的 問題稱為回歸問題,回歸演算法有 簡單線性回歸,多元線性回歸,lasson回歸,ridge回歸,elastictnet 輸出變數為有限個離散變數的 問題稱為分類問題,分類演算法有...

機器學習入門 三

python中的list 的特點 不限制其中每乙個元素的型別,可以使用下標訪問,但是比較慢.也可以使用array.需要import arrary 這個包.import array arr array.array i i for i in range 10 arr輸出 array i 0,1,2,3,...