多示例學習

2021-10-05 12:28:13 字數 1534 閱讀 5842

多示例學習(multiple-instance learning)[1]由dietterich等人在2023年提出,其與監督學習、半監督學習和非監督學習有所不同,它是以多示例包(bag)為訓練單元的學習問題。在多示例學習中,訓練集由一組具有分類標籤(label)的多示例包(bag)組成,每個多示例包(bag)含有若干個沒有分類標籤的示例(instance)。如果多示例包(bag)至少含有乙個正示例(instance),則該包被標記為正類多示例包(正包)。如果多示例包的所有示例都是負示例,則該包被標記為負類多示例包(負包)。多示例學習的目的是,通過對具有分類標籤的多示例包的學習,建立多示例分類器,並將該分類器應用於未知多示例包的**。

很多傳統的分類問題可以轉化為多示例學習問題。例如,在影象分類中,我們把含有「大象」的影象被分為正類,不含有「大象」的影象被分為負類。在訓練集中,假設60幅影象含有「大象」,40幅影象不含有「大象」。

(1)對於上圖,在傳統分類中,一幅影象可以轉化為乙個向量(示例)。因此,資料集中有60個正類示例(影象)和40個負類示例(影象)。每乙個示例(影象)的label都是已知的,訓練集給定的。在60個正類示例和40個負類示例的基礎上,建立分類器,區分正類示例和負類示例

(2)但是,一幅可能包含複雜的內容資訊,譬如這幅畫不僅含有「大象」,還包含了天空、和草地等多個影象內容。對於「大象」來說,「天空」和「草地」可以被認為是雜訊,這導致**時分類精確度的降低。

(3)因此如果把整幅影象看作單個向量,難以充分描述多個影象內容。為此,研究者把影象按照不同內容區域進行分割,如下:

我們把圖2看作乙個多示例包bag,1個分割區域看作乙個示例instance。由於圖2含有3個分割區域,因此圖2的多示例包含有3個示例instance。每乙個分割區域(instance)可以轉化為1個向量。因此,圖2的多示例包含有3個向量,這就把傳統的影象分類轉化為多示例學習問題。

在多示例學習中,多示例包bag的label是已知的,示例instance的label是未知的。圖2屬於正類,含有「大象」,這個影象label是訓練集給定的。但是,圖2的3個分割區(instance),哪個區域含有大象,哪個區域不含有大象,我們是不知道的。因此,在多示例中,多示例包bag (影象)的label是已知的(訓練集給定的),但是,示例instance(分割區域)的label是未知的。我們的任務是,在正類多示例包bag和負類多示例包bag的基礎上,建立分類器,區分正類多示例包和負類多示例包。困難之處在於,每個多示例包含有若干個示例(向量),只有多示例包(影象)的label是已知的,多示例包裡面的示例(分割區域)的label是未知的。

dietterich t g, lathrop r h, lozano-pérez t. solving the multiple instance problem with axis-parallel rectangles[j]. artificial intelligence, 1997, 89(1-2): 31-71.

機器學習 多示例學習MIL

根據訓練資料的歧義性大小,大致可以把在該領域進行的研究劃分為三種學習框架 監督學習 非監督學習和強化學習。監督學習的樣本示例帶有標記 非監督學習的樣本示例沒有標記,因而該學習模型的歧義性較大。多示例學習可以認為是與三種傳統學習框架並列的第四種學習框架,由dietterich等人於1997年提出,提出...

機器學習 多示例學習MIL

根據訓練資料的歧義性大小,大致可以把在該領域進行的研究劃分為三種學習框架 監督學習 非監督學習和強化學習。監督學習的樣本示例帶有標記 非監督學習的樣本示例沒有標記,因而該學習模型的歧義性較大。多示例學習可以認為是與三種傳統學習框架並列的第四種學習框架,由dietterich等人於1997年提出,提出...

MIL 多示例學習 特徵選擇

乙個主要的跟蹤系統包含三個成分 1 外觀模型,通過其可以估計目標的似然函式。2 運動模型,位置。3 搜尋策略,尋找當前幀最有可能為目標的位置。mil主要的貢獻在第一條上。mil與ct的不同在於後者是通過感知矩陣進行特徵提取,而mil是通過boosting框架來進行特徵選擇,選擇出來的特徵 高斯分布 ...