不同範數下的餘弦定理 人工智慧基礎 範數的物理意義

2021-10-13 23:42:19 字數 1974 閱讀 7036

什麼是範數?

我們知道距離的定義是乙個寬泛的概念,只要滿足非負、自反、三角不等式就可以稱之為距離。範數是一種強化了的距離概念,它在定義上比距離多了一條數乘的運算法則。有時候為了便於理解,我們可以把範數當作距離來理解。

在數學上,範數包括向量範數和矩陣範數,向量範數表徵向量空間中向量的大小,矩陣範數表徵矩陣引起變化的大小。一種非嚴密的解釋就是,對應向量範數,向量空間中的向量都是有大小的,這個大小如何度量,就是用範數來度量的,不同的範數都可以來度量這個大小,就好比公尺和尺都可以來度量遠近一樣;對於矩陣範數,學過線性代數,我們知道,通過運算,可以將向量x變化為b,矩陣範數就是來度量這個變化大小的。

這裡簡單地介紹以下幾種向量範數的定義和含義

1、 l-p範數

與閔可夫斯基距離的定義一樣,l-p範數不是乙個範數,而是一組範數,其定義如下:

根據p 的變化,範數也有著不同的變化,乙個經典的有關p範數的變化圖如下:

上圖表示了p從無窮到0變化時,三維空間中到原點的距離(範數)為1的點構成的圖形的變化情況。以常見的l-2範數(p=2)為例,此時的範數也即歐氏距離,空間中到原點的歐氏距離為1的點構成了乙個球面。實際上,在0時,lp並不滿足三角不等式的性質,也就不是嚴格意義下的範數。以p=0.5,二維座標(1,4)、(4,1)、(1,9)為例,

因此這裡的l-p範數只是乙個概念上的寬泛說法。

2、l-0範數

當p=0時,也就是l0範數,由上面可知,l0範數並不是乙個真正的範數,它主要被用來度量向量中非零元素的個數。用上面的l-p定義可以得到的l-0的定義為:

表示向量中非零元素的個數。對於l0範數,其優化問題為:

在實際應用中,由於l0範數本身不容易有乙個好的數學表示形式,給出上面問題的形式化表示是乙個很難的問題,故被人認為是乙個np難問題。所以在實際情況中,l0的最優問題會被放寬到l1或l2下的最優化。

3、l-1範數

l1範數是我們經常見到的一種範數,它的定義如下:

表示向量中非零元素的絕對值之和。l1範數有很多的名字,例如我們熟悉的曼哈頓距離、最小絕對誤差等。使用l1範數可以度量兩個向量間的差異,如絕對誤差和(sum of absolute difference):

對於l1範數,它的優化問題如下:

由於l1範數的天然性質,對l1優化的解是乙個稀疏解,因此l1範數也被叫做稀疏規則運算元。通過l1可以實現特徵的稀疏,去掉一些沒有資訊的特徵,例如在對使用者的電影愛好做分類的時候,使用者有100個特徵,可能只有十幾個特徵是對分類有用的,大部分特徵如身高體重等可能都是無用的,利用l1範數就可以過濾掉。

4、l-2範數

l2範數是我們最常見最常用的範數了,我們用的最多的度量距離歐氏距離就是一種l2範數,它的定義如下:

表示向量元素的平方和再開平方。

像l1範數一樣,l2也可以度量兩個向量間的差異,如平方差和(sum of squared difference):

對於l2範數,它的優化問題如下:

l2範數通常會被用來做優化目標函式的正則化項,防止模型為了迎合訓練集而過於複雜造成過擬合的情況,從而提高模型的泛化能力。

5、l-∞範數

當p=∞時,也就是l-∞範數,它主要被用來度量向量元素的最大值。用上面的l-p定義可以得到的l的定義為:

來表示。

不同範數下的餘弦定理 矩陣理論 範數和譜半徑

線性運算元 的譜半徑定義為 譜半徑在演算法的收斂性證明中起到舉足輕重的作用。我們先看乙個簡單的事實。運算元作用在特徵向量上就是乙個拉伸,這裡是廣義的拉伸,因為特徵值有可能是複數。那麼反覆作用會怎麼樣呢?假設 是矩陣 的乙個特徵值,是對應的特徵向量。那麼 兩邊同時取模,如果,那麼 as 反過來,如果 ...

人工智慧時代下的教與育(二)

古人云,授之以魚不如授之以漁,意思是,給他一條魚,只夠這個人維持一兩天的生活,那就不如交給他捕魚的方法嘍!如今,人工智慧時代即將來臨,我們絕大部人只是會使用智慧型產品,比如洗碗機,掃地機械人,輔導學習的機械人,幫助醫生識別特定疾病的智慧型助手等,這就好像是我們接受了別人慷慨解囊的 魚 我們也只是可以...

麥肯錫最新調查 大多數公司缺乏人工智慧的基礎設施

如果一家公司近年來正在積極地對待其數字投資 digital investments 與相關戰略,那麼它就有很大可能會在人工智慧領域取得成功。這一結論來自麥肯錫的分析師jacques bughin和nicolas van zeebroeck,他們最近就 高管們在人工智慧領域面臨的挑戰 這一問題進行了調...