講稿1(度量是簡單的事情嗎?)

2021-03-31 08:56:31 字數 784 閱讀 2971

下面是我們的故事:一所大學有兩個系,1系和

2系。學校領導要求增加在校女生的數量。下圖是當時的情況:

圖1:1980,1990學校裡系1和系2男生和女生的人數和比例

2023年係1有50位男生和50位女生,因此系1有50%的女生。到2023年係1有10位男生和15位女生,女生的比例增長到60%。因此系1履行了領導的決定。

2023年係2有25位男生和5位女生,因此大約有17%的女生。到2023年,系2有75位男生和20位女生。系2女生的比例因此增長到大約21%,這樣,系2同樣也履行了學校領導的決定。 

圖2:整個學校男女生人數以及比例.

上面陳述的比例表明兩個系從1980到1990都增加了女生的數量。一切看起來都很正常。然而,兩個系的男女生加在一起的資料表示了完全不同的另外一種比例。學校領導是這樣計算的。他先把兩個系1980男女生人數分別加在一起,然後把2023年的加在一起。接著他計算比例。校領導計算的女生比例是從1980的42%下降到2023年的29%!然而,兩個系都稱從1980到2023年女生的比例是增加的。他們可以證明。

問題是:是什麼搞錯了。

有些人說上面的例子不會在現實中出現。他們說它是人為製造的例子。我們只不過會說明業界某種最有用的軟體度量也存在類似於simpson's悖論的屬性。這就是

缺陷-密度度量(measure defect-density)。請看講稿2。( second lecture.)

測試小故事90 度量(Measure)

一切皆可度量。度量 measure 常被提起,理解卻有不同。有時清楚,更多的時間是模糊。剛工作時,參與cmm評估,培訓到了cmm4 5級,接觸到了 度量 模模糊糊不知所以,只是淺淺的有了基線的概念。後來發現scm同樣有基線的定義,與度量的基線並非同一概念,為什麼要有基線更是不明原因。做了測試工作,每...

7 5 度量空間中的緊緻性

7.5 度量空間中的緊緻性 本節重點 掌握度量空間中的緊緻空間 可數緊緻空間 序列緊緻空間 列緊空間之間的關係 由於度量空間滿足第一可數性公理,同時也是 定義7.5.1 設a是度量空間 x,中的乙個非空子集 集合a的直徑diam a 定義為 diam a sup若a是有界的 diam a 若a是無界...

機器學習基礎 各種學習方式(17) 度量學習

距離的度量對眾多機器學習方法的效能都起到了決定性作用 例如在分類方法中,k近鄰分類器 使用了高斯核的核方法 在聚類方法中,k均值聚類 譜聚類方法都與距離度量密切相關。卡內基梅隆大學機器學習系的邢波教授於2003年提出了距離度量學習。乙個好的距離度量能夠根據資料的結構與分布適用於不同的應用。一般的距離...