資料中存在的假象

2021-08-26 19:41:27 字數 628 閱讀 8918

在一些實施cmmi高成熟度的軟體公司中對於過程的效能資料進行分析時,常常發現應該具有相關性的2個變數根據歷史的資料不能證明這種相關性,或者是應該正相關的資料卻分析出了負相關的結論,原因何在呢?例如:

我們的經驗與常識:

假設或常識1:高水平的測試人員找出的bug多, 低水平的測試人員找出的bug少。

假設或常識2:高水平的開發人員犯的錯誤應該少,低水平的開發人員犯的錯誤應該多。

我們的實際資料:

在實踐中常常採用的策略:

策略1:關鍵的模組應該由高水平的開發人員進行開發,非關鍵的模組由低水平的開發人員進行開發。

策略2:高水平的測試人員要測關鍵的模組,低水平的測試人員測試非關鍵的模組。

如果是這樣,對於測試過程做了度量以後,資料無法證明假設1和2的成立。

這就是問題的癥結!我們的實際資料本身就是有傾向的樣本!而不是隨機的樣本!因為我們採用了策略1和策略2!所以歷史資料表明:我們發現的bug的多少是與開發人員的水平、測試人員的水平是無關的。

如果要證明假設1和2,需要做實驗,即在保證其他條件相同的情況下,我們做實驗看測試人員或開發人員的水平對測試的bug數的影響,統計過程的效能資料去證明假設1和假設2。

所以遇到資料中存在不符合常識的結論時,應該仔細剖析一下,看看問題何在。

資料中存在的假象

在一些實施cmmi高成熟度的軟體公司中對於過程的效能資料進行分析時,常常發現應該具有相關性的2個變數根據歷史的資料不能證明這種相關性,或者是應該正相關的資料卻分析出了負相關的結論,原因何在呢?例如 我們的經驗與常識 假設或常識1 高水平的測試人員找出的bug多,低水平的測試人員找出的bug少。假設或...

大資料分析的深度與假象

今天聽了乙個資料分析的培訓 資料的深度與假象。也沒有聽太懂,總結幾個點分享下 1.資料的含義只有和人的行為聯絡起來才有意義 比如蘋果手機的銷量,是因為其主流使用者的想法導致的 2.簡單的,脫離人性的擬合 是不靠譜的,舉例,三星的手機銷量一直直線上公升,但 它明年也會上公升不太合理 3.對人群分類進行...

AI科幻 地球隕落 從假象中清醒

隨著陰謀的顯露,古力漸漸消逝,接下來,周蒙等人的反抗就要開始了。當周蒙向古力問詢 時機 的含義時,古力先是嘆了一口氣 造孽啊 他對著周蒙解釋道 這個時機與你和艾娃的孩子有關。原來,在之前的研究中,雖然歐文帶領著手下的機械人對生活在另乙個平行世界的周蒙等人類進行了24小時不間斷地觀察,看著人類之間產生...