有乙個訓練集train,想要用它來訓練模型並且來進行測試,所以我們要把它分為訓練集和測試集。假如我們的資料集裡面有乙個缺失值,那麼我們應該如何填充這個缺失值。
假如我們先填充資料集然後再把資料分為訓練集和測試集,那麼這個時候出現乙個違反原則的事情:我們用的訓練集的資料竟然有一部分來自測試集,哈哈,但是在進行訓練的時候我們是不可能知道測試時候的資料的。
奇怪的是,作者給了另外一種方式,那就是用訓練集的均值來填充訓練集和測試集的資料。 我本來想的是這樣的,用訓練集的均值來填充訓練集的均值,用測試集的均值來填充測試集的均值。
第三章 堆疊
1.基礎知識 堆疊可以實現很多的應用,遞迴的問題轉化成非遞迴形式,在本質上也是堆疊的問題.它是一種 filo 操作的資料結構,一般也有兩種儲存方式 陣列跟鍊錶實現形式,這裡我給出了鍊錶形式的堆疊模板,裡面包括了基本的堆疊所有的操作,還有兩個比較著名的應用例子,時間倉促,精力比較有限,關於迷宮老鼠還沒...
第三章 曙光
第三章 曙光 第二場校園招聘開始了。其實,洋對這個公司的不是很了解。因為前幾天突然在bbs上面看到了這個公司的招聘資訊,洋覺得這個公司不錯,就上網投了簡歷。接下來的乙個多小時,讓洋很震撼!想不到這個公司這個厲害,而且無論從哪方面來說,絕對不比之前的那個公司差。想不到自己的乙個不經意的決定到了這個大的...
第三章 遞迴
遞迴是一種強大的方法,它允許乙個物件以其自身更小的形式來定義自己。恐怕沒有什麼比觀察神秘的自然界中出現的遞迴現象更好的方法來體會遞迴的重要意義了。想想蕨類植物的葉子,每片葉子的小枝幹都是整片葉子的較小縮影 又或者兩個反光的物體,相互對映對方的漸遠的影像。這樣的例子使我們明白儘管大自然的力量是強大的,...