注:檔案中的異常包括描述性資料(特徵)、缺失值(nan)、
在這裡的解決方法是借用pandas庫
interpolate()使用插值來估計nan 如果index是數字,可以設定引數method='value' ,如果是時間,可以設定method='time'
get_dummies對離散型特徵進行one-hot編碼
舉例說明:
插值是取前後兩值的平均值作為該空位(nan)的值
離散值特徵的編碼假如某一列的特徵名稱是國家(有兩個取值中國和美國 ),那麼我們在用one-hot編碼時,會從這一列資料演變出兩列資料,一列為中國,另一列為美國,然後用0-1編碼表示某一行資料屬於中國還是美國。
原創 HD2自刷安卓2 2小記
前幾天自己買了個htc hd2,大家都說這個是去年的怪獸級機器,由於其可以公升級未來的andriod和wp7,所以公升值潛力不限。ps 自己算是個智慧型機小白,從未刷過手機,因為不懂 膽小,所以也就是個門外漢。買來的這個hd2,我也不懂,就是挑了個看起來還挺厚道的賣家,在中關村買的。2750拿下,沒...
原創 HD2自刷安卓2 2小記
前幾天自己買了個htc hd2,大家都說這個是去年的怪獸級機器,由於其可以公升級未來的andriod和wp7,所以公升值潛力不限。ps 自己算是個智慧型機小白,從未刷過手機,因為不懂 膽小,所以也就是個門外漢。買來的這個hd2,我也不懂,就是挑了個看起來還挺厚道的賣家,在中關村買的。2750拿下,沒...
python 異常學習2
之前在學習python的時候有整理過python異常處理的文章,不夠簡單也不夠完整,所以決定再整理一篇,算做補充。python shell open abc.txt r traceback most recent call last file line 1,in ioerror errno 2 no...