第一次提交資料:
今天用了8個特徵,加上的這乙個特徵是 從3000條測試資料中測試失敗的資料總結出來的
樹的數目為50
再次使用3000條測試資料測試結果—— 結果不錯: 99%
但是執行官網資料結果分數——降低0.5 為58.55分
總結:總特徵數目為8,樹的數目遠遠超過特徵數,以後樹的數目不能多於特徵的1.5倍,否則結果很難得出結論,無說服力
第二次提交資料:
本次使用9個特徵,加上的特徵是 從3000條測試資料中測試失敗的資料總結出來的
樹的數目為12
使用3000條測試資料測試結果—— 結果不錯: 99%
執行官網資料結果分數有所提公升
總結:總特徵數目為9,樹的數目12,正確率上公升,事實說明 :乙個沒有特徵的決策樹會也會抽取資料訓練 , 最終也會對隨機森林最終結果產生影響
那麼繼續觀察以前的失敗資料,提取新的特徵
關於MATLAB處理大資料座標檔案201761
前幾天備戰考試,接下來的日子將會繼續攻克大資料比賽 雖然停止了一段時間沒有提交資料,但是這幾天的收穫還是有的,對python 隨機森林了解的更了解了 隨機森林是由多課決策樹組成 當然這個雖然我們初學者都知道,但是我確定沒有現在認識的深刻 多棵決策樹經過資料訓練後,經過投票方式對測試資料進行判斷 那麼...
關於大資料之批處理SpringBatch
大資料時代,資料是現代企業最寶貴的核心資產,是企業運用科學管理 決策分析的基礎 企業如何通過各種技術手段,並把資料轉換為資訊 知識和商機已經成為提高其核心競爭力的主要手段。而資料批處理測試達成上訴目標的乙個主要技術手段,通過資料批處理,可以完成資料的載入 抽取 轉換 清洗等功能,進而支撐企業的各種資...
關於大資料
最近在學習軟考的時候,發現了 大資料 以前只是聽說過大資料,這次在學習軟考的時候我那顆好奇的心把我帶入到了大資料.其實,大資料跟我們的生活息息相關,跟我們的衣食住行,醫療,教育,體育等等.都離不開大資料。大資料 big data 是 無法將現有的軟體工具進行提取,儲存,搜尋,共享,分析和處理海量的,...