關於MATLAB處理大資料座標檔案2017527

第一次提交資料：

今天用了8個特徵，加上的這乙個特徵是從3000條測試資料中測試失敗的資料總結出來的

樹的數目為50

再次使用3000條測試資料測試結果—— 結果不錯： 99%

但是執行官網資料結果分數——降低0.5 為58.55分

總結：總特徵數目為8，樹的數目遠遠超過特徵數，以後樹的數目不能多於特徵的1.5倍，否則結果很難得出結論，無說服力

第二次提交資料：

本次使用9個特徵，加上的特徵是從3000條測試資料中測試失敗的資料總結出來的

樹的數目為12

使用3000條測試資料測試結果—— 結果不錯： 99%

執行官網資料結果分數有所提公升

總結：總特徵數目為9，樹的數目12，正確率上公升，事實說明：乙個沒有特徵的決策樹會也會抽取資料訓練，最終也會對隨機森林最終結果產生影響

那麼繼續觀察以前的失敗資料，提取新的特徵

關於MATLAB處理大資料座標檔案201761

前幾天備戰考試，接下來的日子將會繼續攻克大資料比賽雖然停止了一段時間沒有提交資料，但是這幾天的收穫還是有的，對python 隨機森林了解的更了解了隨機森林是由多課決策樹組成當然這個雖然我們初學者都知道，但是我確定沒有現在認識的深刻多棵決策樹經過資料訓練後，經過投票方式對測試資料進行判斷那麼...

關於大資料之批處理SpringBatch

大資料時代,資料是現代企業最寶貴的核心資產,是企業運用科學管理決策分析的基礎企業如何通過各種技術手段,並把資料轉換為資訊知識和商機已經成為提高其核心競爭力的主要手段。而資料批處理測試達成上訴目標的乙個主要技術手段,通過資料批處理,可以完成資料的載入抽取轉換清洗等功能，進而支撐企業的各種資...

關於大資料

最近在學習軟考的時候，發現了大資料以前只是聽說過大資料，這次在學習軟考的時候我那顆好奇的心把我帶入到了大資料.其實，大資料跟我們的生活息息相關，跟我們的衣食住行，醫療，教育，體育等等.都離不開大資料。大資料 big data 是無法將現有的軟體工具進行提取，儲存，搜尋，共享，分析和處理海量的，...

關於MATLAB處理大資料座標檔案2017527

關於MATLAB處理大資料座標檔案201761

關於大資料之批處理SpringBatch

關於大資料

相關推薦