開發十年,就只剩下這套架構體系了! >>>
經歷了一段時間的機器學習工程實踐後,我發現,最難被工程化的地方就是測度,而測度可以是不精準的,也可以是動態的。想要對測度進行標準化,目前來看是一件很困難的任務。
伴隨著對機器學習領域的深入,我對機器學習自動化的信心也越來越強,但在整個知識體系的拼圖上,始終有一塊讓我無法突破:
1.資料的獲取可以使用爬蟲技術自動化;
2.資料的處理可以使用特徵工程自動化;
3.模型的選擇可以使用貝葉斯自動化;
4.模型的引數調整可以使用引數窮舉自動化;
可是模型關鍵指標的選取又該如何自動化呢?這裡的關鍵指標就是指auc,ks,mse等衡量指標。
我一邊欽佩發明這些指標的大神,一邊又陷入了苦惱的沉思:
難道,正如某位朋友說的,不要試圖把所有的東西都放到盒子裡?
那如果我們無法將已知的經驗自動化,我們孜孜不倦的發展科技和理論又有什麼意義?
我想,一定還是有辦法的。
於是我不斷的去觀察這些指標,所有的資料和指標的定義都指向了一種方**,那就是數學領域裡乙個叫測度論的東東。
我也一直堅信數學是人類認識宇宙本質的抽象。只要能用數學描述的事物,就一定能自動化,只是時間問題。
可是在測度論的領域搜刮了一番後,我又失望了。
現代測度論,大多只是介紹已有測度的成果,例如各種已發現的定義,各種已知的關係。並沒有組織一套有效的方**去概括和總結乙個測度的發明過程。
難道人類的進步永遠只能靠乙個個天才的靈光一現?這樣的發展是多麼不靠譜?對於習慣了工程思維的我,這樣的結果確實不能讓我滿意。
從網上搜刮了一番,倒是找到一些:
《定性指標的設計、測度與分析》
《**統計設計的指標體系和原則》
大致內容也是通過統計學的手段去量化定性資料
綜上,測度不應該建立在太多主觀因素的基礎上,希望能盡快找到成熟的理論體系,去指導我們進一步的工程化!?
坐等大神來懟!希望我的思維是錯誤的
關於博弈的思考
博弈,決策,永恆的主題 在博弈的過程中不要考慮是否公平,而是要考慮是否對你自己有利。這句話很值得思考。人生無時無刻不在博弈,無論是在微觀上,兩個人之間的談話 還是在巨集觀上每次人生抉擇的過程,博弈,總是在乙個恰當的視點上讓人設身處地的感受到。在博弈的過程中,公平與否,很多人都在抱怨 有的時候是與自己...
關於執行的思考
方 的實施,貫穿於軟體開發的整個過程。實施的關鍵在於執行,而執行由很多瑣碎的活動組成。在軟體開發實踐中,執行應該被放到乙個完整的體系環境中去考慮,單純強調執行本身,是無法解決執行問題的。在討論執行這個話題之前,我認為有必要先來看看東西方文化的差異。中國近代哲學史上有一種觀點,即地理環境決定了文化差異...
關於IncludeAction的思考
關於struts中的includeaction 類,傳說可以實現類似標記的功能,將乙個網頁嵌入到另乙個網頁,但基於安全等一系列因素,在基於struts的應用系統中,推薦使用includeaction。org.apache.struts.actions.includeaction 類提供 包含 指定u...