這兩天一直在讀吳老師的數學之美,其中的語音識別部分讓我觸動很大。在我感嘆數學的強大的同時,我在想能不能將其應用到逆向工程上面。我一直在尋找在逆向工程中,更好的自動化的分析類的大小、結構及成員的方法 還包括類的派生關係(無rtti情況)。在讀完數學之美後,我突然有了點模糊的想法,但還不清晰。
主要方法是將統計學引入到逆向過程中。即與自動化翻譯過程類似,畢竟編譯器編譯出來的**是有規律的。就好比編譯器是活生生的人,它在說話,說的內容就是組合語言,現在我們要做就是翻譯,將組合語言翻譯成c/c++這類高階語言。這個過程與自動化語音識別及翻譯從本質上講是完全一模一樣的。在逆向工程中,我知道當前函式的上乙個函式及下乙個函式一般來講是有某種關係的,該關係與馬爾可夫鏈也有相似之處。
如何利用統計學去分析發現並挖掘出逆向中更多的內在關係,我認為是非常值得研究的一件事。如果在這方面有所突破的話會有重大意義。
另附上數學之美的封面:
讀《數學之美》第四章 談談分詞
中文分詞其實有點像古代的句讀 dou 韓愈的 師說 中就有 彼童子之師,授之書而習其句讀者也 古人文章是沒有標點符號的,行文一氣呵成。如果不懂離經斷句,就很難理解古文的意思。從某種程度上,句讀就類似今天要講的中文分詞。北京航空航天大學的梁南元教授提出了查字典的方法 查字典的方法就是把句子從左到右掃瞄...
數學之美4
第7章 賈里尼克和現代語言處理 第8章 簡單之美 布林代數和搜尋引擎 道與術 事情的原理是道,具體的做事方法叫術。追求的術的人,一生工作辛苦,只有掌握道,才能游刃有餘。追求術的人,往往是希望走捷徑,希望有乙個模型能把事情畢其功於一役,但這是不現實的。1.布林代數 就是真 假的組合四則運算 與 或 非...
數學之美6
第12 章 有限狀態機和動態規劃 地圖與本地搜尋的核心技術 1 1 位址分析和有限狀態機 1.智慧型手機導航最關鍵的三個問題 a.利用衛星定位 b.位址識別 c.根據使用者輸入的起點和終點,在地圖上規劃最短路徑或者最快路徑 2.位址分析和有限狀態機 位址的識別上下文有關文法相對簡單,最有效的是有限狀...