本週任務備忘:
1、網頁內repeatable pattern的自動識別,block repeat script,block repeat的crawl.
[repeatable pattern的detect演算法通過對抽象出來的模型使用動態規劃已經解決,複雜度o(m+n),已做了一些試驗,效果很好]
2、網頁中pagination的自動識別,建立pagination模型,dectect next page link,網頁間的
repeatable pattern的自動識別,page repeat script,page repeat crawl.
[由於網頁的分頁方式比較多,只建立了簡單的模型,仍未實現自動識別,使用者仍需自己標示出pagination block,可以生
成page repeat script,可以進行crawl,使用者需要參與的操作已經很少]
本週看完 JTable
明天又是周二了。5.15 12.19 第一天的來公司的情景還歷歷在目,轉眼就已經七個多月了。上了半年的夜班,我就整整荒廢了六個月,慶幸現在終於不用上了。每次以前的同事問我在作什麼,都告訴他說,我在維護乙個 swing 的工具,從來沒有說過我在作 swing 實在是心裡有愧,因為確實沒大涉及到 swi...
本週總結(09 11 13)
計畫總是趕不上變化的,本來還想著能夠在中旬之前結束寫文件,但是現在看看還得再用一段時間。前幾天不經意之間想了一下,把自己嚇了一跳。這個學期馬上就要結束了!時間要轉進吶,質量也不能放下,畢竟也算是第一次正兒八經的做工程 以前的那個算是玩耍吧 這週也沒白過,腦袋始終是出於迴圈狀態。不斷的思考著這個系統中...
本週複習總結
1.軟體 是為完成某些特定功能而編制的乙個到多個程式檔案的集合 2.程式語言的發展 機器語言 組合語言 高階語言 3.編碼實現 源 編譯源 鏈結注意 1 在編譯源 的過程中,翻譯 解釋 程式比編譯程式的執行速度要慢 4.乙個簡單的程式設計一般包含分析問題,設計演算法,編制程式,除錯程式 5.任何解決...