作業要求
第二次結對作業:班級成績
作業目標
《爬取雲班課上的資料》
作業源**
[pair]
羅童<211803324>
許培騰<211804229>
預計實際
需求分析
無5min
學習時間
5-8h
6-7h
編碼時間
1-2h
2h**量
100-200
203執行時間
無1.5min
羅童(me):本來打算這次我把比較難的登入部分做了,把提取經驗部分讓他完成,但因為我沒用準確獲取到每個課堂完成部分的頁面(只獲取到第乙個)所以他接著做時遇到了許多問題,我把這個問題解決後把後面的都做完了,他相信我能完成。
許培騰:我感覺這次作業難度還好,有比較明顯的思路,就是實際操作起來還是會因為一些知識點的不清楚或者遺忘,卡殼,導致編寫過程比較久。
2. 全班同學課堂完成部分的經驗
3. 按要求對經驗排序,並統計出相應的資料
通過htmlunit庫解析出xml物件,再通過jsoup解析。htmlunit是無介面瀏覽器,操作和使用瀏覽器的邏輯很像,也可以通過選擇器進行dom操作比如登入,獲取輸入框htmlform form = (htmlform) page.getbyxpath("//form[@class='account-from']").get(0);
通過getbyxpath()
方法獲取表單型別的htmlform表單物件,通過getinputbyname()
分別方法獲取htmltextinput文字輸入框和htmlpasswordinput密碼輸入框物件。setvalueattribute()
設定你的賬戶密碼。通過選擇器獲取htmlbutton按鈕物件,再通過呼叫click()
方法進入的頁面。
還是通過類似點選的方式進入乙個又乙個頁面。
解析使用的還是jsoup,原因是這個庫的官方文件只支援英文,功能方法很多,很難有效找到想要的方法,其他有的教程提到的功能也很少。
分類幾個模組,乙個模組是返回到活動頁面的html物件
還乙個模組就是累加經驗值,返回set集合學生物件的型別。
因為那個問題不知道怎麼解決,統計出來會有誤差。
結果如下(部分):
參考文獻
感覺執行時間太長了,優化了返回活動頁面的**,不再使用重新請求的方式。通過重新點選的方式返回到活動頁面。
優化
之前現在
執行速度
1.5min
40s
第二次結對程式設計作業
組員部落格鏈結 本作業部落格鏈結 github倉庫 共同解決互動 api 部落格 psp2.1 personal softwareprocess stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫200 250 estimate 估計這個任務需要多少時間 250300 develo...
第二次結對程式設計作業
楊潤秋 負責前端介面和網路介面呼叫 書寫及最後的整合及打包 韓洪威 負責後端ai演算法部分 書寫 優化 除錯 psp2.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫 3030 estimate 估計這個任務需要多少時間 ...
第二次結對程式設計作業
陳佳雯 王思婷github psp4.1 personal software process stages 預估耗時 分鐘 實際耗時 分鐘 planning 計畫 12020 estimate 估計這個任務需要多少時間 1020 development 開發 2590 3870 analysis 需...