關於HttpClient登陸

2021-05-17 19:22:13 字數 683 閱讀 9584

使用httpclient進行登入,網上找**很多,但真實性。可靠性卻並不高。找到乙個登陸開心網的,很明顯把cookie用錯了,在網上貼個**是那麼重要的事情嘛,而且同乙份**到處都是,**是原創都分辨不了,如果是好的,有用的,還罷,如果不是,那意義何在呢,招人罵嗎?

因工作需要,要從別的系統抓資料,經過學習,選擇了httpclient+htmlparser,看的是ibm社群的文章,盛名之下,招搖撞騙還是比較容易的。

基礎的東西就不說了,new了client和method,加了使用者名稱密碼 ,去登陸,不對。又加各種請求頭,引數,能發現的都試了,結果依舊。給錯的密碼也返回200,因為他找到jsp就認為是200了,根本沒有做登陸。而且不該是200,應該是302,登陸後肯定**的。想不通為什麼200。在csdn找啊找,終於看到乙個帖子(http://topic.csdn.net/u/20090105/17/dd8c1875-934e-4049-b5fe-706d78f6cb75.html),一語驚醒夢中人。j2ee的系統最後執行請求的都是action,把請求提交給login.jsp去執行時沒用的,登陸要提交給登陸的action,struts或者webwork系統,都是訪問action,然後返回jsp。不同於php,全都是頁面,沒j2ee那種「後台」的概念。

把url換成action,問題就不存在了 ,也302了,也看到**了。

ps:自己寫登陸開心網,給我408,不過應該沒工夫研究了。

HttpClient 模擬登陸知乎

最近做爬蟲相關工作,我們平時用httpwebrequest比較多,每乙個url都要建立乙個httpwebrequest例項,而且有些 驗證比較複雜,在登陸及後續抓取資料的時候,每次請求需要把上次的cookie傳遞給這次請求。記得這篇部落格 結尾,dudu總結了 httpclient最與眾不同的地方是...

httpclient模擬登陸微博問題

我用httpclient模擬登陸微博報如下錯誤 debug requestaddcookies cookie version 0 name usrhawb value usrmdins212 186 domain weibo.com path expiry null match weibo.com ...

關於登陸shell和非登陸shell的區別

問題描述 實驗室有一台用於linux教學用的機器,為每乙個學生在上面建了乙個使用者,作為上課用的。而我呢,正在做vlsi實驗。因為那台機器持久開著,所以我為了方便就在上面也建了乙個使用者,用於vlsi實驗。cadence環境是在csh下的。但是管理員給我建的使用者預設的是bash環境,我又沒有超級使...