使用httpclient進行登入,網上找**很多,但真實性。可靠性卻並不高。找到乙個登陸開心網的,很明顯把cookie用錯了,在網上貼個**是那麼重要的事情嘛,而且同乙份**到處都是,**是原創都分辨不了,如果是好的,有用的,還罷,如果不是,那意義何在呢,招人罵嗎?
因工作需要,要從別的系統抓資料,經過學習,選擇了httpclient+htmlparser,看的是ibm社群的文章,盛名之下,招搖撞騙還是比較容易的。
基礎的東西就不說了,new了client和method,加了使用者名稱密碼 ,去登陸,不對。又加各種請求頭,引數,能發現的都試了,結果依舊。給錯的密碼也返回200,因為他找到jsp就認為是200了,根本沒有做登陸。而且不該是200,應該是302,登陸後肯定**的。想不通為什麼200。在csdn找啊找,終於看到乙個帖子(http://topic.csdn.net/u/20090105/17/dd8c1875-934e-4049-b5fe-706d78f6cb75.html),一語驚醒夢中人。j2ee的系統最後執行請求的都是action,把請求提交給login.jsp去執行時沒用的,登陸要提交給登陸的action,struts或者webwork系統,都是訪問action,然後返回jsp。不同於php,全都是頁面,沒j2ee那種「後台」的概念。
把url換成action,問題就不存在了 ,也302了,也看到**了。
ps:自己寫登陸開心網,給我408,不過應該沒工夫研究了。
HttpClient 模擬登陸知乎
最近做爬蟲相關工作,我們平時用httpwebrequest比較多,每乙個url都要建立乙個httpwebrequest例項,而且有些 驗證比較複雜,在登陸及後續抓取資料的時候,每次請求需要把上次的cookie傳遞給這次請求。記得這篇部落格 結尾,dudu總結了 httpclient最與眾不同的地方是...
httpclient模擬登陸微博問題
我用httpclient模擬登陸微博報如下錯誤 debug requestaddcookies cookie version 0 name usrhawb value usrmdins212 186 domain weibo.com path expiry null match weibo.com ...
關於登陸shell和非登陸shell的區別
問題描述 實驗室有一台用於linux教學用的機器,為每乙個學生在上面建了乙個使用者,作為上課用的。而我呢,正在做vlsi實驗。因為那台機器持久開著,所以我為了方便就在上面也建了乙個使用者,用於vlsi實驗。cadence環境是在csh下的。但是管理員給我建的使用者預設的是bash環境,我又沒有超級使...