中心門戶資料爬蟲 NTLM安全認證

2021-09-10 09:46:01 字數 753 閱讀 4849

直接通過get請求獲取**首頁,發現出現授權錯誤

模擬瀏覽器使用cookie獲取首頁,還是授權錯誤

禁用瀏覽器cookie、js、等,發現瀏覽器能正常獲取首頁,因此排除cookie

網友說可能是reference的問題,可我在頭部沒發現reference屬性

使用wireshark檢視http流,看看http流中有沒有相關的安全認證資訊

通過wireshark發現每次請求主頁都發起了三個http請求,前兩個失敗,第三個成功

看到有個ntlm安全認證相關的資訊,baidu了一下,感覺沒多大用

給網友截圖說明情況,網友說ntlm他不懂

再次在stackverflow網上搜nodejs ntlm安全認證,發現了乙個帖子,上面有ntlm協議的乙個連線,進去後發現ntlm協議中有個三次握手,解決了wireshark三個http請求的原因,所以將問題定位到ntlm認證

使用httpmtlm.js模組模擬瀏覽器發起帶ntlm驗證的get請求(引數按照要求填寫,具體的取值通過wireshark看),發現成功獲取了**主頁

使用post請求爬取通訊錄時發現出現超時等待,通過wireshark與瀏覽器比較分析發現我的爬蟲沒有出現ntlm的三次握手協議

本以為是post請求的ntlm協議不一致導致的,但我在把post的options用到get上後發現get也不能用了,通過和之前的get的options對比發現是新增加的headers導致的

將option中的headers刪除後post請求也能正常使用

大功告成

NVIDIA把消費級顯示卡拒絕在資料中心門外

到今天,人工智慧研究已經有六十多年的時間。從最簡單的文字對話,到電腦程式戰勝人類西洋棋大師,人工智慧在豎立了乙個里程碑之後似乎就進入了平台期,再無標誌性的成績出現。然而最近兩三年,計算機的智慧型水平突然得到了明顯提公升 識別和語音正確率超過人類,自動駕駛汽車開始上路,參加智力問答競賽獲得冠軍,甚至曾...

科技巨頭的軍備競賽 資料中心門檻越來越高

科技巨頭的軍備競賽 資料中心門檻越來越高,國外 週末刊文稱,石油天然氣公司投入了數十億美元去勘探新的油氣儲備。與此類似,大型科技公司也在爭相投入巨資,建設複雜而精密的計算基礎設施,通過雲計算為創業公司和企業客戶提供計算服務。上週,亞馬遜再次發力。該公司宣布,將在瑞典斯德哥爾摩建設資料中心。未來幾年,...

php爬蟲 知乎使用者資料爬取和分析

背景說明 小拽利用php的curl寫的爬蟲,實驗性的爬取了知乎5w使用者的基本資訊 同時,針對爬取的資料,進行了簡單的分析呈現。demo 位址 移動端分析資料截圖 pc端分析資料截圖 整個爬取,分析,展現過程大概分如下幾步,小拽將分別介紹 php的curl擴充套件是php支援的,允許你與各種伺服器使...