一、前言
昨天應該公司需要,想要爬取乙個**的靜態資源,但是用**寫,乙個乙個爬很累,就算完成了估計也要一點時間,於是想著看看有沒有一款工具能夠完成我的任務,於是乎發現了乙個很好用的工具-teleport ultra。
第一步:開啟這個軟體
如圖開啟之後的介面
第二步點選file、下拉選擇 new project wizred,彈出如下下拉框
第三步輸入鏈結
下面數字是用來填寫最多迴圈幾層鏈結,一般三層足夠
第乙個單選:僅文字
第二個單選:文字和影象
第三個單選:文字、影象、音訊
第四個單選:所有
第五步:選擇本地儲存路徑後
第六步 ,點選start
完成接下來等待檢視爬取結果
大功告成!!!
爬取B站彈幕
最近幾天學習爬蟲,便爬取了b站的彈幕,本篇博文記錄的是爬取彈幕的方法一,近期會更新方法二。下面是流程 點開這個包是這個形式的 這裡面就有明文的彈幕,但通過requests獲得的response是經過utf 8編碼加密過的,想要獲得彈幕內容還要解密。下面附 from bs4 import beauti...
詞云 pythonB站彈幕爬取
實現 現存的問題 這個不是邊搞邊記錄著寫的,主要靠回憶?這個適用於conda使用者哦,當然我就是隨便寫寫,我也是第一次搞,主要寫下自己遇到的問題。jieba我早就安裝了,應該是直接cmd開啟後 pip install jieba,大概是上課作業需要,當時用著也還成。啊當時也把beautifulsou...
爬蟲專欄6 爬取B站彈幕
比如說這裡我隨便開乙個網頁 在xhr標籤裡面可以看到乙個小眼睛圖示的玩意兒,開啟那個url進去之後 就可以直接提取了 ps 1.針對匹配,乙個尖括號結束之後最好用.過渡到另乙個尖括號,不要什麼都不加,可能抓不出來 2.這是針對response.text和response.content.decode...