爬站利器 teleport ultra

2022-06-12 08:33:06 字數 909 閱讀 4614

一、前言

昨天應該公司需要,想要爬取乙個**的靜態資源,但是用**寫,乙個乙個爬很累,就算完成了估計也要一點時間,於是想著看看有沒有一款工具能夠完成我的任務,於是乎發現了乙個很好用的工具-teleport ultra。

第一步:開啟這個軟體

如圖開啟之後的介面

第二步點選file、下拉選擇 new project wizred,彈出如下下拉框

第三步輸入鏈結

下面數字是用來填寫最多迴圈幾層鏈結,一般三層足夠

第乙個單選:僅文字

第二個單選:文字和影象

第三個單選:文字、影象、音訊

第四個單選:所有

第五步:選擇本地儲存路徑後

第六步 ,點選start

完成接下來等待檢視爬取結果

大功告成!!!

爬取B站彈幕

最近幾天學習爬蟲,便爬取了b站的彈幕,本篇博文記錄的是爬取彈幕的方法一,近期會更新方法二。下面是流程 點開這個包是這個形式的 這裡面就有明文的彈幕,但通過requests獲得的response是經過utf 8編碼加密過的,想要獲得彈幕內容還要解密。下面附 from bs4 import beauti...

詞云 pythonB站彈幕爬取

實現 現存的問題 這個不是邊搞邊記錄著寫的,主要靠回憶?這個適用於conda使用者哦,當然我就是隨便寫寫,我也是第一次搞,主要寫下自己遇到的問題。jieba我早就安裝了,應該是直接cmd開啟後 pip install jieba,大概是上課作業需要,當時用著也還成。啊當時也把beautifulsou...

爬蟲專欄6 爬取B站彈幕

比如說這裡我隨便開乙個網頁 在xhr標籤裡面可以看到乙個小眼睛圖示的玩意兒,開啟那個url進去之後 就可以直接提取了 ps 1.針對匹配,乙個尖括號結束之後最好用.過渡到另乙個尖括號,不要什麼都不加,可能抓不出來 2.這是針對response.text和response.content.decode...