python爬蟲學習,零基礎入門(三)

2021-10-05 11:18:54 字數 479 閱讀 3453

了解session和cookies;selemium,ip**,為爬取需要使用者登入的**做準備

(1)靜態網頁和動態網頁:靜態網頁也就是html頁面,不可以在頁面做更改;動態網頁是用jsp或者php等語言編寫的,是可以在頁面做更改的。

(2)session是會話的意思,產生在伺服器端,儲存在記憶體中;cookie是儲存在客戶端,等到再次訪問瀏覽器時會使用,如果要使**在登入後關閉了,再次開啟時還在登入狀態,則需要將cookie的資訊儲存在硬碟中。

(3)http和https:對於這兩種協議來說,後者是資料加密型;對於**來說,http**http**,https**https**;如果是https**,那麼檢測到的**也是https的,如果是http的,則返回本機ip。

(4)selenium是乙個用於web應用程式的自動化測試工具,功能包括測試與瀏覽器的相容性,測試檢驗軟體功能和使用者需求,直接在瀏覽器上執行,從終端使用者的角度來測試應用程式。

參考自:爬蟲程式設計實踐

python爬蟲學習,零基礎入門(二)

1.bs4庫的使用 1 了解bs4庫,beautiful soup 是乙個html xml 的解析器,主要用於解析和提取 html xml 資料。2 安裝beautifulsoup庫,匯入bs4,再從bs4庫中匯入beautifulsoup,順序很重要,如果直接匯入beautifulsoup會報錯,...

零基礎入門學習Python

課程介紹 前半部分主要講解python3的語法特性,後半部分著重講解python3在爬蟲 tkinter pygame遊戲開發等例項上的應用。整個系列共16個章節,前邊13個章節從乙個小遊戲引入python,逐步介紹python的語法以及語言特色。最後3個章節為案例的演示,是前邊內容的總結和提高。課...

零基礎入門學習python

1.從idie啟動python idle是乙個python shell,shell的意思就是 外殼 從基本上說,就是乙個通過輸入本與程式互動的途徑。像windows的cmd的視窗,像linux那個黑乎乎的命令視窗,它們都是shell,利用它們,就可以給作業系統下達命令。同樣,可以利用idle這個sh...