Python第乙個爬蟲學習

2022-08-11 21:06:14 字數 2278 閱讀 9258

在網上檢視大神的關於python爬蟲的文章,**如下:

以下則是在執行上述**過程中遇到的相關問題,以及解決方式,雖然不怎麼高階,但是也算是一種學習思路吧。

問題1:在python3.2的環境下,未執行時,**會報錯:

解決1:將

print getimg(html)
修改為

print (getimg(html))
問題2:**執行後,報如下錯誤:

解決2:度娘進行搜尋,才發現3.2不相容2.0的,於是進入官方文件查詢最新的呼叫方式,對這三行進行以下修改,修改前:

修改後:

問題3:執行**,提示以下錯誤:

html=html.decode('utf-8')
最終得到以下**:

執行結果如下:

參考文章:1、

2、

python爬蟲 第乙個爬蟲

1.本地安裝了nginx,在預設的html目錄下建立測試html 如圖,即index.html導向a,b,c 3個html,a.html又可以導向aa,bb兩個html,c.html可以導向cc.html。2.修改nignx配置使得本地可以訪問寫的kmtest裡的index.html。參考文件 ng...

Python 第乙個爬蟲

1 import urllib.request 2importre3 4class downpic 56 def init self,url,re str 7 self.url url 8 self.re str re str910 defgethtml self,url 11 page urlli...

第乙個爬蟲

很多人學習python的目的就是為了學習能夠實現爬蟲的功能,這裡,我使用了scrapy框架來實現了乙個簡單的爬蟲功能,這裡我簡單的介紹一下scrapy專案的建立,和執行。1,第一步是安裝scrapy,我相信到了這一步,大多數人都已經會安裝第三方庫檔案了,這裡主要是使用命令pip install sc...