python爬蟲爬取百度貼吧(入門練習)

2021-09-07 05:44:10 字數 953 閱讀 2032

import urllib.request

import urllib.parse

import os#引入os模組

tieba_name = input("請輸入你要爬取的貼吧的名稱")

page_start = int(input("請輸入你要爬取的起始頁面"))

page_end = int(input("請輸入你要爬取的結束頁面"))

url = ''

name_next = '吧爬取的內容'

#建立資料夾

os.mkdir(tieba_name+name_next)

#設定迴圈,爬取每一頁

for page in range(page_start,page_end+1):

data =

data = urllib.parse.urlencode(data)

headers =

#發出請求

爬蟲爬取百度貼吧 python

本爬蟲是在pycharm中編寫完成,伺服器環境是ubuntu16.04,使用語言是python3,匯入的模組包是requests模組 匯入模組 import requests class tiebaspider object def init self self.base url self.head...

爬取百度貼吧

import urllib.request import urllib.parse import os,time 輸入貼吧名字 baname input 請輸入貼吧的名字 start page int input 請輸入起始頁 end page int input 請輸入結束頁 不完整的url ur...

爬取百度貼吧

帶入需要使用的包 from urllib import request,parse importos 基礎知識 變數賦值 字串賦值 爬取的關鍵字 kw lol 數值賦值 爬取的頁數範圍 start 1end 4 輸出 print kw,start,end 宣告需要爬取的連線 base url 建立資...