python2 7爬蟲 配合簡單的GUI

2021-07-29 10:09:56 字數 2211 閱讀 9138

#-*- coding:utf-8 -*-

'''先在d盤下建立乙個demo的資料夾

'''from tkinter import *

from scrolledtext import scrolledtext#文字滾動條

import urllib,requests

import re

import threading

import time

'''爬蟲部分

'''url_name =

a = 1#頁面

def get():

global a

url = ''+str(a)

html = requests.get(url,headers=hd).text

ref = re.compile(r'(.*?

.*?)',re.s)

res = re.findall(ref,html)

for i in res :

url_reg = re.compile(r'data-mp4="(.*?)">')

url_items = re.findall(url_reg, i)

if url_items:

url_title = re.findall(r'(.*?)', i)

for i,k in zip(url_title,url_items):

# print i,k

return url_name

id = 1

def write():

global id

while id<10:

url_name = get()

for i in url_name:

# print i[0]

urllib.urlretrieve(i[1],'e:/demo/%s.mp4'%id)

text.insert(end,str(id)+'.'+i[0]+'\n'+i[1]+'\n')

url_name.pop(0)

id+=1

def start():

th = threading.thread(target=write)

th.start()

# if __name__ == '__main__':

# write()

'''gui 介面構造

'''root = tk()#例項化乙個物件

root.title('gui_demo')

text = scrolledtext(root,font=('微軟雅黑',10))

text.grid()#實現複雜布局

button = button(root,text = '開始爬取',font=('微軟雅黑',10),command = start)

button.grid()

values = stringvar()#通過tk方法繫結乙個 變數

lable = label(root,font=('微軟雅黑',10),fg ='red',textvariable= values)

values.set('demo——一開始執行')

lable.grid()

root.mainloop()#建立視窗指令

gui部分 不怎麼懂··  也還沒看到

urlretrieve(url, filename=none, reporthook=none, data=none)

使用到了多執行緒 threading.thread(target=)

然後使用star方法開啟執行緒

requests 是乙個請求網路連線的第三方庫··  qwq  應該是吧 ···

可以模擬get 和 post 請求 (twt 其他的不常用···)

使用headers 來設定請求頭資訊 (一般設定user - agent 這個是模擬使用瀏覽器的頭資訊··)

re正則的話 用到的 貪婪和非貪婪 twt  簡單的記住.*?少食多餐(非貪婪匹配) .*暴飲暴食(貪婪匹配)

python2 7換行 Python2 7基礎語法

1.建立檔案xx.py usr bin python3 print hello,world 2.linux下執行 python hello.py 3.編碼 預設字串unicode 設定編碼 coding utf 8 4.識別符號 第乙個字元必須是字母表中字母或下劃線 識別符號的其他的部分有字母 數字...

python2 7爬蟲實戰小專案

爬蟲原理和思想 本專案實現的基本目標 在捧腹網中,把搞笑的都爬下來,注意不需要爬取頭像的,同時,將命好名放在當前的img檔案中。爬蟲原理和思想 爬蟲涉及到額度基本知識 1 導入庫 模組 該 是用於讀取網頁 exp 使用urllib.urlopen 開啟捧腹網 使用read 讀取,如 比較龐大,也可以...

python2 7是什麼 python2 7是什麼

pyton2.7是python在2010年發布的乙個版本。python 是乙個高層次的結合了解釋性 編譯性 互動性和物件導向的指令碼語言,具有很強的可讀性,相比其他語言經常使用英文關鍵字,其他語言的一些標點符號,它具有比其他語言更有特色語法結構。下面來解釋一下python這門語言 python是一種...