#-*- coding:utf-8 -*-
'''先在d盤下建立乙個demo的資料夾
'''from tkinter import *
from scrolledtext import scrolledtext#文字滾動條
import urllib,requests
import re
import threading
import time
'''爬蟲部分
'''url_name =
a = 1#頁面
def get():
global a
url = ''+str(a)
html = requests.get(url,headers=hd).text
ref = re.compile(r'(.*?
.*?)',re.s)
res = re.findall(ref,html)
for i in res :
url_reg = re.compile(r'data-mp4="(.*?)">')
url_items = re.findall(url_reg, i)
if url_items:
url_title = re.findall(r'(.*?)', i)
for i,k in zip(url_title,url_items):
# print i,k
return url_name
id = 1
def write():
global id
while id<10:
url_name = get()
for i in url_name:
# print i[0]
urllib.urlretrieve(i[1],'e:/demo/%s.mp4'%id)
text.insert(end,str(id)+'.'+i[0]+'\n'+i[1]+'\n')
url_name.pop(0)
id+=1
def start():
th = threading.thread(target=write)
th.start()
# if __name__ == '__main__':
# write()
'''gui 介面構造
'''root = tk()#例項化乙個物件
root.title('gui_demo')
text = scrolledtext(root,font=('微軟雅黑',10))
text.grid()#實現複雜布局
button = button(root,text = '開始爬取',font=('微軟雅黑',10),command = start)
button.grid()
values = stringvar()#通過tk方法繫結乙個 變數
lable = label(root,font=('微軟雅黑',10),fg ='red',textvariable= values)
values.set('demo——一開始執行')
lable.grid()
root.mainloop()#建立視窗指令
gui部分 不怎麼懂·· 也還沒看到
urlretrieve(url, filename
=
none
, reporthook
=
none
, data
=
none
)
使用到了多執行緒 threading.thread(target=)
然後使用star方法開啟執行緒
requests 是乙個請求網路連線的第三方庫·· qwq 應該是吧 ···
可以模擬get 和 post 請求 (twt 其他的不常用···)
使用headers 來設定請求頭資訊 (一般設定user - agent 這個是模擬使用瀏覽器的頭資訊··)
re正則的話 用到的 貪婪和非貪婪 twt 簡單的記住.*?少食多餐(非貪婪匹配) .*暴飲暴食(貪婪匹配)
python2 7換行 Python2 7基礎語法
1.建立檔案xx.py usr bin python3 print hello,world 2.linux下執行 python hello.py 3.編碼 預設字串unicode 設定編碼 coding utf 8 4.識別符號 第乙個字元必須是字母表中字母或下劃線 識別符號的其他的部分有字母 數字...
python2 7爬蟲實戰小專案
爬蟲原理和思想 本專案實現的基本目標 在捧腹網中,把搞笑的都爬下來,注意不需要爬取頭像的,同時,將命好名放在當前的img檔案中。爬蟲原理和思想 爬蟲涉及到額度基本知識 1 導入庫 模組 該 是用於讀取網頁 exp 使用urllib.urlopen 開啟捧腹網 使用read 讀取,如 比較龐大,也可以...
python2 7是什麼 python2 7是什麼
pyton2.7是python在2010年發布的乙個版本。python 是乙個高層次的結合了解釋性 編譯性 互動性和物件導向的指令碼語言,具有很強的可讀性,相比其他語言經常使用英文關鍵字,其他語言的一些標點符號,它具有比其他語言更有特色語法結構。下面來解釋一下python這門語言 python是一種...