jackchiang
<1>版本1,效果如,存在問題不能給加自己的名字,**不夠靈活。版本2解決這個問題
#coding=utf-8
#爬取鬥魚顏值妹子
import re
import urllib
import time
#定義為方法
效果圖~~~
<2>版本2更靈活一些
#coding=utf-8
#爬取鬥魚顏值妹子
import re
import urllib.request
import time
from bs4 import beautifulsoup
#定義為方法
defgethtml
(url):
page = urllib.request.urlopen(url)
html=page.read()
return html
defgetimage
(html):
#建立物件,傳入網頁資料
soup1 = beautifulsoup(html)
soupl = soup1.select('#live-list-contentbox')
print(str(soupl))
strone = str(soupl)
soup2 = beautifulsoup(strone)
soupli = soup2.select('li')
for souplione in soupli:
#獲取單個li標籤獲取資料
**執行狀態
後續版本會有更好效果!!
爬取小說的簡易python爬蟲
學習一段時間的python之後決定寫些東西 剛好自己喜歡看 就像寫一段爬取 的爬蟲,這裡以筆趣閣的 為例。我發現筆趣閣的每個 的目錄源 基本都包含其所有的章節的url,所以這段 是先獲取所有的url然後逐頁獲取其文字 import requests 這裡以 天地霸氣訣為例 import re imp...
Python實時爬取鬥魚彈幕
輸入鬥魚房間號實時獲取彈幕資訊,實現效果如下 建立連線 通過tcp協議連線到彈幕伺服器 向彈幕伺服器傳送登入請求,登入彈幕伺服器,訊息格式type loginreq roomid 房間號 不需要賬號密碼 登陸成功之後伺服器會給你返回乙個登入成功資訊,這部分不用管,繼續向伺服器傳送乙個進入彈幕分組請求...
鬥魚彈幕資料爬取
主要參考鬥魚的文件 dev bbs.douyutv.com forum.php?m 通過socket與彈幕伺服器建立連線 第三方接入彈幕伺服器列表 複製 協議組成 訊息長度 4 位元組小端整數,表示整條訊息 包括自身 長度 位元組數 訊息長度出現兩遍,二者相同 訊息型別 2 位元組小端整數,表示訊息...