第乙個爬蟲和測試

2022-09-03 09:42:10 字數 1885 閱讀 3263

import requests

for i in range(0,20):

r=requests.get("")

print(r.status_code)

print(r.text)

print(type(r.text))

print(type(r.content))

print(len(r.content))

from bs4 import

beautifulsoup

import

rehtml="""

我的第乙個段落

row 1, cell 1

row 1, cell 2

row 2, cell 1

row 2, cell 2

"""abc=beautifulsoup(html)

print(str(abc.head.string)+'

\n'+'

47')#

列印頭標籤內容加上學號

print(abc.body.string)#

列印body標籤的內容

print(abc.find_all(id="

first"))

r=abc.text

zhongwen = re.findall(u'

[\u1100-\ufffdh]+?

',r)列印中文內容

print(zhongwen)

import

requests

from bs4 import

beautifulsoup

import

bs4

defgethtmltext(url):

#爬取最好大學排名**內容

try:

r = requests.get(url, timeout = 30)

r.raise_for_status()

return

r.text

except

:

return

""def

fillunivlist(ulist, html):

#將爬取的內容中的所需內容找出並存入列表

soup = beautifulsoup(html, "

html.parser")

for tr in soup.find('

tbody

').children:

ifisinstance(tr, bs4.element.tag):

tds = tr('td'

) defprintunivlist(ulist, num):

#將資訊以列表的形式輸出

print("

\t\t

".format("

排名", "

學校名稱

", "總分"

第乙個 爬蟲和測試

1.爬蟲 如下 import requests def gerhtmltext url try r requests.get url,timeout 1 r.raise for status r.encoding utf 8 return r.text except return 訪問錯誤 url ...

第乙個爬蟲和測試

一 用之前學過的try except進行除錯 測試球賽的gameover函式 可以看到是正確的,我們也可以試一試其他的數字比例。在這裡就不一一試了。requests庫是乙個簡潔且簡單的處理http請求的第三方庫。get 是對應與http的get方式,獲取網頁的最常用方法,可以增加timeout n ...

第乙個爬蟲和測試

1.測試球賽程式中的所有函式 import random from math import def printintro 列印程式的介紹性資訊 print 模擬桌球競賽 print 學號23 print 程式執行需要a和b的能力值 以0到1之間的小數表示 def getinputs 獲得使用者輸入的...