昨天介紹了乙個不用寫**的web專案,今天說一下資料的獲取。
球員資訊**:
首先進行頁面的分析:
點選左邊的球隊url會根據球隊的不同進行相應的變化:
因此,我們只需要獲取到所有的球隊名稱就能獲取到所有的url資訊了。
此時檢視一下球隊資訊,對頁面進行分析:
此處有球隊詳情的url:和球員資訊的url比對pelicans
發現只要將teams替換為players就獲取到所有的url了
第二步:**實現
import requests結果展示:from lxml import etree
def get_url(url):
response = requests.get(url, headers).text
dom = etree.html(response)
player_urls = dom.xpath('//*[@class="team"]//a/@href')
for player_url in player_urls:
player_url = "".join(player_url).replace("teams","players")
get_player(player_url)
def get_player(url):
response = requests.get(url,headers).text
dom = etree.html(response)
players = dom.xpath('//*[@class="players_table"]/tbody//tr')
for player in players[1:]:
cname = player.xpath('./td/b/a/text()')
ename = player.xpath('./td/p/b/text()')
num = player.xpath('./td[3]/text()')
place = player.xpath('./td[4]/text()')
height = player.xpath('./td[5]/text()')
weight = player.xpath('./td[6]/text()')
birth = player.xpath('./td[7]/text()')
ht = player.xpath('./td/b/text()')
print(cname,ename,num,place,height,weight,birth,ht)
if __name__ == '__main__':
url = ''
headers =
get_url(url)
一共獲取了500名球員資訊。
Python爬NBA球員資料
import scrapy class nbaprojectitem scrapy.item define the fields for your item here like name scrapy.field pass 建立欄位的固定格式 scrapy.field 英文名 engname scr...
nba球員與三國武將
近日無事在家,連觀火箭小牛七番大戰,天混地暗,鬼哭神號。今日又遇小廝爆走,大殺四方。只聽一人不停大呼 小霸王 不止,定神一看,大呼之人乃c5大將 孫老師。心中暗叫此綽號起的好,小廝英武真乃比的上當年江表之孫伯符。不由興致大起,欲拿nba之super star 比比 當年三國之風雲人物。隨穿上馬甲,得...
趙本山給NBA球員出腦筋急轉彎
趙本山給nba球員出腦筋急轉彎 趙本山 天也不早了,人也不少了,你們的歲數也不小了,這智商也該考了!高秀敏 春節坑人不算多,去年賣拐今年賣車,這美國的日子挺不錯,折騰折騰這幫傻大個兒!趙本山 第一號艾弗森,請聽題。說你有乙個私生子,今年剛6歲,以前他從沒見過你,現在你和一大幫人去看他,他一下子就撲到...