爬南航研究生院題庫

2021-10-05 08:19:50 字數 2029 閱讀 9208

10# 爬取的間隔時間

firstdir = r'g:\儲存檔案\nanjing\pdf'

# 總路徑

classificationdict =

# 存放**分類子頁面的資訊

#通過選擇器來獲取頁面項

data =

date =

[2018

,2017

,2016

,2015

,2014

,2013

,2012

,2011

]def

screen

(url, data ,select)

: html = requests.post(url = url, data = data,headers =

)# 隨機獲取乙個headers

html.encoding =

'gbk'

html = html.text

soup = beautifulsoup(html,

'lxml'

)return soup.select(select)

# sc = screen('/zsmlgl/sjcx_ss.aspx','table#datalist1 tr td a')

# print(sc)

hrefs =

defget_urls

(date)

:for date_tmp in date:

data[

'drpnd'

]= date_tmp

sc = screen(

'/zsmlgl/sjcx_ss.aspx'

,data,

'table#datalist1 tr td a'

)for tmp in sc:

href = tmp.get(

'href'

)# print(href)

href = href.split(

".")

href = href[2]

num = href.split(

"/")

num = num[2]

[11:]

if num ==

'820'

:#此處填寫3位課程**

href = index + href +

'.pdf'

time.sleep(5)

print

(hrefs)

defdowload

(url,name)

: r = requests.get(url)

filename = firstdir +

'/'+

str(name)

+'.pdf'

filename = filename.replace(

'\\'

,'/'

)try

:with

open

(filename,

'wb'

)as f:

f.write(r.content)

except exception as e:

os.makedirs(firstdir)

print

(e)get_urls(date)

num =

0for href in hrefs:

time.sleep(3)

print

(num)

dowload(href,date[num]

) num +=

1

2023年開設研究生院的院校名單

2008年開設研究生院的院校名單 院校名單 所在省市 院校名稱 所在省市 北京大學 北京市河海大學 江蘇省中國人民大學 北京市南京農業大學 江蘇省清華大學 北京市浙江大學 浙江省北京交通大學 北京市中國科學技術大學 安徽省北京航空航天大學 北京市廈門大學 福建省北京理工大學 北京市山東大學 山東省北...

鄭州大學研究生院 鄭州大學產業技術研究院

鄭州大學產業技術研究院是鄭州大學根據學校向研究型大學轉型的需要而成立的集學科建設 科學研究與研究生培養為一體的科研機構。研究院架構在資訊工程學院 電氣工程學院 鄭州智慧型城市研究院 籌 和軟體技術學院之上,以建設優勢特色學科為抓手,培養高層次人才為使命,是鄭州大學電氣資訊類學科的科學研究和高層次人才...

2023年中國大學研究生院計算機專業排名出爐

2008年中國大學研究生院電腦科學與技術專業排名出爐 最新出版的 中國高等教育評估 雜誌刊登了中國管理科學研究院武書連 呂嘉 郭石林的 2008中國大學研究生院評價 清華大學研究生院 北京大學研究生院 浙江大學研究生院連續5年蟬聯前3名。進入前10名的大學還有 上海交通大學第4名 復旦大學第5名 南...