現在python基本入門了,現在開始要進軍如何寫爬蟲了!
先把最基本的urllib模組弄懂吧。
開啟乙個url的方法,返回乙個檔案物件,然後可以進行類似檔案物件的操作。本例試著開啟google
>>> importpost方法:urllib
>>> f = urllib.urlopen('
')>>> firstline =f.readline() #讀取html頁面的第一行
>>>firstline
(function())
>>>params
'eggs=2&bacon=0&spam=1
'>>> f=urllib.urlopen("
" %params)
>>> print f.read()
>>> import基本就這些,關於物件獲取的方法就不贅述了。urllib
>>> parmas = urllib.urlencode()
>>> f=urllib.urlopen("
",parmas)
>>> f.read()
爬蟲 Python爬蟲學習筆記之Urllib庫
1.urllib.request開啟和讀取url 2.urllib.error包含urllib.request各種錯誤的模組 3.urllib.parse解析url 4.urllib.robotparse解析 robots.txt檔案 傳送get請求 引入urlopen庫 用於開啟網頁 from u...
核心模組Makefile
前些天寫乙個驅動模組。竟然寫核心模組makefile時出了問題,於是將其總結下來,下次再用時拿過來改下就行了。general purpose makefile for linux kernel module by guoqingbo kern dir home gqb development lin...
核心模組Makefile
ifneq kernelrelease obj m hello.o else kdir lib modules shell uname r build pwd shell pwd all make c kdir m pwd modules clean make c kdir m pwd clean ...