關於Python35爬蟲的一些個人想法我是菜鳥

最近打算寫乙個爬蟲去爬取招聘**的招聘資訊，在經過一周的python基本學習後，初步打算使用python進行爬蟲的開發。在初步接觸後，本打算使用分布式結構進行爬取作業，但是卻在測試過程中，發現一些問題。先貼上我寫的測試用例

首先參照了官方文件的例子

master.py

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
from multiprocessing.managers import basemanager
import queue
queue = queue.queue()
class
queuemanager
(basemanager):
pass
queuemanager.register('get_queue',callable=lambda : queue)
m = queuemanager(address=('127.0.0.1',50000),authkey=b'abracadabra')
s = m.get_server()
s.serve_forever()

worker_1.py

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
from multiprocessing.managers import basemanager
import queue
class
queuemanager
(basemanager):
pass
queuemanager.register('get_queue')
m = queuemanager(address=('127.0.0.1',50000),authkey=b'abracadabra')
m.connect()
queues = m.get_queue()
queues.put('測試')

worker_2.py

from multiprocessing.managers import basemanager
import queue
class
queuemanager
(basemanager):
pass
queuemanager.register('get_queue')
m = queuemanager(address=('127.0.0.1',50000),authkey=b'abracadabra')
m.connect()
queue = m.get_queue()
print(queue.get())

最後的結果是在worker_2.py中可以列印出，worker_1.py的「測試」字串。

但是這種寫法有個明顯的問題，在主節點master.py 中，是阻塞式也就是說執行了s.serve_forever()之後，該指令碼中的其它程式也就無法正常執行。我理解，該類可以看做乙個連線不同程序之間的橋梁。雖然master.py 中也可以通過以下方法傳遞值：

from multiprocessing import process, queue
from multiprocessing.managers import basemanager
import queue
class
worker
(process):
def__init__
(self, q):
self.q = q
super(worker, self).__init__()
defrun(self):
self.q.put('local hello')
if __name__ == '__main__':
queues = queue()
w = worker(queues)
w.start()
myq = queue.queue()
class
queuemanager
(basemanager):
pass
queuemanager.register('get_queue', callable=lambda: queues)
queuemanager.register('get_myq', callable=lambda: myq)
m = queuemanager(address=('127.0.0.1', 50000), authkey=b'abracadabra')
s = m.get_server()
s.serve_forever()

但是這樣操作，依然不能解決我需要在master.py進行一些分發操作的需求

所以我只能暫緩使用該種方式，以期待通過後面學習或者博友們提供好方法。

附上乙個錯誤解決方法:

這是因為在子程序中又建立了程序引起，解決方法為在ifname==』main』主程序進行建立程序操作

關於Python35爬蟲的一些個人想法我是菜鳥

python 3 5 爬蟲日記2

關於爬蟲的一些東西

關於爬蟲的一些記錄

關於Python35爬蟲的一些個人想法 我是菜鳥

python 3 5 爬蟲日記2

關於爬蟲的一些東西

關於爬蟲的一些記錄

相關推薦

關於Python35爬蟲的一些個人想法我是菜鳥