關於微博爬蟲我棄坑了

mac安裝環境的坑

微博反爬蟲實在太秀了

太長不看簡略版：

如果你單機還不用**ip伺服器，還想爬取百萬級使用者資料，那麼這篇文章無用，筆者也不知道有什麼方法可以實現這份幻想

我用的是sina_spider3

liuxingming/sinaspider

這裡不再贅述了

參考文章

mac安裝redis

關於redis的配置：

我是在usr/local/etc/下copy的redis.conf檔案並進行配置的，

主要就是修改為守護模式

daemonize yes

雖然安裝的環境本沒有mysql，但是裡面有個模組需要，所以得pip install mysql-python,

參考文獻：

mac安裝mysql-python遇到的坑，被這倆報錯反覆摩擦：『my_config.h』 file not found 和 indexerror: string index out of range

在此容許我吹一波彩虹屁：

微博的反爬蟲機制真的是秀，天秀，陳獨秀，蒂花之秀，造化鐘神秀……可以理解，雖然是公開的社交平台，但是既要保證廣大人民群眾的正常訪問，不至於動不動就崩潰，還想讓人多利用一下微博資料，好帶大微博平台，所以設定的門檻就很高，微博封賬號不封ip，微博封賬號不封ip，微博封賬號不封ip，所以在cookies.py中就算新增了百八十個賬號和密碼，不用**ip是不行的，然而**ip真的挺貴的，我的主要目的就是為了畢設處理資料，而不是爬取資料，所以我直接買了資料，我的微博爬蟲之旅就此結束了。

微博賬號購買店鋪

因為爬蟲時在同乙個ip下登入兩個賬號就會異常，而微博安全措施搞的實在是秀，異常後只能繫結/驗證手機號來解除異常狀態，所以異常後買來的賬號有的就算廢了，但是推薦這個店鋪的郵箱註冊號，綁號無驗證碼的那個，目前0.26元乙個，異常後還能登入，不必擔心，重要的事情說三遍，必須用**ip，必須用**ip，必須用**ip，我的微博爬蟲之旅到此為止，本著天下碼農一家人的理念，給大家乙個經驗。微博賬號購買某寶沒找到，目前度娘還有店鋪，有的店鋪讓賬號密碼登入支付寶，害怕，這個鏈結親試ok

關於微博爬蟲我棄坑了

微博爬蟲python 微博爬蟲 python

Python 微博搜尋爬蟲

微博爬蟲總結構建單機千萬級別的微博爬蟲系統

關於微博爬蟲我棄坑了

微博爬蟲python 微博爬蟲 python

Python 微博搜尋爬蟲

微博爬蟲總結 構建單機千萬級別的微博爬蟲系統

相關推薦

微博爬蟲總結構建單機千萬級別的微博爬蟲系統