爬蟲 抓取百萬知乎使用者設計之實體設計

2022-07-06 20:54:12 字數 1028 閱讀 2418

點選我前往github檢視源**

一.實體的關係

實體是根據返回的json資料來設計的

教育經歷方面

使用者可以有很多教育經理,user和education是一對多的關係,乙個education對應乙個education

乙個使用者可以有多個工作,當然很多人可以從事同乙份工作,每份工作對應一家公司,對應乙個崗位

每個使用者可以有多個居住地,同乙個居住地有多個使用者,每個使用者有乙個行業,同乙個行業有多個使用者      

**實現就不列舉了,建立乙個model類庫專案

二.資料庫上下文

public

class

zhihuentity : dbcontext

public dbsetuser

public dbsetbusiness

public dbsetemployments

public dbsetcompany

public dbsetjob

public dbsetlocations

public dbseteducations

public dbsetschool

public dbsetmajor

public dbsetusertemp

public dbsetnexturl

}

note:nexturl和usertemp是用來存貯臨時資料的

修改好配置檔案即可使用了

爬蟲 抓取知乎百萬使用者資訊之爬蟲模組

點選我前往github檢視源 別忘記star usermanage是獲取使用者資訊的爬蟲模組 public class usermanage 建構函式 使用者主頁的url格式為 url token following public usermanage string urltoken 先封裝乙個獲取...

python 爬蟲 知乎

人生苦短,唯有python 是不是 寫多了自己就熟練了呢?人人網爬蟲模板,具體操作以後有機會再新增吧!coding utf 8 import urllib2 import urllib import cookielib import re def zhihubrower url,user,passw...

知乎首頁爬蟲

嘗試了一下知乎首頁爬蟲 import re import requests from urllib import parse 首頁鏈結 headers resp requests.get headers headers print resp.text urls re.findall content ...