chapter 初識1 0 編寫第乙個爬蟲

2021-10-03 23:17:44 字數 1130 閱讀 2816

因為之前就對python有所了解,所以就不對python的安裝與環境配置有過多的說明了(這好像也不是初識哦,哈哈)。

這裡使用python3.7 spyder整合開發環境,因為使用的是anaconda自帶很多第三方庫所以這裡就不對第三方庫的匯入有過多的說明了。

編寫第乙個簡單的爬蟲

# -*- coding: utf-8 -*-

import requests

url=

""#起點中文網的url,這裡是目標**

r=requests.get(url)

#使用requests中get方法來拿到這個url

print

(r.status_code)

#列印的返回狀態碼200表示成功404代表失敗

列印結果:200以文字的形式列印網頁

print

(r.text)

#以文字的形式列印出網頁

# -*- coding: utf-8 -*-

import requests

url=

""#起點中文網的url,這裡是目標**

r=requests.get(url)

#使用requests中get方法來拿到這個url

print

(r.status_code)

#列印的返回狀態碼200表示成功404代表失敗

print

(r.text)

#以文字的形式列印出網頁

print

(r.text)

執行結果

會發現有那些我們熟悉的字眼。

貼出requests庫的常用方法和response物件的屬性

js第一(初識)

1 js是世界最流行的語言,是一種指令碼語言 不需要編譯,由js直譯器逐行解釋並執行 2 瀏覽器分為渲染引擎 用來解析html和css的俗稱核心 和js引擎 js直譯器,用來讀取網頁中的js 3 js組成 ecmascript js語法 dom 物件導向模型 bom 瀏覽器物件模型 4 js三種寫法...

chapter 初識1 1 正規表示式一

了解 正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元 及這些特定字元的組合,組成乙個 規則字串 這個 規則字串 用來表達對字串的一種過濾邏輯。普通字元作為原子 import re string helloworld 普通字元作為原子 p owo 要匹配的字元賦予p result...

第一單元 初識html

第一單元 初識html 什麼是html html並不是一門程式語言,而是標記語言他的字尾名是.html,用單詞的首字母或者單詞來來組成各個結構的意義。html標記 html標記用法是使用 如這樣 書寫格式 標籤 內容當然我們的標記是分為單標籤和雙標籤的,但占多數是雙標籤,但使用下來不多的單標籤使用率...