第5章 bs4 csv join擴充套件

2021-10-25 04:52:18 字數 1929 閱讀 3327

二、bs4

三、擴充套件

csv (comma separated values),即逗號分隔值(也稱字元分隔值,因為分隔符可以不是逗號),是⼀種常⽤的⽂本格式,⽤以儲存**資料,包括數字或者字元。

python⾃帶了csv模組,專⻔⽤於處理csv⽂件的讀取。

1.1 寫⼊csv⽂件

1.2 讀取csv⽂件beautiful soup 是乙個可以從html或xml檔案中提取資料的python庫

beautifulsoup需要配合解析器使用:

注意:解析器html5lib具有最好的容錯性,可以補全html的語法結構

1、簡單方法

2. bs4的物件種類

html_comment = 『-注釋-

->

<

/b>』

3、遍歷文件樹

3.1 contents、children 、descendants

3.2 string 、strings、 stripped strings

-tag的 .stripped strings 和strings基本⼀致,但是它可以把多餘的空格去掉

3.3 parent 和 parents

3.4 sibling

3.5 find和find_all

find(self, name=

none

, attrs=

, recursive=

true

, text=

none

,**kwargs)

find_all(self, name=

none

, attrs=

, recursive=

true

, text=

none

, limit=

none

,**kwargs)

:

1)name : tag標籤名稱,需要加引號

2)attrs : tag標籤的屬性,例如:class_=『bd』,注意:需要寫全且class不能加引號,而且因為class屬於python的關鍵字,所以class後面必須加下劃線_,屬於固定寫法;也可以寫成attrs=,屬性可以並列寫多個,用逗號隔開,例如:class_=『bd』,id=『link』

3)recursive : 是否遞迴搜尋

4)text : 元素值⽂本內容,例如:text=『lacie』,注意:text為關鍵字傳參

5)limit : 限制返回條數

6)kwargs : 關鍵字引數

(1)字串過濾器

(2)列表過濾器

第4章 外部匯流排 第5章 中斷處理

第4章.外部匯流排 外部匯流排提供外部裝置定址並且可以對51mx裝置進行 讀取,資料讀寫操作。外部匯流排使用相同的經典的80c51多路外部匯流排 並允許增加輸出位址為23位。4.1 多路外部匯流排 51mx外部匯流排支援8位資料傳輸並且支援23位位址口線。需要通過設定mxcon暫存器的eam位來配置...

第5章 表示式 4

5.12 型別轉換 c 並不是把兩個不同型別的值直接加在一起,而是提供了一組轉換規則,以便在執行算術操作之前,將兩個運算元轉換為同一資料型別。這些轉換規則由編譯器自動執行,無需程式設計師介入 有時甚至不需要程式設計師了解。因此,它們被稱為隱式型別轉換 implicit type conversion...

《Lua程式設計 第4版 》 第5章練習答案

monday sunday sunday 一樣,都指向該錶。a.a.a.a 3,執行的是該錶的索引 a 賦值為3,之後的a.a.a.a將會引發異常,因現a.a 3,而非表。在方括號裡寫索引值 tab for i,j in pairs tab do io.write i,j,n endfunction...