二、bs4
三、擴充套件
csv (comma separated values),即逗號分隔值(也稱字元分隔值,因為分隔符可以不是逗號),是⼀種常⽤的⽂本格式,⽤以儲存**資料,包括數字或者字元。
python⾃帶了csv模組,專⻔⽤於處理csv⽂件的讀取。
1.1 寫⼊csv⽂件
1.2 讀取csv⽂件beautiful soup 是乙個可以從html或xml檔案中提取資料的python庫
beautifulsoup需要配合解析器使用:
注意:解析器html5lib具有最好的容錯性,可以補全html的語法結構
1、簡單方法
2. bs4的物件種類
html_comment = 『-注釋-
->
<
/b>』
3、遍歷文件樹
3.1 contents、children 、descendants
3.2 string 、strings、 stripped strings
-tag的 .stripped strings 和strings基本⼀致,但是它可以把多餘的空格去掉
3.3 parent 和 parents
3.4 sibling
3.5 find和find_all
find(self, name=
none
, attrs=
, recursive=
true
, text=
none
,**kwargs)
find_all(self, name=
none
, attrs=
, recursive=
true
, text=
none
, limit=
none
,**kwargs)
:
1)name : tag標籤名稱,需要加引號
2)attrs : tag標籤的屬性,例如:class_=『bd』
,注意:需要寫全且class不能加引號,而且因為class屬於python的關鍵字,所以class後面必須加下劃線_,屬於固定寫法;也可以寫成attrs=
,屬性可以並列寫多個,用逗號隔開,例如:class_=『bd』,id=『link』
3)recursive : 是否遞迴搜尋
4)text : 元素值⽂本內容,例如:text=『lacie』
,注意:text為關鍵字傳參
5)limit : 限制返回條數
6)kwargs : 關鍵字引數
(1)字串過濾器
(2)列表過濾器
第4章 外部匯流排 第5章 中斷處理
第4章.外部匯流排 外部匯流排提供外部裝置定址並且可以對51mx裝置進行 讀取,資料讀寫操作。外部匯流排使用相同的經典的80c51多路外部匯流排 並允許增加輸出位址為23位。4.1 多路外部匯流排 51mx外部匯流排支援8位資料傳輸並且支援23位位址口線。需要通過設定mxcon暫存器的eam位來配置...
第5章 表示式 4
5.12 型別轉換 c 並不是把兩個不同型別的值直接加在一起,而是提供了一組轉換規則,以便在執行算術操作之前,將兩個運算元轉換為同一資料型別。這些轉換規則由編譯器自動執行,無需程式設計師介入 有時甚至不需要程式設計師了解。因此,它們被稱為隱式型別轉換 implicit type conversion...
《Lua程式設計 第4版 》 第5章練習答案
monday sunday sunday 一樣,都指向該錶。a.a.a.a 3,執行的是該錶的索引 a 賦值為3,之後的a.a.a.a將會引發異常,因現a.a 3,而非表。在方括號裡寫索引值 tab for i,j in pairs tab do io.write i,j,n endfunction...