python如何去掉字串 xa0

2022-03-13 08:23:06 字數 903 閱讀 1936

最近在用爬蟲爬取網頁資訊時,在網頁原始碼中遇到了「 "字串,經查閱,發現該字元是不間斷空格符。我們通常所用的空格是 \x20 ,是在標準ascii可見字元 0x20~0x7e 範圍內。而 \xa0 屬於 latin1 (iso/iec_8859-1)中的擴充套件字符集字元,代表空白符nbsp(non-breaking space)。 latin1 字符集向下相容 ascii ( 0x20~0x7e )。

>>> s = '09月27日\xa0發布'

>>> s = "".join(s.split())

>>> s

'09月27日發布'

>>>

join()方法: 

join(): 連線字串陣列。將字串、元組、列表中的元素以指定的字元(分隔符)連線生成乙個新的字串。

split():split方法中不帶引數時,表示分割所有換行符、製表符、空格。

最近在用爬蟲爬取網頁資訊時,在網頁原始碼中遇到了「 "字串,經查閱,發現該字元是不間斷空格符。我們通常所用的空格是 \x20 ,是在標準ascii可見字元 0x20~0x7e 範圍內。而 \xa0 屬於 latin1 (iso/iec_8859-1)中的擴充套件字符集字元,代表空白符nbsp(non-breaking space)。 latin1 字符集向下相容 ascii ( 0x20~0x7e )。

>>> s = '09月27日\xa0發布'

>>> s = "".join(s.split())

>>> s

'09月27日發布'

>>>

join()方法: 

join(): 連線字串陣列。將字串、元組、列表中的元素以指定的字元(分隔符)連線生成乙個新的字串。

split():split方法中不帶引數時,表示分割所有換行符、製表符、空格。

python中去掉字串中的 xa0 t n

今天在做爬蟲時,發現提取出的資訊中有 xa0 並且無法去掉,查閱了相關資料,後發現該字元表示空格。xa0 是不間斷空白符 我們通常所用的空格是 x20 是在標準ascii可見字元 0x20 0x7e 範圍內。而 xa0 屬於 latin1 iso iec 8859 1 中的擴充套件字符集字元,代表空...

Python去掉字串中空格的方法

這篇文章主要介紹了python中去掉字串中空格的方法,使用了strip lstrip rstrip 函式,需要的朋友可以參考下.我們經常在處理字串時遇到有很多空格的問題,乙個乙個的去手動刪除不是我們程式設計師應該做的事情,今天這篇技巧的文章指令碼之家就來給大家講一下,如何用python去除字串中的空...

關於Python去掉字串中的空格

經常會遇到需要將字串中的空格去掉的情況,通常我們有三種解決方法 1 strip char 方法 該方法是不能將字串中間的空格去掉的!a wode ge niu a.strip wode ge niu a wode ge niu a.lstrip wode ge niu a wode ge niu a...