斜槓反斜槓,去空格 xa0,連線函式join()

2022-09-08 00:48:28 字數 1863 閱讀 2054

斜槓:/。反斜槓:\。

反斜槓\,在windows系統中用來表示目錄。

而在unix系統中,/表示目錄。由於web遵循unix命名,所以在**(url)中,/表示目錄。

在unix系統中,\表示跳脫字元將特殊字元變成一般字元(如enter,$,空格等)。

\xa0 是不間斷空白符

我們通常所用的空格是 \x20 ,是在標準ascii可見字元 0x20~0x7e 範圍內。 

而 \xa0 屬於 latin1 (iso/iec_8859-1)中的擴充套件字符集字元,代表空白符nbsp(non-breaking space)。 

latin1 字符集向下相容 ascii ( 0x20~0x7e )。通常我們見到的字元多數是 latin1 的,比如在 mysql 資料庫中。 

有如下資訊:

't-shirt\xa0\xa0短袖圓領衫,體恤衫\xa0,', 'v-neck\xa0\xa0v型領\xa0sleeve\xa0\xa0袖子\xa0,',

>>> inputstring = u'\n                      door:\xa0novum          \t      '

>>> move = dict.fromkeys((ord(c) for c in u"\xa0\n\t"))

>>> output = inputstring.translate(move)

>>> output

' door:novum

另外還有一種更簡單的方法,利用split方法:

>>> s

't-shirt\xa0\xa0短袖圓領衫,體恤衫\xa0'

>>> out = "".join(s.split())

>>> out

't-shirt短袖圓領衫,體恤衫'

可以發現利用translate方法、split()可以完美解決,並且還可以替換\t \n字元,由此又學到了新知識!

關於ord函式: 

ord()函式是chr()函式(對於8位的ascii字串)或unichr()函式(對於unicode物件)的配對函式,它以乙個字元(長度為1的字串)作為引數,返回對應的ascii數值,或者unicode數值,如果所給的unicode字元超出了你的python定義範圍,則會引發乙個typeerror的異常。

關於fromkeys方法: 

dict中的fromkeys方法目的是建立乙個只有key的字典,內部利用for迴圈,使三個字元的asii碼值成為可迭代物件(本來的整數是不可迭代的),分別對其迭代,存入字典。

關於translate方法: 

python translate() 方法根據引數table給出的表(包含 256 個字元)轉換字串的字元, 要過濾掉的字元放到 del 引數中。接收到move返回的表(字典),之後對字串進行替換。

join()方法:

join(): 連線字串陣列。將字串、元組、列表中的元素以指定的字元(分隔符)連線生成乙個新的字串。

join()方法語法:

str.join(sequence),其中,str指定的用來連線的字元(分隔符),sequence是被連線的字串陣列,元組,列表。

返回:返回通過指定字元連線序列中元素後生成的新字串。

例如:

>>>str = "-";

>>>seq = ("a", "b", "c"); # 字串序列

>>>print str.join( seq );

a-b-c

可見該處用join方法真的是神來之筆,可謂絕妙!

值得注意的是,split方法中不帶引數時,表示分割所有換行符、製表符、空格。

斜槓 和反斜槓

unix使用斜槓 作為路徑分隔符,而web應用最新使用在unix系統上面,所以目前所有的網路位址都採用斜槓 作為分隔符。windows系統已經使用斜槓 作為dos命令提示符的引數標誌了,為了不混淆,所以採用反斜槓 作為路徑分隔符。隨著發展,dos系統已經被淘汰了,命令提示符也用的很少,斜槓和反斜槓在...

如何區分斜槓和反斜槓?

引用 斜槓 與反斜槓 有什麼區別?反斜槓 是電腦出現了之後為了表示程式設計裡的特殊含義才發明的專用標點。就是說,除了程式設計領域外,任何地方你都不應該有使用反斜槓的時候,請永遠使用正斜槓 從左往右走 作為目錄分隔符 windows目前用 和 都可以 unix只能用 ps 因為web最開始在unix上...

斜槓 和 反斜槓 的區別

unix linux 使用斜槓 作為路徑分隔符,而 web 應用最新使用在 unix 系統上面,所以目前所有的網路位址都採用斜槓 作為分隔符。windows 由於已經使用斜槓 作為 dos 命令提示符的引數標誌了,為了不混淆所以採用反斜槓 作為路徑分隔符。所以目前windows系統上的檔案瀏覽器都是...