python變數及字元編碼

2021-09-20 17:36:01 字數 1811 閱讀 1479

變數和字元編碼

使用pycharm的優點:

1.自動補全

2.可以除錯

3.開發效率高

首先create project-->location 3.x(選擇3.x版本)-->new direcory-->new python file-->

python預設模板配置viem--tool bar--file and code templetes--python script

在shell指令碼中,首行使用#!/usr/bin/env python

使用#!/usr/bin/env python與#!/usr/local/python的區別:

#!/usr/bin/env python是在環境變數中尋找最新版本的python直譯器。

#!/usr/local/python是使用系統預設的python直譯器。

變數是為了方便後面呼叫。變數存在在記憶體中。

變數定義的規則:變數名只能是字母、數字、下劃線,變數名的第乙個字元不能是數字,關鍵字不能宣告為變數名。

變數名要是有一定的含義的。

name=』alex li』

print('my name is ',name)

name2=name

name='lisi'

print(name,name2)#此時name的值是lisi,而name2的值還是alex li

此時name2的值就與name無關了,name2只是指向name指向的記憶體位址,

找到以後name2的值就與name無關了,name的值如何變化都不影響name2

在python3.x中就直接使用變數名name=,然後變數的值用單引號括起來賦值給變數。

呼叫時直接使用print("my name is ",name),print是列印多個值用逗號隔開。

字元編碼:

python直譯器在載入.py檔案中的**時,會對內容進行編碼(預設是ascii)

ascii(美國標準資訊交換**)是基於拉丁字母的一套電腦編碼系統,主要用於

顯示現代英語和其他西歐語言,最多只能用8位來表示。所有ascii最多只能表示255個字元。

ascii不支援中文。

2023年:支援簡體中文的gb2312和繁體的big5

gb2312收錄了7445個字元(包括6783個漢字和682個其他字元)

2023年:gbk1.0收錄了21886個符號

2023年:gb18030取代gbk1.0,收錄了27484個漢字(包括少數名族文字)

現在的pc平台必須支援gb18030

中文windows的缺省內碼還是gbk(gb18030相對gbk擴充套件的字元,一般人很少用)

國際標準組織新出了乙個可以代表所有字元和符號的編碼,即unicode

unicode就是統一碼、萬國碼、單一碼,規定所有的字元和符號最少用16位來表示

utf-8是對unicode編碼的壓縮和優化,他不再使用最少兩個位元組,而是將所有的字元和符號進行分類:

ascii碼中的內容用乙個位元組儲存,歐洲的字元用2個位元組來儲存,東亞的字元用3個字元來儲存

#_*_ coding:utf-8 _*_   #此是宣告用utf-8來處理程式

pycharm常用快捷鍵:

alt+ctrl+s    開啟設定介面

tab     選擇要縮排的**,按鍵縮排

shift+tab   選擇要縮排的**,按鍵增加

ctrl+d     複製本行貼上到下一行

ctrl+?    選擇要新增注釋的行,按鍵進行#新增或去除

雙shift    全域性搜尋

ctrl+/    查詢

ctrl+r    查詢替換

python 字元編碼識別及轉換

python教程 如何檢視字串編碼 python isinstance 函式 python字串編碼 import chardet str1 你好啊!print chardet.detect str1 輸出如下。python 2.x 預設的字元編碼是 ascii,預設的檔案編碼也是 ascii。pyt...

python變數字元 python 變數字串格式

我有乙個像下面這樣的字串 a this is code 在後面的 中,我將使用為以下函式提供的引數格式化字串 我這裡的問題是,如果提供給函式format string的引數數量小於或大於所需的數量,我將得到乙個異常。相反,如果引數較少,我希望它列印空的 如果引數超過要求,那麼我希望忽略多餘的引數。我...

python字元編碼

ascii 碼是乙個位元組,通常只能顯示英文本母和數字。unicode碼為了顯示多種語言產生,但是要占用兩個位元組,顯示文字要占用大量空間 utf 8 為了節約空間而生,英文本元只用乙個位元組儲存,中文字元需要三個位元組 character ascii unicode utf 8 a01000000...