python資料科學實踐指南

2021-09-28 20:47:32 字數 2974 閱讀 4897

python io讀寫外部資料

資料科學的第三方庫

python圖資料分析庫

大資料工具

1.資料科學的過程分為:資料採集、資料清洗、資料處理和資料查詢與視覺化。

2.資料科學需要的技能:python程式語言、演算法、資料庫、作業系統、概率與統計、線性代數和英語。

3.程式設計學習**:codecademy、pluralsight

4.演算法學習**:

3.版本變更3.8

4.檢查執行python: win+r開啟執行,輸入cmd開啟命令列輸入python回車,執行成功會返回版本號等資訊進入了shell程式設計模式輸入exit()可退出

pycharm、sublime text 3 和notepad++

1.python的5種基本資料型別:none,int(整數),float(浮點型),bool(布林型),str(字串型)

2.變數賦值

python賦值命名是位址引用。

id(變數名) 可以顯示位址值

3.操作符和表示式

算術操作符:+、-、*、**、/、//、%

位操作符:<<、>>、&、|、^、~、

比較操作符:<、>、<=、>=、==、!=

邏輯操作符:and、or、not、

4.字串

拼接字串:+,*

分片操作:變數名[開始位置:結束位置:步長]

, 口訣 **左閉又開,從零開始** 如:s=

'abcdefg'

, s[1:

-1:1

] 輸出:bcdef

字串長度:len

(變數名)

,如 len

(s) 輸出:7

5.獲取鍵盤輸入

raw_input(『請輸入』)

6.流程控制

條件判斷:if x %2==

0:print

('1'

) elif x %3==

0:print

('2'

)else

:print

('3'

) 迴圈:while迴圈:

x =5 iters =

10 ans =

0while iters >0:

ans = ans + x

iters -=

1print

(ans)

for迴圈:

for iters in

range(10

):if ans %3==

0:continue

if ans >=10:

break

print

(iters)

7.注釋

#注釋一行

"""注釋

多行"""

1.函式:

定義函式:

def my_abs

(num)

:if num <0:

return

-num

return num

my_abs(-

1)實參:flip

(y=1

,x=2

) 可變引數:def func

(*args,

**kwargs)

:print

(args,kwargs)

遞迴:def fact

(n):

if n >1:

return n *

fact

(n-1

)else

return n

2.閉包

閉包是引用了自由變數的函式

def gen_counter

(name)

: count=[0

] def counter()

: counter[0]

+=1print

(name,

str(count[0]

))return counter

c =gen_counter

('master')c

()c(

)

3.異常處理

def div

(a,b)

:try

: ret = a / b

except zerodivsionerror:

print

('0不能做被除數'

)finally

:print

('done'

)return ret

div(1

,0)

s.

strip

() 去除字串兩邊的空白字元

s.capitalize

() 首字母大寫

s.lower

() 字母小寫

s.title

() 每個單詞首字母大寫

s.upper

() 字母大寫

s.isalnum

() 判斷字串中是否包含字母或數字

s.split

() 分割字串

s.format

() 格式化字串

re.compile

() 建立正規表示式

不可變型別:元祖(tuple) s=(1,2,3)

可變型別:列表(list) s=[1,2,3]

字典(dict) s=

集合(set)

《Python資料科學實踐指南》 2 2 字串

在第1章中我們已經接觸過字串了,python不像其他語言一樣有字元型別,在python中,乙個字元僅僅是包含乙個字元的字串。而且字串也能夠進行運算,主要支援兩種運算子 和 示例 如下 a b ab a 3 aaa a b true這兩個運算子很容易理解,代表字串拼接,可以組合兩個字串 代表複製多份然...

Python 資料科學指南 1 5使用集合

集合 不能存在重複值,是無序的同類元素的集合,通常情況下,集合被用來刪除列表中的重複值。操作 集合支援交集 並集 差集和對稱差等操作。encoding utf 8 1.初始化兩個句子 st 1 dogs chase cats st 2 dogs hate cats 2.從字串中建立詞的集合,st 1...

《Python資料科學指南》 1 22 列表排序

我們先討論列表排序,然後擴充套件到對其他可迭代物件的排序。排序有兩種方法,第1種是使用列表裡內建的sort函式。第2種是使用sorted函式。我們通過示例來進行說明。我們來看看如何使用sort和sorted函式。先看一小段 對給定的列表進行排序 a 8,0,3,4,5,2,9,6,7,1 b 8,0...