Python資料分析筆記

2021-08-16 01:36:19 字數 2768 閱讀 8156

數值型字元型

資料結構 取值

true: 真

false:假

運算規則

&:與

一假為假,兩真為真

true & true

true & false

false & false

|:或

兩假為假,一真為真

true | true

true | false

false | false

not:非

非真為假,非假為真

not

true

notfalse

加、減、乘、除
x + y

x - y

x * y

x / y

取整

7 // 4求餘

10 % 4乘方

2 ** 3

乙個關於浮點數運算需要注意的地方

a = 4.2

b = 2.1

a + b

# 6.300000000000001

(a + b) == 6.3

#false

可用以下步驟處理

from decimal import decimal

a = decimal('4.2')

b = decimal('2.1')

a + b

# decimal('6.3')

(a + b) == decimal('6.3')

# true

建立字元

字串str用單引號''或雙引號" "括起來

x = '我是乙個字串'

y = "我也是乙個字串"

z = """我還是乙個字串"""

轉義

使用反斜槓\轉義特殊字元。

s = 'yes,he doesn\'t'
如果不想讓\發生轉義,

可以在字串前面新增乙個r,表示原始字串

print('c:\some\name')

# \some

#ame

print('c:\\some\\name')

# c:\some\name

print(r'c:\some\name')

# c:\some\name

s = "abcd\

efg"

print(s)

# abcdefg

多行字元

還可以使用"""..."""或者'''...'''跨越多行

s = """

hello i am fine!

thinks.

"""print(s)

# hello i am fine!

# thinks.

建立series
from pandas import series

x = series(

['a', true, 1]

)

修改系列索引
x = series(

['a', true, 1],

index=['first', 'second', 'third']

)

訪問
x[1]

x['second']

#不能越界訪問

x[3]

# keyerror: 3

追加元素
#不能追加單個元素

# typeerror: cannot concatenate a non-ndframe object

#追加乙個序列

n = series(['2'])

# 0 a

# 1 true

# 2 1

# 0 2

# dtype: object

x# 0 a

# 1 true

# 2 1

# dtype: object

#需要使用乙個變數來承載變化

'2'in x

# false

#判斷值是否存在

'2'in x.values

# true

切片
x[1:3]

# 1 true

# 2 1

# dtype: object

刪除
#根據index刪除

x.drop(0)

x.drop('first')

#根據位置刪除

x.drop(x.index[3])

#根據值刪除

x['2'!=x.values]

Python資料分析筆記(二)

接上文python資料分析筆記 一 關注一些每行資料的 a 字段 發現這行含有url短操作的瀏覽器,裝置,應用程式的相關資訊 我們現在想要按微軟使用者和非微軟使用者對時區資訊進行分解,即想知道不同時區微軟使用者和非微軟使用者的比例 假定 a 欄位中含有 windows 的就認為是微軟使用者 首先,去...

Python資料分析入門筆記

資料基本處理 資料缺失值處理有好幾種對應的函式,接下來介紹三種我學習的函式dropna,fillna,replace.這三種函式功能上的區別,以及不同的適用場景.這三種函式都在pandas裡,所以寫 時首先要匯入pandas dropna 函式是用來濾除缺失值的,預設的情況下是清除所有的含有nan資...

資料分析筆記

1,資訊幾乎都是用於兩個目的 操作型記錄的儲存和分析型決策的制定。簡單說,操作性系統儲存資料,而dw bi系統使用資料。2,同比環比從定義上來說很簡單,吳捷的答案說的很清楚了,我來補充一下兩者的適用範圍 同比是今年的某個階段與去年的相同時段比較,適用於觀察某個指標在不同年度的變化,優勢是可以去除大多...