數值型字元型
資料結構 取值
true
: 真
false
:假
運算規則
&:與
一假為假,兩真為真
true & true
true & false
false & false
|:或
兩假為假,一真為真
true | true
true | false
false | false
not:非
非真為假,非假為真
not
true
notfalse
加、減、乘、除x + y
x - y
x * y
x / y
取整
7 // 4
求餘
10 % 4
乘方
2 ** 3
乙個關於浮點數運算需要注意的地方
a = 4.2
b = 2.1
a + b
# 6.300000000000001
(a + b) == 6.3
#false
可用以下步驟處理
from decimal import decimal
a = decimal('4.2')
b = decimal('2.1')
a + b
# decimal('6.3')
(a + b) == decimal('6.3')
# true
建立字元
字串str
用單引號''
或雙引號" "
括起來
x = '我是乙個字串'
y = "我也是乙個字串"
z = """我還是乙個字串"""
轉義
使用反斜槓\
轉義特殊字元。
s = 'yes,he doesn\'t'
如果不想讓\
發生轉義,
可以在字串前面新增乙個r
,表示原始字串
print('c:\some\name')
# \some
#ame
print('c:\\some\\name')
# c:\some\name
print(r'c:\some\name')
# c:\some\name
s = "abcd\
efg"
print(s)
# abcdefg
多行字元
還可以使用"""..."""
或者'''...'''
跨越多行
s = """
hello i am fine!
thinks.
"""print(s)
# hello i am fine!
# thinks.
建立series
from pandas import series
x = series(
['a', true, 1]
)
修改系列索引x = series(
['a', true, 1],
index=['first', 'second', 'third']
)
訪問x[1]
x['second']
#不能越界訪問
x[3]
# keyerror: 3
追加元素#不能追加單個元素
# typeerror: cannot concatenate a non-ndframe object
#追加乙個序列
n = series(['2'])
# 0 a
# 1 true
# 2 1
# 0 2
# dtype: object
x# 0 a
# 1 true
# 2 1
# dtype: object
#需要使用乙個變數來承載變化
'2'in x
# false
#判斷值是否存在
'2'in x.values
# true
切片x[1:3]
# 1 true
# 2 1
# dtype: object
刪除#根據index刪除
x.drop(0)
x.drop('first')
#根據位置刪除
x.drop(x.index[3])
#根據值刪除
x['2'!=x.values]
Python資料分析筆記(二)
接上文python資料分析筆記 一 關注一些每行資料的 a 字段 發現這行含有url短操作的瀏覽器,裝置,應用程式的相關資訊 我們現在想要按微軟使用者和非微軟使用者對時區資訊進行分解,即想知道不同時區微軟使用者和非微軟使用者的比例 假定 a 欄位中含有 windows 的就認為是微軟使用者 首先,去...
Python資料分析入門筆記
資料基本處理 資料缺失值處理有好幾種對應的函式,接下來介紹三種我學習的函式dropna,fillna,replace.這三種函式功能上的區別,以及不同的適用場景.這三種函式都在pandas裡,所以寫 時首先要匯入pandas dropna 函式是用來濾除缺失值的,預設的情況下是清除所有的含有nan資...
資料分析筆記
1,資訊幾乎都是用於兩個目的 操作型記錄的儲存和分析型決策的制定。簡單說,操作性系統儲存資料,而dw bi系統使用資料。2,同比環比從定義上來說很簡單,吳捷的答案說的很清楚了,我來補充一下兩者的適用範圍 同比是今年的某個階段與去年的相同時段比較,適用於觀察某個指標在不同年度的變化,優勢是可以去除大多...