二、pandas
三、matplotlib
numpy是資料科學計算的基礎模組,用於資料值計算
基於陣列運算,效率高
擁有許多高階函式,可以對資料進行高效處理
可以進行線性代數相關運算
匯入numpy庫
import numpy as np
建立乙個一維陣列
a = np.array([2
,4,5
,7,-8])
建立乙個二維陣列
陣列相乘
pandas是專門用作資料處理和分析的,使用起來十分高效和簡潔,擁有許多各種複雜的函式,其使用起來非常高效便捷,是資料分析領域使用最廣泛的庫之一。
導入庫
import pandas as pd
建立乙個標準陣列
匯入**檔案
data = pd.read_excel(r'c:\users\86155\desktop\bigdata\cckstrain.xls'
)data.head(5)
#只檢視前五行
matplotlib用於做資料視覺化
導入庫
import matplotlib.pyplot as plt
乙個自變數,從0開始,最大值是10,一共1000個
x = np.linspace(0,
10,1000
)
乙個sin函式
y = np.sin(x)
繪圖
plt.plot(x,y,label=
'y=sinx'
,color=
'red'
,linewidth=2)
#專門畫圖的方法,x軸和y軸,圖名稱label,
plt.xlabel(
'time'
)#x軸的名稱
plt.ylabel(
'vol'
)#y軸的名稱
plt.title(
'this is line'
)#圖的標題
plt.legend(loc =
'center'
)#對圖例進行操作,圖例放在什麼位置。居中
plt.show(
)#列印出來
python資料分析常用函式
for 目標 in 對像 print 賦值目標 1.for迴圈字串操作 a iplaypython.com for i in a print i 案例中的 i 相當於目標,字串變數a是遍歷 迭代 對像。當執行for迴圈語句時,每一次迭代時,i 都會從遍歷 迭代 對像a中接收乙個新值輸出。結束迴圈後,...
Python資料分析 requests使用
匯入模組 傳送get請求,獲取響應 從響應中獲取資料 匯入模組 import requests 2.傳送請求獲取響應 response requests.get 3.獲取響應資料 print response.text 3.獲取響應資料 print response.encoding iso 885...
Python資料分析常用的庫總結
python之所以能夠成為資料分析與挖掘領域的最佳語言,是有其獨特的優勢的。因為他有很多這個領域相關的庫可以用,而且很好用,比如numpy scipy matploglib pandas scikitlearn keras gensim等 1 numpy,它給python提供了真正的陣列功能,包括多...