設定大小
fig = plt.figure (figsize = (20,8),dpi = 80)
長,寬; dpi==>每英吋畫素,數值越大越清晰
匯入pyplot工具
import
import matplotlib.pyplot as plt
設定大小,使用figure方法
plt.figure(figsize=(20
,8),dpi=
80)
處理引數
x:很座標引數是可迭代物件,可以是range,tuple,list等,生成器不可以
y:可迭代物件形式給定
對座標刻度及刻度描述標籤進行設定,使用 xticks/yticks 屬性(方法)進行設定
plt.xticks(_x[::
3], _xticks_lables[::
3],rotation =45)
# 至少傳入兩個引數,第乙個是x的刻度,第二個是x軸的刻度標籤,兩者是一一對應的關係,rotation設定顯示角度
呼叫繪圖命令,不同的圖形顯示使用不同的命令,命令**如下:
plt.comand(x,y,關鍵字傳參)
comand: plot:繪製折線圖
scatter: 繪製散點圖
bar:繪製矩形圖,橫向顯示的使用barh
# 新增圖例,顯示上面設定的label標籤
plt.legend(
)
# 設定座標軸的標籤顯示
plt.xlabel(
'時間'
)plt.ylabel(
'溫度'
)plt.show(
)
建立陣列:
陣列的形狀
陣列的運算
同維度的陣列運算
不同維度的陣列運算
結論:列相同的陣列進行算數運算,結果等於對應位置的元素算數運算後組成的陣列
不同維度的陣列進行運算時,相同的形狀的對應位置進行計算。軸
問題點:1.bool索引
資料檔案格式 : csv:comma-separated value,逗號分隔值檔案
顯示:**狀態
原始檔:換行和逗號分隔行列的格式化文字,每一行的資料表示一條記錄
呼叫函式
二維陣列中的轉置方法:
numpy中的索引和切片
numpy中數值修改
只需要取出後直接賦值就可以
陣列的拼接
兩種拼接方式:豎直拼接,水平拼接
np.vstack(t1,t2):將t1和t2進行豎直方向上 的拼接,t1在上,t2在下
np.hstack(t1,t2):將t1和t2進行水平方向上的拼接,t1在左,t2在右
注意:水平分割是豎直畫條線,與水平拼接是互逆過程,豎直分割同理
陣列的行列交換
使用索引和切片的方式
行交換:t[[1,2],:] = t[[2,1],:]# 交換1行和2行的資料
列交換:t[:,[0,2]] = t[:,[2,0]]# 交換0列和2列的資料
獲取最大值最小值的位置
numpy生成隨機數
numpy中的nan型資料是浮點數,nan即缺失資料
陣列中有nan的計算方法:將nan的數值替換為均值或者中值。
t.mean(axis=0):求平均值
numpy中的常用統計函式
求和:t.sum(axis=none)
均值:t.mean(a,axis=none) 受離群點的影響較大
中值:np.median(t,axis=none)
最大值:t.max(axis=none)
最小值:t.min(axis=none)
極值:np.ptp(t,axis=none) 即最大值和最小值只差
標準差:t.std(axis=none)
numpy中的nan替換方法
幫助我們處理非數值型的資料
常用的資料型別
1. series,一維資料,帶標籤的陣列
2. dataframe,二維資料,series容器
pandas讀取外部資料
pandas常用統計方法
獲取行索引用什麼,shape(1)?shape[1]是什麼
set_index後,原資料是否改變
reset_index,是新增還是替換?
data[:10]獲取前10行元素
genre_count = zeros_df.sum(axis = 0).sort_values()
_x = genre_count.index
_y = genre_count.values
plt.figure(figsize = (20,8),dpi = 80)
plt.bar(_x,_y)
plt.show()
* pandas資料合併
預設情況下他時把航航索引相同的資料合併到一起
# 問題
獲取行索引用什麼,shape(1)?shape[1]是什麼
set_index後,原資料是否改變
reset_index,是新增還是替換?
data[:10]獲取前10行元素
機器學習 (科學計算庫)1
資料決定了機器學習結果的上限,而演算法只是盡可能逼近這個上限。1,機器學習是從資料中自動分析獲得模型,並利用模型對未知資料進行 機器學習工作流程總結 1,獲取資料 2,資料基本處理 3,特徵工程 4,機器學習 模型訓練 5,模型評估 資料簡介 一行資料稱為乙個樣本 一列資料稱為乙個特徵 機器學習一般...
科學計算 安裝GNU的開源科學計算庫gsl
gsl是gnu的乙個開源科學計算庫,c語言的。不過感覺使用人群小了點,最近一次更新是在2011年。gnu的專案有好多是費了的,純粹的開源不尋求商業途徑很難撐下去。下面是專案主頁 專案主頁 原始碼和其他開源的一樣,解壓後,輸入.confiure,make,make install。最後乙個一定要sud...
科學計算 安裝GNU的開源科學計算庫gsl
gsl是gnu的乙個開源科學計算庫,c語言的。不過感覺使用人群小了點,最近一次更新是在2011年。gnu的專案有好多是費了的,純粹的開源不尋求商業途徑很難撐下去。下面是專案主頁 專案主頁 原始碼和其他開源的一樣,解壓後,輸入.confiure,make,make install。最後乙個一定要sud...