一、numpy.loadtxt讀取資料
data=numpy.loadtxt('資料路徑.txt',delimiter=',',usecols=(0,1,2,3) , dtype=float)#讀取後是多元陣列格式
然後利用陣列的特徵獲取不同列 value=data[:,0:3],classfiy=data[:,4]
引數usecols:選取資料的列。
這裡主要說一下usecols的用法。如果iris.txt中的前4列,則usecols=(0,1,2,3)。如果取第5列這一列,則usecols=(4,)。這種取單一列的情況容易出問題,請大家多注意。
二、每個陣列都有乙個shape(表示各維度大小的元組)和乙個dtype(乙個用於說明陣列資料型別的物件)
arr.shape
arr.dtype
arr.ndim:第一維度
三、內建函式
1、生成一定範圍內的一維陣列資料,arange(n),arange(m,n,x):生成m到n之間的按照x間隔的若干點一維陣列
2、生成一定範圍內的m*n的二維陣列,arange(x).reshape(m*n)
3、np.random中的randn函式:生成一些正態分佈的隨機資料,np.random.rand(m,n):生成m*n的二維陣列
利用Python進行資料分析 Numpy 基礎
ndarray 多維陣列 ndarray 每個陣列元素必須是相同型別,每個陣列都有shape和dtype物件。shape 表示陣列大小 dtype 表示陣列資料型別 如何建立乙個陣列?in 1 import numpy as np in 2 data 1,2,3,4,5,6,7 in 3 arr n...
如何利用NumPy進行索引和切片
處理多維陣列,如何利用numpy進行索引和切片?今天番茄加速就來跟大家講解下。平時遇到關於numpy的bug,解決不了的,可以先去檢視api的使用說明。理解numpy的向量化能力,這正是賦予它簡潔的重要原因之一。使用python原生api會經常寫些for,但是numpy讓它變得不再需要,numpy一...
Python 利用numpy高效能計算
使用anaconda或者intel的高效能python distribution安裝。預設numpy已經鏈結mkl。export omp num threads n n對應物理核心數為佳,如果 寫的不夠好可以酌情加到超執行緒後邏輯核心數。如 i7 6800k,6核12執行緒。純高效能計算n設定為6,...