python 利用numpy進行資料分析

2022-08-29 22:57:28 字數 633 閱讀 5090

一、numpy.loadtxt讀取資料

data=numpy.loadtxt('資料路徑.txt',delimiter=',',usecols=(0,1,2,3) , dtype=float)#讀取後是多元陣列格式

然後利用陣列的特徵獲取不同列 value=data[:,0:3],classfiy=data[:,4]

引數usecols:選取資料的列。

這裡主要說一下usecols的用法。如果iris.txt中的前4列,則usecols=(0,1,2,3)。如果取第5列這一列,則usecols=(4,)。這種取單一列的情況容易出問題,請大家多注意。

二、每個陣列都有乙個shape(表示各維度大小的元組)和乙個dtype(乙個用於說明陣列資料型別的物件)

arr.shape

arr.dtype

arr.ndim:第一維度

三、內建函式

1、生成一定範圍內的一維陣列資料,arange(n),arange(m,n,x):生成m到n之間的按照x間隔的若干點一維陣列

2、生成一定範圍內的m*n的二維陣列,arange(x).reshape(m*n)

3、np.random中的randn函式:生成一些正態分佈的隨機資料,np.random.rand(m,n):生成m*n的二維陣列

利用Python進行資料分析 Numpy 基礎

ndarray 多維陣列 ndarray 每個陣列元素必須是相同型別,每個陣列都有shape和dtype物件。shape 表示陣列大小 dtype 表示陣列資料型別 如何建立乙個陣列?in 1 import numpy as np in 2 data 1,2,3,4,5,6,7 in 3 arr n...

如何利用NumPy進行索引和切片

處理多維陣列,如何利用numpy進行索引和切片?今天番茄加速就來跟大家講解下。平時遇到關於numpy的bug,解決不了的,可以先去檢視api的使用說明。理解numpy的向量化能力,這正是賦予它簡潔的重要原因之一。使用python原生api會經常寫些for,但是numpy讓它變得不再需要,numpy一...

Python 利用numpy高效能計算

使用anaconda或者intel的高效能python distribution安裝。預設numpy已經鏈結mkl。export omp num threads n n對應物理核心數為佳,如果 寫的不夠好可以酌情加到超執行緒後邏輯核心數。如 i7 6800k,6核12執行緒。純高效能計算n設定為6,...