基礎類庫簡介ndarray陣列建立
ndarray的矩陣運算
元素計算函式
元素統計函式
元素判斷函式
元素去重排序函式
資料分析概念:資料分析是指用適當的統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論的過程。
資料分析的過程:
1. 資料收集:本地資料或者網路資料的採集與操作.
2. 資料處理:資料的規整,按照某種格式進行整合儲存。
資料分析的工具:
sas:sas公司的統計分析軟體,強大的資料庫整合平台,做離線的分析或者模型用,**昂貴,服務於銀行或者大企業
spss:ibm公司產品,用於統計學分析運算、資料探勘,**分析和決策支援任務的
r/matlab:適合做學術性質的資料分析,實際應用上需要額外轉換為python和scala來實現
scala:函式式程式語言,入門門檻高,開發效率高,配合spark適合大規模資料分析和處理,scala執行環境jvm
python:資料工程領域和機器學習領域有很多成熟的架構和演算法庫,完全可以只用python可以構建以資料為中心的應用程式,在資料工程領域和機器學習領域,python非常流行
開發環境:
numpy:矩陣的運算,python 科學計算的基礎包
pandas:強大的分析結構化資料的工具集,定義各種操作處理方法,更高階的封裝,比numpy豐富
scipy:基於numpy提供做科學計算的工具集,也有矩陣的運算
matplotlib:python中強大的畫圖模組,2d繪圖
jupyter notebook: ipython可以說是乙個加強版的互動式 shell, jupyter notebook是ipython的公升級版,乙個web應用程式,介面更友好,功能也更強大。 可建立和共享**,資料清洗和轉換,數值模擬,統計建模,機器學習等等。(正則)
安裝:pip install numpy -i
pip install pandas -i
pip install scipy -i
pip install matplotlib -i
資料儲存之csv:csv(comma-separated values,逗號分隔值)是儲存**資料的常用檔案格式。
每一行都用乙個換行符分隔,列與列之間用逗號分隔(因此也叫逗號分隔符)。
numpy:
提供了乙個在python中做科學計算的基礎庫,重在數值計算,主要用於多維陣列(矩陣)處理的庫。
ndarray,多維陣列(矩陣),具有向量運算能力,快速、節省空間
import numpy as np
python科學計算 numpy
畢設的程式設計中使用了python來處理資料,主要使用的是numpy包,網上大部分對numpy進行介紹的教程比較老舊,想要使用的功能不太容易找到。因此,寫這篇文章來對現有的一些資源就行整理,當然想要更全面的了解numpy的使用還是從訪問官方手冊開始。win下 pip isntall numpy當然最...
python科學計算之numpy
1.np.logspace start,stop,num 函式表示的意思是 在 start,stop 間生成等比數列num個 eg import numpy as npprint np.logspace 1,4,4 結果為 10.100.1000.10000.2.np.fromstring admi...
科學計算庫Numpy 陣列(ndarray)
學過其他強型別語言的朋友都知道陣列是一種資料型別,它裡面的元素必須是同一種型別,類似python的列表,但是這種列表只能是同種元素。用法numpy.array list tuple import numpy as np 重新命名numpy為np arr np.array 1,2,3,4,5,6 建立...