python有許多吸引力,如效率,**可讀性和速度,使其成為資料科學愛好者的首選程式語言。python通常是希望公升級其應用程式功能的資料科學家和機器學習專家的首選。
由於其廣泛的用途,python擁有大量的庫,使資料科學家可以更輕鬆地完成複雜的任務,而無需很多編寫**的麻煩。以下是資料科學的前3個python庫。
使用這些庫將python轉化為乙個科學的資料分析和建模工具。
1.numpy
numpy(numerical python的縮寫)是配備有用資源的頂級庫之一,可幫助資料科學家將pytho轉變為強大的科學分析和建模工具。流行的開源庫可以在bsd許可下使用。它是用於在科學計算中執行任務的基礎python庫。numpy是乙個更大的基於python的開源工具生態系統的一部分,稱為scipy。
他的庫為python提供了大量的資料結構,可以毫不費力地執行多維陣列和矩陣計算。除了用於求解線性代數方程和其他數學計算外,numpy還可用作不同型別通用資料的通用多維容器。
此外,它與其他程式語言(如c / c ++和fortran)完美整合。numpy庫的多功能性使其能夠輕鬆快速地與各種資料庫和工具結合使用。
2.pandas
pandas是另乙個很棒的庫,可以增強你的資料科學python技能。與numpy一樣,它屬於scipy開源軟體系列,可在bsd免費軟體許可下使用。
pandas提供多功能和強大的工具,用於整理資料結構和執行大量資料分析。該庫適用於不完整,非結構化和無序的實際資料,並附帶用於整形,聚合,分析和視覺化資料集的工具。
此庫中有三種型別的資料結構:
例如,讓我們看看panda python庫(縮寫為pd)可用於執行一些描述性統計計算。
讓我們從導入庫開始。
import pandas pd
讓我們建立乙個系列詞典。
d 'name':pd.series'alfrick''michael''wendy''paul''dusan''george''andreas'
'irene''sagar''simon''james''rose'
'years of experience':pd.series
'programming language':pd.series'python''j**ascript''php''c++''j**awww.cppcns.com''scala''react''ruby''angular''php''python''j**ascript'
讓我們建立乙個dataframe。
df pd.dataframed
下面是乙個很好的輸出表:
name programming language years of experience
alfrick python
michael j**ascript
wendy php
paul c++
dusan j**a
george scala
andreas react
irene ruby
sagar angular
simon php
james python
rose j**ascript
下面是這個示例的全部**:
import pandas pd
#creating a dictionary of series
d 'name':pd.series'alfrick''michael''wendy''paul''dusan''george''andreas'
'irene''sagar''simon''james''rose'
'years of experience':pd.series
'programming language':pd.series'python''j**ascript''php''c++''j**a''scala''react''ruby''angular''php''python''j**ascript'
#create a dataframe
df pd.dataframed
printdf
3.matplotlib
matplotlib也是scipy核心軟體包的一部分,並在bsd許可下提供。它是乙個流行的python科學庫,用於生成簡單而強大的視覺化。你可以使用python框架進行資料科學生成創意圖形,圖表,直方圖程式設計客棧以及其他形狀和圖形,而無需擔心編寫多行**。
例如,讓我們看看如何使用matplotlib庫建立乙個簡單的條形圖。
讓我們從導入庫開始。
matplotlib import pyplot plt
讓我們為x軸和y軸生成值。
讓我們呼叫繪製條形圖的函式。
plt.xy
讓我們展示一下情節。
plt.
這是條形圖:
下面是這個示例的全部**:
#importing matplotlib python library
matplotlib import pyplot plt
#same as import matplotlib.pyplot as plt
#generating values for x-axis
x #generating vaues for y-axis
y #calling function for plotting the bar chart
plt.xy
#showing the plot
plt.
python程式語言在資料處理和準備方面做得很好,但對於複雜的科學資料分析和建模卻不那麼重要。用於資料科學的頂級python框架有助於填補這一空白,允許你執行複雜的數學計算並建立能夠理解資料的複雜模型。
總結
Python用於資料科學三大頂級模組
numpy numpy numerical python的縮寫 是配備有用資源的頂級庫之一,可幫助資料科學家將python轉變為強大的科學分析和建模工具。流行的開源庫可以在bsd許可下使用。它是用於在科學計算中執行任務的基礎python庫。numpy是乙個更大的基於python的開源工具生態系統的一...
推薦3個所謂的「頂級」CSS技巧!
一 在一行內宣告css www.52css.com h2 h2 第二種看起來的確格式化,但是不會在閱讀上有任何幫助。寫在一行內可以讓你更快的找到需要的部分。以前我也是寫成類似第二種方式,但是逐漸發現就像文章說的一樣,沒多大用。一行看起來又爽快又省地方還能讓檔案更小。二 分塊書寫 這樣書寫 可以讓cs...
python用於資料科學中的實用函式(一)
1.datapanda pandas.read csv path,sep engine python datasets datapanda.values 返回資料型別為二維陣列 datas pandas.dataframe datasets datas.to csv csvpath,mode a h...