anaconda是使用python進行資料分析、機器學習的最容易方式,裡面包含大量的資料科學包,參見 :是python的分發版本庫,包含python開發環境以及1000多個python庫和軟體包,比如包含一些重要的科學計算工具包等。
1、ide環境
anaconda包含python 的ide環境,比如 ipython, jupter qtconsole, jupter notebook, spyder等
2、資料統計分析工具包,有numpy, scipy, numba,pandas,dask, pytbales等
3、機器學習工具,比如: tensorflow, h2o.ai 等
4、 anaconda包含乙個conda包,使用conda可以安裝不同版本的python以及其他工具包。
使用conda按轉不同版本的python環境
安裝python2.7, 命令如下: conda create -n python2.7 python=2.7
安裝python3.5, 命令如下: conda create -n python3.5 python=3.5
切換到python3.5,命令如下: activate python3.5
取消python3.5,命令如下: deactivate python3.5
檢視本地已經安裝的python環境,使用命令:conda info --envs
查詢包: conda list , conda search
更新包: conda update
刪除包:conda remove
5、使用conda安裝python工具包的最大好處是能夠確保所安裝的工具包與python的環境版本一致,如果使用pip安裝工具包,可能會與python環境不一致,導致所安裝的工具包不能正常使用。
是目前比較流行的python ide環境,方便與其他人分享原始碼及協作程式設計。
安裝完anaconda之後會自動安裝jupyter notebook.
jupyter notebook 參見**:www.jupyter.org
啟動命令:jupyter notebook
IBM 資料科學平台三大特性解決資料科學家協作問題
雖然資料科學是乙個比較火爆的話題,也受到越來越多重視,但是企業內部資料科學現狀卻是 不同資料分析人員使用著包括python r spark在內的多種開源產品,並且版本不一 不同開源技術的使用導致資料資產分散存在,形如散沙 最嚴重的是,當企業內部多位資料分析人員需要協同工作的時候,缺少乙個整合多語言 ...
IBM 資料科學平台三大特性解決資料科學家協作問題
雖然資料科學是乙個比較火爆的話題,也受到越來越多重視,但是企業內部資料科學現狀卻是 不同資料分析人員使用著包括python r spark在內的多種開源產品,並且版本不一 不同開源技術的使用導致資料資產分散存在,形如散沙 最嚴重的是,當企業內部多位資料分析人員需要協同工作的時候,缺少乙個整合多語言 ...
python資料科學 Pandas
學習筆記 pandas物件 資料的取值與選擇 pandas數值運算方法 缺失值的處理 層級索引 合併與連線資料集 累積與分組 pandas物件 pandas有三個基本資料結構 series dataframe和index 資料的取值與選擇 pandas數值運算方法 pandas是建立在numpy基礎...