python資料科學手冊

2021-10-24 03:12:17 字數 1400 閱讀 8675

python資料科學手冊

這並不是一本介紹 python 和程式設計基礎知識的書。它假設讀者已經熟悉

python 的基本語法,包括定義函式、分配變數、呼叫物件方法、實現程

序控制流等基本能力。這本書將幫助 python 使用者學習如何通過 python

的資料科學棧——包括 ipython、numpy、pandas、matplotlib、scikit-

learn,以及其他相關的程式庫——高效地儲存、處理和分析資料。

:numpy 可以處理同型別(homogeneous)陣列

型資料、pandas 可以處理多種型別(heterogeneous)帶標籤的資料、

scipy 可以解決常見的科學計算問題、matplotlib 可以繪製可用於印刷的

視覺化圖形、ipython 可以實現互動式程式設計和快速分享**、scikit-

learn 可以進行機器學習,還有其他很多任務具將在後面的章節中介紹。

如果你需要乙個 python 入門教程,那麼我推薦你閱讀本書的姊妹篇 a

whirlwind tour of the python language。這個簡短的教程介紹了 python

的基本特性,目的是讓熟悉其他程式語言的資料科學家快速學習

python。

接下來將介紹如何通過 ipython 工具來快速獲取這些資訊。符號 ? 用於

瀏覽文件,符號 ?? 用於瀏覽源**,而 tab 鍵可以用於自動補全。

《利用 python 進行資料分析》

wes mckinney 的這本書用一章介紹了如何像資料科學家那樣使用

ipython。儘管其中的很多內容與上面介紹的內容有所重複,但多乙個視

角總不是壞事。

learning ipython for interactive computing and data

visualization(

cyrille rossant 的這本薄書對如何用 ipython 進行資料分析作了很好

的介紹。

ipython interactive computing and visualization

cookbook(

這本也是 cyrille rossant 的著作。它篇幅更長,並且深入介紹了將

ipython 用於資料科學的方法。這本書不僅僅是關於 ipython 的,還涉及

了資料科學中更深、更廣的主題。

。在某些方面,numpy 陣列與

python 內建的列表型別非常相似。但是隨著陣列在維度上變大,numpy

陣列提供了更加高效的儲存和資料操作

。在某些方面,numpy 陣列與

python 內建的列表型別非常相似。但是隨著陣列在維度上變大,numpy

陣列提供了更加高效的儲存和資料操作

page97

page136

Python資料科學手冊 Pandas 目錄

安裝時使用了 anaconda,那麼 pandas 就已經安裝好了。import pandas pandas.version import pandas as pd 通過按下 tab 鍵顯示 pandas 命名空間的所有內容 pd.顯示 pandas 的內建文件 pd?詳細文件1.序列轉列表 r.v...

Python資料科學手冊(1) IPython

本文主要是看完python資料科學手冊第一章的筆記 ipython是一種互動式的python開發環境,在資料探索階段非常有用,下面是對它的用法特性的簡單介紹。1,ipython的幫助和文件 a 用符號?獲取文件,類似於python的內建函式help help len 等價於 len?b 用?獲取源 ...

Python資料科學手冊(5) 機器學習

python資料科學手冊最後一章講的是機器學習,這是乙個很大的課題,每一種演算法都可以鑽研,遠不是一篇文章能講清楚的,這裡主要總結一下書中關於特徵工程的課題。俗話說,巧婦難為無公尺之炊。在機器學習中,資料和特徵便是 公尺 模型和演算法則是 巧婦 對於乙個機器學習問題,資料和特徵往往決定了結果的上限。...