1.ipython
ipython是乙個基於python shell的互動式直譯器,但是有比預設shell強大得多的編輯和互動功能。ipython 提供了如下特性:
更強的互動 shell(基於 qt 的終端)
乙個基於瀏覽器的記事本,支援**,純文字,數學公式,內建圖表和其他富**
支援互動資料視覺化和圖形介面工具
靈活,可嵌入直譯器載入到任意乙個自有工程裡
簡單易用,用於平行計算的高效能工具
當你乙個庫不會用的時候,用ipython 可以寫一些測試**。可以用ipython快速掌握庫的方法和使用。
2.graphlab greate
graphlab greate 是乙個 python 庫,由 c++ 引擎支援,可以快速構建大型高效能資料產品。
關於 graphlab greate 的特點:
可以在您的計算機上以互動的速度分析以 t 為計量單位的資料量。
在單一平台上可以分析**資料、曲線、文字、影象。
最新的機器學習演算法包括深度學習,進化樹和 factorization machines 理論。
可以用 hadoop yarn 或者 ec2 聚類在你的筆記本或者分布系統上執行同樣的**。
借助於靈活的 api 函式專注於任務或者機器學習。
在雲上用**服務便捷地配置資料產品。
為探索和產品監測建立視覺化的資料。
3.spark
spark是乙個圍繞速度、易用性和複雜分析構建的大資料處理框架,提供了乙個全面、統一的框架用於管理各種有著不同性質(文字資料、圖表資料等)的資料集和資料來源(批量資料或實時的流資料)的大資料處理的需求。
spark基於map reduce演算法實現的分布式計算,擁有hadoop mapreduce所具有的優點;但不同於mapreduce的是job中間輸出和結果可以儲存在記憶體中,從而不再需要讀寫hdfs,因此spark能更好地適用於資料探勘與機器學習等需要迭代的map reduce的演算法。
4.pandas
pandas 是基於 numpy 的乙個非常好用的庫,正如名字一樣,人見人愛。之所以如此,就在於不論是讀取、處理資料,用它都非常簡單。
pandas 有兩種自己獨有的基本資料結構。讀者應該注意的是,它固然有著兩種資料結構,因為它依然是 python 的乙個庫,所以,python 中有的資料型別在這裡依然適用,也同樣還可以使用類自己定義資料型別。只不過,pandas 裡面又定義了兩種資料型別:series 和 dataframe,它們讓資料操作更簡單了。
5.scikit-learn
scikit-learn是用python開發的機器學習庫,其中包含大量機器學習演算法、資料集,是資料探勘方便的工具。scikit-learn的基本功能主要被分為六大部分:分類,回歸,聚類,資料降維,模型選擇和資料預處理。scikit-learn需要numpy和scipy等其他包的支援,才能夠使用。
6.pulp
線性程式設計是一種優化,其中乙個物件函式被最大程度地限制了。pulp 是乙個用 python 編寫的線性程式設計模型。它能產生線性檔案,能呼叫高度優化的求解器,glpk,coin clp/cbc,cplex,和gurobi,來求解這些線性問題。
7.matplotlib
matplotlib在python中應用最多的2d影象的繪圖工具包,使用matplotlib能夠非常簡單的視覺化資料。
matplotlib 嘗試使容易事情變得更容易,使困難事情變為可能。通過 matplotlib,你只需要輸入幾行**,便可以生成繪圖,直方圖,功率譜,條形圖,錯誤圖,散點圖等
推薦7款超級好用的終端工具 SSH FTP
1 cmdercmder是乙個代替cmd的終端工具。只能操作windows。它的好處是 支援大部分linux命令,比如ls 滑鼠選中預設複製,滑鼠右擊貼上 美觀的介面,可以自定義背景 解壓,雙擊cmder.exe即可執行,其他疑問 1 新增快捷鍵 開啟cmd到安裝目錄,輸入cmder.exe reg...
NO 7 嫿骨 if小測試
部分執行截圖 另1.簡述一下if語句的語法 2.連續判斷時,if else if 和if if 的區別在 一 簡述一下if語句的語法 1 if 表示式 語句。例如 if x y printf d x 此時,如果表示式為真,則執行printf語句。2 if 表示式 語句1 else 語句2 例如 if...
7 款 Python 開源框架的優劣總結
django django 應該是最出名的python框架,gae甚至erlang都有框架受它影響。django是走大而全的方向,它最出名的是其全自動化的管理後台 只需要使用起orm,做簡單的物件定義,它就能自動生成資料庫結構 以及全功能的管理後台。優點 缺點 flask flask是乙個用pyth...