引數設定 pandas引數設定小技巧

2021-10-16 04:20:01 字數 2127 閱讀 8878

python大資料分析記錄   分享   成長

在日常使用pandas的過程中,由於我們所分析的資料表規模、格式上的差異,使得同樣的函式或方法作用在不同資料上的效果存在差異。

pandas有著自己的一套「引數設定系統」,可以幫助我們在遇到不同的資料時靈活調節從而達到最好的效果,本文就將介紹pandas中常用的引數設定方面的知識。

圖1

pandas設定引數中的display.max_rows用於控制列印出的資料框的最大顯示行數,我們使用pd.set_option()來有針對的設定引數,如下面的例子:

圖2

在修改display.max_rows的引數值之後,我們的資料框只會顯示指定行數的資料,中間的部分都會以省略號的形式顯示,當我們的資料框行數較多,可以加大這個引數以顯示更多行資料。

類似display.max_rows,通過修改display.max_columns我們可以調節最大顯示的資料框列數(預設是20列),這在我們的資料框字段較多又想全部檢視的時候很有用:

圖3

對於一些單元格內容長度較長的資料譬如長文字,在檢視資料框時過長的部分會被簡化為省略號,而通過修改display.max_colwidth引數我們可以在必要時,使得超長的部分也顯示出來:

圖4

通過display.chop_threshold引數我們在不修改原始資料的情況下,指定資料框中絕對值小於閾值的數顯示為0:

圖5

通過display.float_format引數我們可以設定浮點數的顯示格式,譬如這裡我們給浮點數加上字首並設定保留兩位小數:

圖6

針對資料框的info()方法可以幫助我們檢視資料框的一些概覽資訊,譬如每一列對應的非缺失值個數。

但預設情況下當資料框行數大於1690784行時,再檢視info()資訊,會處於計算效率的考慮略去缺失值檢查資訊。

這時我們可以通過設定display.max_info_rows引數來提高這個上限:

圖7

控制資料框中小數的顯示精度除了上文提到的方法之外,還可以通過修改display.precision引數來控制,預設是6位小數:

圖8

有些時候我們只希望在某張表上進行設定引數的修改,不希望影響到之後的其他表的顯示。

圖9

-end -

推薦閱讀

點讚、分享、在看,一鍵三連 ↓↓↓

Matlab plot 引數設定

一 matlab繪圖中用到的直線屬性包括 1 linestyle 線形 2 linewidth 線寬 3 color 顏色 4 markertype 標記點的形狀 5 markersize 標記點的大小 6 marke cecolor 標記點內部的填充顏色 7 markeredgecolor 標記點...

JQuery draggable 引數設定

預設設定值 extend ui.draggable,限制y軸 draggable2 draggable 限制x軸 draggable4 draggable draggable5 draggable 限制在父系框架中 delay start 延時移動 draggable draggable 移動20畫...

hive 引數設定

本文 開發hive應用時,不可避免地需要設定hive的引數。設定hive的引數可以調優hql 的執行效率,或幫助定位問題。然而實踐 中經常遇到的乙個問題是,為什麼設定的引數沒有起作用?這通常是錯誤的設定方式導致的。對於一般引數,有以下三種設定方式 配置檔案 hive的配置檔案包括 使用者自定義配置會...