解決方法:python的版本問題!換成python3就自動解決了!當然也有其他的方法,這裡就不再深究
需求情況:有的時候,資料很多,但是只要僅僅對部分列的資料進行分析的話,要怎麼做?
解決方法:
df = pandas.read_excel('1.xls',sheetname= '店鋪分析**')
一行讀取資料,第二行訪問指定列
需求情況:有乙個**,裡面的列是單價,數量,想再輸出乙個總價的列,或是對一些資料進行總結
解決方法:直接上**
from pandas import read_csv;
import pandas;
df = read_csv("1.csv", sep="|");
#把計算結果新增為乙個新的列
df['result'] = df.price*df.num #新的列名,後面是對應的數值
print (df)
需求情況:比較蛋疼的乙個情況,電商很多資料都是百分比的,帶有百分號,不能進行直接的計算,需要對其進行轉換,然後再輸出
解決方法:
from pandas import read_csv;
import pandas;
df = read_csv("1.csv", sep="|");
f = df['跳失率'].str.strip("%").astype(float)/100;
f.round(decimals=2) #保留小數點後面2位
df['跳失率'] = f_str #重新賦值
需求情況:有的時候需要寫乙個通用指令碼,比如隨機抽樣分析,程式自動獲取行和列的話,寫出來的指令碼通用性明顯會很強
解決方法:
df.columns.size #獲取列數
df.iloc[:, 0].size #獲取行數
需求情況:這個就不用說了,到處都要用到
解決方法:
df['跳失率'].size #對資料進行排序
newdf = df.sort(['**量', '帶來的訪客數'], ascending=[true, false]); #多重排序
需求情況:同樣,十幾列的資料,如果你想獲取指定的輸出資料,可以用方法2,但是如果想要獲取的資料列比較多,只有1-2行不想要,這樣就可以用指定刪除列的方法了
解決方法:
df.columns.delete(1)
一行**搞定!
總結:整體來說的,python的語法在做資料分析還是相當簡單的,很多的需求基本上就是一行**搞定!
python 資料分析幾個重要點
lambda 函式 有些函式只要用幾次就需要定義乙個新函式,你是否對此感到厭煩呢?lambda函式可以解決這個問 lambda函式通常被用來構建應用次數比較少的匿名函式,也就是構建乙個不帶名字的函式。lambda函式基本語法如下 lambda argument expression普通函式能做的,l...
python資料分析的幾個基本庫
資料科學領域五個最佳python庫 numpy scipy pandas matplotlib scikit learn numpy n維陣列 矩陣 快速高效,向量數 算 高效的index,不需要迴圈 開源免費跨平台,執行效率足以和c matlab媲美 scipy 依賴於numpy 專為科學和工程設...
Python資料分析之pandas比較操作
比較運算子用於判斷是否相等和比較大小,python中的比較運算子有 六個,pandas中也一樣。在pandas中,dataframe和series還支援6個比較方法,詳見下表。方法英文全稱 用途程式設計客棧 eqequal to 等於ne not equa to 不等於lt less than 小於...