電商交易資料分析

2022-08-20 12:48:12 字數 2229 閱讀 9004

1.分析目的:根據過往電商成交資料進行資料分析發現規律和問題從而指導業務

2.資料

導入庫匯入資料

載入好資料之後,第一步先分別使用describe和info方法看下資料的大概分布

載入device_type

3.資料清洗

orderid

orderid在乙個系統裡是唯一值

先看下有沒有重複值

如果有重複值一般最後處理,因為其他的列可能會影響到刪除哪一條重複的記錄

先處理其他的列

userid

userid只要從上面的describe和info看下值是不是在正常範圍就行

對於訂單資料,乙個使用者有可能有多個訂單,重複值是合理的

productid

productid最小值是0,先來看下值為0的記錄數量

177條記錄,數量不多,可能是因為商品的上架下架引起的,處理完其他值的時候把這些記錄刪掉

cityid

cityid類似於userid,值都在正常範圍,不需要處理

price沒有空值,且都大於0,注意單位是分,把它變成元

paymoney

paymoney有負值,下單不可能是負值,所以這裡對於負值的記錄要刪掉

刪除負值的記錄

單位變成元

channelid

channelid根據info的結果,有些null 的資料,可能是短的bug等原因,在下單的時候沒有傳channelid欄位

資料量大的時候,刪掉少量的null記錄不會影響統計結果,這裡直接刪除

devicetype的取值可以看device_type.txt檔案,沒有問題,不需要處理

createtime和paytime都沒有null,不過要統計2023年的資料,所以要把非2023年的刪掉

回過頭來把orderid重複的記錄刪掉

把productid為0的也刪除掉

資料清洗完畢,開始分析

4.資料處理和分析

先看下資料的總體情況

總訂單數,總下單使用者,總銷售額,有流水的商品數

分析資料可以從兩方面開始考慮,乙個是維度,乙個是指標,維度可以看做x軸,指標可以看做y軸,用乙個維度可以分析多個指標,同乙個維度也可以

做降維公升維

按照商品的productid

先看下商品銷量的前十和後十個

銷售額看下銷量和銷售額最後100個的交集,如果銷量和銷售額都不行,這些商品需要看看是不是要優化或者下架

price

對於**,可以看下所有商品**的分布,這樣可以知道什麼**的商品賣的最好

很多**區間沒有商品,如果有競爭對手的資料,可以看看是否需要補商品填充

對應的**

下單時間分析

按小時的下單量分布,可以按時間做推廣

中午12,13,14點的下單比較多,應該是午休的時候,然後是晚上20點左右

按照星期來看,週六下單最多,其次是周五週日

下單後多久支付

絕大部分都在十幾分鐘之內支付完成,說明使用者基本很少猶豫,購買的目的性很強

月成交額

電商大資料分析

運用不同行業中,專門從事行業資料蒐集 整理 分析,並依據資料做出行業研究 評估和 的專業人員。熟悉行業知識 公司業務及流程,最好有自己獨到的見解,若脫離行業認知和公司業務背景,分析結果就沒有太大的使用價值。一方面是搭建資料分析框架的要求,比如確定分析思路就需要用到營銷 管理等理論知識來指導 另一方面...

2 電商平台零售資料分析

data1 unitprice value counts tuihuo data data quantity 0 tuihuo tt pd.pivot table tuihuo,index year columns month values amount aggfunc np.sum data2 d...

電商活動之資料分析原型設計篇

如今,各大電商平台之間雖然不再通過大量補貼來培養使用者在自家平台的消費習慣,但是電商靠活動拉攏使用者的習慣與體系已經成熟,本文作者將基於活動的資料統計來談談產品應該如何設計。很久 很久 以前,電商競爭模式初立之期,盤古撥混沌開天地之時,江湖中曾經流傳過一句永世的經典 道可道,非常 no no no,...