背景
如何
基於以下業務邏輯,本文將利用excel集中練習「2,3,4」三個方面,初步掌握excel基本操作和初步理解基於業務場景的資料分析步驟.
資料集
1、熟悉資料集
1)在**和天貓平台上購買嬰兒用品的使用者資料集,資料集包含兩個excel檔案
表1購買商品(sample)sam_tianchi_mum_baby_trade_history.csv)表2嬰兒資訊((sample)sam_tianchi_mum_baby.csv)
表一資料部分截圖
表二資料部分截圖
2)表一裡的字段資訊:
user_id:使用者id
auction_id:購買行為編號
cat_id:商品種類id
cat1:商品屬於哪個類別 (cat id和cat 1就好比是商品的一級分類,二級分類,比如衣服和上衣,玩具和汽車這樣的關係。雖然都是數字串,但是根據這層關係,就可以用資料透視表來展示邏輯關係。比如商品大類下面,哪個分類更暢銷。)
property:商品屬性 (屬性值可以是大小,可以是尺碼、毫公升等數字,還可以指品牌等,一切可以描述商品特徵的都可以稱為屬性值)
buy_mount:購買數量 (是個時間戳格式,可以通過excel將時間戳顯示未日期格式)
day:購買時間
3)表二里的字段資訊
user_id:使用者id
birthday:出生日期
gender:性別(0男性;1 女性)
2、excel操作
清洗前
清洗後
其中操作包括:列名重新命名、日期資料修改、隱藏加密列不做分析(auction-id、property)、查詢替換、datedif 和vlookup 函式用於查詢和計算年齡其中年齡列,「0」表示不滿一歲,「#num!"表示嬰兒還未出生時購買的商品3、以解決問題的為導向的資料處理
1⃣️該如何確定店鋪所要售賣的商品的基本類別,以保證店鋪日常活躍度,提高店鋪排名?1)一年當中每個月的商品銷量最高是哪些2)所有商品種類複購率最高是哪些
圖一資料透視表
圖二資料透視表
由圖一圖二可知,商品類別「28」在整個資料起止時間內、商品類別當中銷量一直都是第一,說明,在所有商品種類中,二級分類「28」是店鋪要售賣的主打款. 像這種商品,作為資料支撐,也有底氣調低**,繼續衝擊新的銷量.
圖三資料透視表
另外,由可直觀的看到,12-14年第四季度的總體銷量都會加劇上公升,「雙十一」購物節日的活動對商品銷量的影響力巨大.
2⃣️所購商品使用者的年齡段分布情況是什麼樣的,男女性別體現在銷量上有無差異
通過函式=countifs(m:m,"<=12"),計算一下」m「列各年齡出現的次數
圖表更直觀
資料透視表
通過此表可以初步看出,嬰兒產品需求量較高的年齡階段是一歲和二到三歲之間,且男孩主.
MongoDB基於時間戳的導數操作
上班有個需求,協助提取某資料系統中cashloandb 涉及mongodb集合 cardbill 時間段 6.1 8.28 cardreport 時間段 2.1 8.28 如果不支援根據時間提取,可提取全量資料。使用mongo客戶端命令進入資料庫 jsfkrs0 primary show dbs 2...
Excel中如何將時間戳轉為時間?
excel 預設不支援 unix 格式時間戳,這在匯入資料時十分不便。可以用以下公式將時間戳轉換成 其中x為時間戳的單元格,8 3600中的8 為中國的時區。然後將公式單元格設定為日期時間格式即可。轉換結果如下圖 這個公式的原理 excel 的日期實際上是序列值,它以 1900 1 1為1 每過一天...
mac下日期 時間戳互轉
bin bash author wangjia yql qq.com time 2018 8 8 11 25 desc 當前時間戳 日期顯示 時間戳轉日期 時間戳轉日期 顯示當前系統時區日期和時間戳 curr.sh 系統時區日期轉時間戳 curr.sh 2018 08 08 12 37 07 時間戳...