前天推送一篇乾貨 | 50題帶你入門python資料分析(上),今天帶來下篇。
結算時輸入優惠碼3pazju,折後滿150就能再減30
25顯示列唯一值
df[''].unique() ⚠️這裡顯示具體的唯一值
26顯示列唯一值個數
df[''].nunique() ⚠️這裡顯示的是唯一值個數
27
返回列最大/小值的索引
df[''].idxmax()
df[''].idxmin()
28
返回列前幾個大/小的元素值
df[''].nlargest(這裡指定幾個)
df[''].nsmallest(這裡指定幾個)
29
列的值進行截斷
df[''].clip(min,max)
#這裡將小於min的值變成min,max同理
30列的值進行替換
df[''].replace("舊的","新的")
df.replace('列':""舊的","新的")
31
利用索引進行排序
df.set_index('列')
32
pandas畫折線圖
df.plot(x='', y='')
plt.show()
33
pandas畫條形圖
df.plot(x='', y='',kind='bar')
plt.show()
34
pandas畫水平條形圖
df.plot(x='', y=['',''],kind='barh')
plt.show()
35
pandas畫散點圖
df.plot(x='', y='',kind='scatter')
plt.show()
36
pandas畫餅圖
df.index= #重新定義顯示的索引
df.plot(x='', y='',kind='pie',legend=false) #設定不顯示圖例
plt.show()
37
pandas畫箱型圖
df.plot(y='',kind='box') #箱型圖非常有利於看資料分布
plt.show()
38
pandas畫直方圖
df.plot(y='',kind='hist')
plt.show()
39
pandas畫多個圖在同一張畫布
df.plot(kind='',
y=['',''],
subplots=true, #多子圖並存
layout = (1,2), #子圖排列一行二列
title='',
figsize(10,5))
plt.show()
40
業務指標:計算月均消費次數
這裡我們以朝陽醫院銷售資料集為例:
月均消費次數=總消費次數 / 月份數
總消費次數:同一天內,同乙個人發生的所有消費算作一次消費。這裡我們根據列名(銷售時間,社群卡號)結合,如果這兩個列值同時相同,只保留1條,將重複的資料刪除
月份數:資料已經按照銷售時間進行排序,只需將最後的資料與第一條資料相減就可換算出月份數
#總消費次數計算
kpdf = salesdf.drop_duplicates(subset=['銷售時間','社保卡號'])
total = kpdf.shape[0]
print('總消費次數為:',total)
#月份數計算
startday = salesdf.loc[0,'銷售時間']
print('開始日期:',startday)
endday = salesdf.loc[salesdf.shape[0]-1,'銷售時間']
print('結束日期:',endday)
monthcount = (endday - startday).days//30
print('月份數:',monthcount)
#業務指標:月均消費次數=總消費次數 / 月份數
kpi1 = total / monthcount
print('業務指標1:月均消費次數=',kpi1)
41
業務指標:計算月均消費金額
月均消費金額 = 總消費金額 / 月份數
totalmoney = salesdf['實收金額'].sum()
kpi2 = totalmoney / monthcount
print('業務指標2:月平均消費金額=',kpi2)
42
業務指標:計算客單價
客單價=總消費金額 / 總消費次數
kpi3 = kpi2 / kpi1
print('業務指標3:客單價=',kpi3)
下面介紹有趣且實用的分析模型
43rfm模型
首先介紹一下什麼是rfm模型:rfm模型是以使用者的實際購買行為資料,將使用者群體進行分類,其中
r(recency):表示客戶最近一次購買的時間距離現在有多遠
f(frequency):表示用使用者在定義時間段內購買產品或服務的次數
m(monetary):表示使用者在定義時間段內購買產品或服務的金額 然後再更具r、f、m指標進行客戶的細緻分類:包括重要價值客戶、重要發展客戶、重要保持客戶、重要挽留客戶、一般價值客戶、一般發展客戶、一般保持客戶、一般挽留客戶等八類使用者。
再根據模型提出以下問題:1、誰是你最好的客戶 2、有哪些客戶在流逝的邊緣 3、有哪些客戶能轉化能為公司創造更多的價值 4、你必須保留哪些客戶 5、誰是你的忠實客戶 6、哪些客戶有最大的轉化率和可能性
可以檢視我的這篇文章: 44
aarrr模型
aarrr是acquisition、activation、retention、revenue、refer,這個五個單詞的縮寫,分別對應使用者生命週期中的5個重要環節。
45swot分析
swot(企業戰略分析方法)指swot分析法。swot分析,即基於內外部競爭環境和競爭條件下的態勢分析,就是將與研究物件密切相關的各種主要內部優勢、劣勢百和外部的機會和威脅等。
可以檢視我的這篇文章:
46star法則
star法則,即為situation target action result的縮寫,具體含義是:
situation: 事情是在什麼情況下發生
target 你是如何明確你的目標的
action: 針對這樣的情況分析,你採用了什麼行動方式
result: 結果怎樣,在這樣的情況下你學習到了什麼
簡而言之,star法則,就是一種講述自己故事的方式,或者說,是乙個清晰、條理的作文模板。不管是什麼,合理熟練運用此法則,可以輕鬆的對面試官描述事物的邏輯方式,表現出自己分析闡述問題的清晰性、條理性和邏輯性。
47hmw分析法
hmw是什麼?
how might we = 我們可以如何 = 有什麼辦法
找方向:hmw = 解決這個問題的方向,開啟思考的困局
拓展思路:把乙個小問題大幅拓展,把問題想透
頭腦風暴:暫時不需要考慮具體的方案,讓頭腦風暴更高效
創新點:讓每個吐槽都可能被變成創新點
hmw什麼時候用?
頭腦風暴前:解決頭腦風暴效率的問題
分析使用者反饋:在碰到使用者反饋,馬上用hmw分析
和領導pk:用hmw對付領導是乙個好辦法
六頂思考帽
推薦閱讀:我聽過關於「六頂思考帽」最通俗易懂的解釋
49緊急重要四象限
這對於我們平時資料分析或者安排工作是都很有幫助:
50複利思維模型
從下面兩組公式你看出了什麼?
不管做什麼工作,什麼身份,只要你每天堅持比別人多做一點點,人生的積累將會大不同。而如果你每天都懈怠一點點,你有的也幾乎會全部被剝奪。奧利給????
python入門乾貨 python基礎乾貨 01
1.編碼集 ascii 是最早的編碼 ascii值控制字元ascii值控制字元ascii值控制字元ascii值控制字元 nut space soha astxbb etxc ceotdd enqe eackff belggbs hhhti ilfjj vtkkff llcrm msonn siood...
python高階,終端入門乾貨(二)
1.1 重定向命令 重定向也稱為輸出重定向,把在終端執行命令的結果儲存到目標檔案。如果檔案存在會覆蓋原有檔案內容,相當於檔案操作中的 w 模式 如果檔案存在會追加寫入檔案末尾,相當於檔案操作中的 a 模式 終端內容儲存到檔案使用重定向有兩種方式 和 表示每次只寫入最新的資料,原有資料不保留。表示每次...
Python入門乾貨經驗 免費提供資料
建議一 跟著老師學,避免自己在琢磨的過程中,浪費太多時間,走太多彎路。但是我不建議花很多錢去報班,中國大學慕課裡有很多免費的課程 包括985高校在內提供的千餘門課程 可以搜尋 python 關鍵字找到很多相關的免費學習資料,如果是學生的話就更沒有必要浪費錢,錢多當我沒說 我初學 python 時在慕...