(從本人的ppt搬運來的,排版不好看請諒解)
人群組成複雜程度,是精準營銷體系中最重要的指標之一,其可以進一步反映人群的年齡組成、消費水平、文化程度等;對地鐵站點進行人群複雜程度分析,可以輔助地鐵廣告投放,公共設施建設,安全監管等業務進行決策;
廣告投放
快餐廣告選擇「上班族」多的站點進行投放
公共設施建設
杭州市民中心站「地鐵書房」書籍根據人群組成上架不同型別書籍
安全監管力度分配
針對人群組成複雜的區域適當加大監管力度
資料顯示,在節假日大多數站點流量上公升的情況下,師大南路站流量卻基本穩定,珠江路流量反而下降;根據站點附近區域特性可知,由於珠江路附近辦公樓居多,節假日通勤大幅減少,導致流量降低;師大南路站附近包含商圈、學校、住宅區,人群組成較複雜,故因節假日通勤減少的影響不大。
故可以從節假日的前一天與節假日第一天的流量差距反映該站點人群複雜程度,差距越大人群組成越單一,差距越小人群組成越複雜。
考慮到資料的波動與各站點流量基數不同,確定複雜度指標k計算方式如下圖
資料集給出了2019.9至2020.9的一號線各站點日流量;因廣告投放無需考慮不可預知因素,故為保證資料的可參考性,去除疫情期間的資料
分析結果顯示,廬山南大道站八一廣場站等大多數人群組成最複雜,珠江路最單一;
且站點的人群複雜度與流量無明顯關係
在廣告投放上的應用
完整**如下:
import pandas as pd
import os
import numpy as np
import requests
import json
import re
import matplotlib.pyplot as plt
import matplotlib as mpl
mpl.rcparams[
'font.sans-serif']=
['kaiti'
]mpl.rcparams[
'font.serif']=
['kaiti'
]%matplotlib inline
font2 =
filename = r'd:\chormedownloads\地鐵1號線運營情況1.xlsx'
#該資料已加『是否為工作日』字段
df = pd.read_excel(filename)
df.head(
)#df = df.drop(range(91,243))#去除2019.11至2020.5的受疫情影響資料
#人群複雜度與流量比例計算
result_df = pd.dataframe(
)for station in
list
(df.columns.values)[2
:]: datalist =
for i in
range(1
,len
(df)):
if(not df.iloc[i]
['是否工作日'])
and(df.iloc[i-1]
['是否工作日'])
: hb =
abs(
(df.iloc[i]
[station]
-df.iloc[i-1]
[station]
)/df.iloc[i-1]
[station]
)#(節假日第一天流量-前一天流量)/前一天流量
[station,
1/np.mean(datalist)
, df[station]
.sum()
*(10**-6
)]),ignore_index=
true
)#result_df = result_df.sort_values([1], ascending=false)
#0,1,2列分別為站點名,人群複雜度,流量比例
result_df
複雜度分析 時間複雜度分析和空間複雜度分析
其實,只要講到資料結構與演算法,就一定離不開時間 空間複雜度分析。而且我個人認為,複雜度分析是整個演算法學習的精髓,只要掌握了它,資料結構和演算法的內容基本上就掌握了一半。1.時間複雜度分析 對於剛才羅列的複雜度量級,我們可以粗略地分為兩類,多項式量級和非多項式量級。其中,非多項式量級只有兩個 o ...
複雜度分析 時間複雜度 空間複雜度
執行效率是演算法的乙個重要的考量指標,演算法的執行效率用時間 空間複雜度來衡量。今天我們來學習一下複雜度的分析。通常我們可以通過執行程式來獲得演算法的真正的執行時間,這種方法我們可以稱為事後統計法,但這種方法得到的是具體的資料,測試結果很依賴測試環境,而且受資料規模影像最大。因此,我們需要乙個不需要...
複雜度分析(上)時間複雜度 空間複雜度
為了肉眼 實時 快速地來分析出 的複雜度,我們需要乙個不用具體的測試資料來測試,就可以粗略地估計演算法的執行效率的方法。時間複雜度 空間複雜度 表示演算法的執行時間與資料規模之間的增長關係。每行 對應的 cpu 執行的個數 執行的時間都不一樣,但是,我們這裡只是粗略估計,所以可以假設每行 執行的時間...