一、背景和目的
二、理解資料
大眾點評資料分析-資料集-阿里雲天池tianchi.aliyun.com
三、分析思路
該資料集相對簡單,只有使用者和店鋪兩個角度來看。
店鋪角度上,通過店鋪的星級和各類指標的評分來幫助店鋪提公升自己的星級。
四、處理資料
通過sql的select 語句,並未發現有null和重複資料。 但是原始資料中,服務、口味和環境等分數還需要再進一步優化。所以在tableau 中,我們可以採用case when 語句來修改這3個指標的分數。
五、分析過程
1.店鋪角度
另外,其他是那個指標,比如口味、環境和服務是否與整體星級有關? 我們通過correltion 相關性檢驗來觀察。
從各平均值的折線圖和相關性可以看出, 這些消費者給出的星級評分與店鋪的口味的關係最為直接,而且服務是跟環境有著最強的相關性。所以由此可以得出,店鋪如果想要得到更好的總評, 排名變得更靠前的話,需要提公升並保持自己的菜色吸引客戶。同時,用餐環境也給客戶更好的體驗。好的環境是與服務劃等號的,但是總體評分還是看東西好不好吃。
2. 使用者角度
那麼突然躥紅的糖水小鋪有哪些呢,發現點的最多的還就是糖水類的,紅豆和雙皮奶。
六、最後結論
大眾點評資料平台架構變遷
出處 最近和其他公司的同學對資料平台的發展題做了一些溝通,發現各自遇到的問題都類似,架構的變遷也有一定的相似性。以下從資料 架構 應用的角度對2012.07 2014.12期間大眾點評資料平台的架構變遷做乙個概括性的總結,希望對還處在資料平台發展初期的同學有一些幫助,歡迎線下溝通。資料 1.以支援使...
大眾點評資料平台架構變遷
最近和其他公司的同學對資料平台的發展題做了一些溝通,發現各自遇到的問題都類似,架構的變遷也有一定的相似性。以下從資料 架構 應用的角度對2012.07 2014.12期間大眾點評資料平台的架構變遷做乙個概括性的總結,希望對還處在資料平台發展初期的同學有一些幫助,歡迎線下溝通。資料 1.以支援使用者報...
爬取 大眾點評的 美食資料 二
爬取大眾點評資料,使用多執行緒處理。使用多執行緒爬取的目的是兩個,乙個是 多執行緒執行起來快。第二則是 乙個人訪問的url通過多執行緒的緣故變得雜亂無章,這樣不容易被發爬機制 確定。from concurrent.futures import threadpoolexecutor 通過引入 thre...