yelp資料集 針對個別大眾點評商家的資料分析

2021-10-12 04:29:27 字數 1371 閱讀 2183

一、背景和目的

二、理解資料

大眾點評資料分析-資料集-阿里雲天池​tianchi.aliyun.com

三、分析思路

該資料集相對簡單,只有使用者和店鋪兩個角度來看。

店鋪角度上,通過店鋪的星級和各類指標的評分來幫助店鋪提公升自己的星級。

四、處理資料

通過sql的select 語句,並未發現有null和重複資料。 但是原始資料中,服務、口味和環境等分數還需要再進一步優化。所以在tableau 中,我們可以採用case when 語句來修改這3個指標的分數。

五、分析過程

1.店鋪角度

另外,其他是那個指標,比如口味、環境和服務是否與整體星級有關? 我們通過correltion 相關性檢驗來觀察。

從各平均值的折線圖和相關性可以看出, 這些消費者給出的星級評分與店鋪的口味的關係最為直接,而且服務是跟環境有著最強的相關性。所以由此可以得出,店鋪如果想要得到更好的總評, 排名變得更靠前的話,需要提公升並保持自己的菜色吸引客戶。同時,用餐環境也給客戶更好的體驗。好的環境是與服務劃等號的,但是總體評分還是看東西好不好吃。

2. 使用者角度

那麼突然躥紅的糖水小鋪有哪些呢,發現點的最多的還就是糖水類的,紅豆和雙皮奶。

六、最後結論

大眾點評資料平台架構變遷

出處 最近和其他公司的同學對資料平台的發展題做了一些溝通,發現各自遇到的問題都類似,架構的變遷也有一定的相似性。以下從資料 架構 應用的角度對2012.07 2014.12期間大眾點評資料平台的架構變遷做乙個概括性的總結,希望對還處在資料平台發展初期的同學有一些幫助,歡迎線下溝通。資料 1.以支援使...

大眾點評資料平台架構變遷

最近和其他公司的同學對資料平台的發展題做了一些溝通,發現各自遇到的問題都類似,架構的變遷也有一定的相似性。以下從資料 架構 應用的角度對2012.07 2014.12期間大眾點評資料平台的架構變遷做乙個概括性的總結,希望對還處在資料平台發展初期的同學有一些幫助,歡迎線下溝通。資料 1.以支援使用者報...

爬取 大眾點評的 美食資料 二

爬取大眾點評資料,使用多執行緒處理。使用多執行緒爬取的目的是兩個,乙個是 多執行緒執行起來快。第二則是 乙個人訪問的url通過多執行緒的緣故變得雜亂無章,這樣不容易被發爬機制 確定。from concurrent.futures import threadpoolexecutor 通過引入 thre...