**知乎熱答:
因為自己在工作中會處理許多酒店相關的資料,在看見這個資料集的時候,有種莫名的熟悉感。
資料分為彙總版和明細版兩類。可從彙總版入手熟悉後,高階使用完整版挖掘更多資訊。
calendar 資料為短租**時間表資訊,包括**、時間、是否可租、租金和可租天數等等。
neighbourhoods 資料為北京的行政區劃。
那如何用這份資料集來體現資料分析的能力呢?我主要想到了以下可以做的事情:
計算房東的質量分數,實現房東的精細化運營管理
我們可以量化房東旗下**數量,**位置,****,可租天數、**評價等資訊,為房東計算質量分數。有了這個質量分數,airbnb能夠有針對性的維護高質量房東,為他們提供佣金折扣以及各種福利待遇;也能夠懲罰低質量房東,督促房東改進**,提公升平台的整理質量。
同理,也可以通過對**資訊進行量化,挖掘最受使用者歡迎的**
比如我們可能發現,整屋出租更受客戶的歡迎;市中心西邊地段9比市中心東邊地段3的**更受客戶歡迎……通過對**的地理位置,型別,最小**天數,**等資料進行量化建模,得到**的歡迎度評分。可以指導airbnb和房東更有針對性的運營**資源。
向客戶推薦各個地區「最便宜」、「最精緻」、「最小資」、「最有價效比」……的**
我可能對酒店資料有偏好……
這份賽題提供的資料集,資料集裡包括了城市酒店和度假酒店的預定維度資料,例如預定時間,停留時間,**/兒童/嬰兒數量,早餐,停車位等等。
不僅可以做酒店預訂的**,也可以做出乙份使用者預定酒店的行為分析。
在大腦裡構想了一下,沒有比賽的壓力,沒有排名的限定,完全可以用這份資料做出乙份簡易版本《酒店出行偏好分析報告》。
在分析報告的ppt裡,可以展示使用者提前預定時長偏好、餐飲偏好、預定時間(月份)偏好、使用者出行結構、酒店型別偏好等維度的資料。
不過缺點就是資料集脫離了實際需求場景。針對以上分析出來的行為偏好,我們都需要自己做進一步的思考——資料能夠為業務帶來什麼建議,想到這一層,才能夠足夠自信的在面試過程中展示自己的工作。
其實不論是天池還是kaggle,都為我們提供了豐富的資料集。但並不是所有的資料集都適合我們拿來練手作為專案經歷的補充,絕大多數的資料集都是偏向於演算法優化的,這就導致資料集本身的資料字段不一定能夠挖掘出和很多業務思想相關的東西。
資料分析和演算法的區別之一就在於,以演算法崗為求職目標的同學在看見資料集的時候,腦子裡想到的一定是「我要怎麼做才能讓模型**的更好?」;而以數分(商分)為求職目標的同學在看見資料集的時候,應該去判斷「這些資料對我優化業務管理有什麼幫助?」
其實沒有數分相關的實習或者專案經歷並不可怕,花上1個月的時間,投入120%的精力選擇乙個資料集琢磨,體驗「資料清洗->資料探索->資料建模(資料視覺化)->輸出結論」的過程,技巧性的總結成專案文件,一定能有所收穫。甚至在面試的過程中,自己探索資料集的經歷,能夠成為你的亮點專案。
如何利用資料分析來提高專案成果
d1net觀察 大資料和相關業務正在逐漸顯現其價值,到2019年,全球大資料和業務分析的收入預計將增長到超過1870億美元,到2020年,專案管理行業預計收入將達到5.81萬億美元。下面是一些企業如何利用資料分析來提高專案績效的例項。gartner副總裁兼分析師ted friedman 以下三個趨勢...
如何對業務場景做資料分析?
企業的資料分析是個很複雜的工程,需要業務和分析技術兩塊知識。這裡從業務的角度切入,談談如何對業務分析,文章參考帆軟軟體的零售業資料管理方案。首先,企業的分析主要分為管理分析和經營業務分析,分析整體的思路是 明確業務場景 確定分析目標 構建分析體系 梳理核心指標。以電商為例,常用的業務分析場景有銷售 ...
利用python做資料分析
3.2 資料分析的目的 主要就是為了在複雜 龐大的資料庫中提取對我們有用的資訊。讓這些資料產生一定的價值,幫助人們在日常生活中做一些決策時做一些參考。比如,在 中買東西,我們會首先看到物品的銷量 排行 以及顧客對物品的評價。這些都是經過資料分析得出來的。可見,資料分析在其中扮演著多麼重要的角色。3....