資料分析的常用方法,資料分析的5個黃金法則

2021-10-09 11:32:52 字數 1929 閱讀 2753

隨著大資料時代的到來,越來越多的公司開始注重大資料,資料分析是大資料中常用的,那資料分析的常用方法又有哪些呢?下面學掌門就和大家盤點一下資料分析的5個**法則。

規則1:我們相信計量

在學習能源管理專業時,遇到了各種資料問題;這裡只是其中的一些示例:

• 在一台標有「 30 hp」(45 kw)的壓縮機面前,新的維護經理認為它是30 hp的裝置。經過一番分析後,發現壓縮機的馬達早在10年前就被別的馬達所取代,沒有人願意更新該銘牌,它也不存在其他記錄。

•由乙個vfd控制器控制的三個相同的5 hp風扇會汲取三種不同的電流。原來,其中兩個風扇的內部螺旋槳葉片也會損壞。(更換掉有故障的葉片會使冷凝器風扇容量增加一倍,並減少了壓縮機的能量負荷。)

•製冷裝置壓縮機將隨機上線。(這是由於吸入壓力設定不正確引起的。)

其實我們不能依據「我們始終保持這一執行時間表」,「壓縮機、鍋爐和照明裝置會在週末關閉」或「電流永遠不超過x安培」之類的說法來進行能源使用的分析,只有通過常規自動計量收集的,並且經過驗證的準確性和一致性後,資料才能作為投資決策的可靠基礎。

在談話進行中,商業決策需要資料。

規則2:資料在分析之前沒有任何意義

對於效能監控和分析來說電能計量是非常有價值的,但是,即使是通過校準後的儀表精確測量的資料,在進行分析之前沒是有任何意義的。

每一家大型製造公司都會精心收集電,水和天然氣的消耗資料,但他們也只能每個月用「每噸」的比率來計算。實際上,他們除了收集資料以外,並不會做任何的分析。

因此,當這些噸比在乙個月之間的變化高達100%時,因為沒有人做任何事情,也沒人知道他們為什麼要收集這些資訊,也不清楚比率應該是多少,所以任何事情和結論都不會得出。。

規則3:分析是實際與預期的比較

即使以**,圖表或比率表示,計量數字的絕對值也沒有任何意義。通過比較實際和預期,我們可以知道價值來自於分析;圖形,報告和儀表板並不構成分析,它們只是以另一種方式呈現相同的原始資料。

能源資料是從正式模型或非正式經驗中獲得的,只有將計量資料與期望值進行比較時,才能從計量資料中獲得商業價值。

期望將含義注入計量資料中,讓我們來看一下有關示例:

「星期三中午的功率消耗為565 kw」這一說法沒有任何實際意義。565 kw是好還是壞?這個值在星期三中午測量的事實又是否具有更深的含義?

但是,當我們在第一條語句中新增「當該工廠的峰值需求為1000 kw」時,可以得出該工廠的機械未滿負荷執行的結論。如果我們換種說法,不是「星期三」,而是說「 7月1日」,那麼我們可以得出這是24/7/365的演算法。

另一方面,通過新增「機器的**機容量為450 kw」,我們可以合理地得出電表有故障的結論。如您所見,在計量資料與期望值進行比較之前,計量資料本身除了分析是沒有任何意義的。根據對業務進行衡量的重要性,對價值的期望可能來自複雜的工程計算,基於資料的回歸模型,或者僅來自快速估算。

規則4:注意持續偏離預期

沒有模型是完美的,也沒有資料是完美的。因此,測量值和預期值之間出現的隨機偏差是正常的;但是,微小但持續的偏差會構成一種趨勢,這預示著操作條件的變化,確定小變化是否構成趨勢的最佳方法是使用cusum方法來計算實際值和期望值之間的累計差和。同樣,不要流失小偏差,而要注意持續的趨勢。由於其累積性質,cusum會隨機波動,但會累積持續波動。如果沒有因為隨著時間的推移而持續的話,那麼微小的偏差也不是什麼嚴重的後果。

規則5:根據常識檢查數學

數學模型和計算是棘手的。數學與常識、輸入錯誤或錯別字無關。其實,基於實測的節能量估算值,該估算值超過了建築物的總能耗。

在得出任何最終結論之前,請檢查在數學或工程計算時使用的演算法。能量計量是能量效能分析的基礎,但所有的辛苦都會因為資料準備或公式編碼中的拼寫錯誤而白費。

以上這些資料分析的常用方法及**法則,大家都記住了嗎?好的資料分析法可以更好幫助我們分析資料,從而更好的幫助企業領導人做出正確的業務決策。

常用資料分析方法

自 一 描述性統計 描述性統計是一類統計方法的彙總,揭示了資料分布特性。它主要包括資料的頻數分析 資料的集中趨勢分析 資料離散程度分析 資料的分布以及一些基本的統計圖形。1 缺失值填充 常用方法有剔除法 均值法 決策樹法。2 正態性檢驗 很多統計方法都要求數值服從或近似服從正態分佈,所以在做資料分析...

電商資料分析常用的四種方法,資料分析必備

隨著資料時代的到來,各行各業的經營發展開始注重資料分析思維。通過資料,我們可以了解產品的好壞 使用者的喜愛程度,從而用資料去解決產品存在的問題。資料分析更多的是基於業務背景來解讀資料,把隱藏在資料背後的問題總結出來,發現其中最有價值的東西,再加以優化。在提煉資料的整個過程中,人是主觀的,而資料是客觀...

資料分析5

具體 以及講解 將作者列表進行處理,並完成統計。具體步驟如下 圖是複雜網路研究中的乙個重要概念。graph是用點和線來刻畫離散事物集合中的每對事物間以某種方式相聯絡的數學模型。graph在現實世界中隨處可見,如交通運輸圖 旅遊圖 流程圖等。利用圖可以描述現實生活中的許多事物,如用點可以表示交叉口,點...