隨著大資料技術逐步在企業端應用,越來越多的企業在利用資料技術提公升管理效率和決策的科學性。企業對資料分析人才的需求也越來越旺盛,對管理者的資料分析能力也提出了新的要求。
資料的質量直接影響著資料的價值,並且還影響著資料分析的結果以及我們依此做出的決策的質量。質量不高的資料會影響企業的經營管理決策;如果資料是錯誤的,那麼還不如沒有資料,因為沒有資料時,我們會基於經驗和常識做出不見得是錯誤的決策,而錯誤的資料會引導我們做出錯誤的決策。因此,資料質量是治理企業經營管理資料的關鍵所在。
資料的質量可以通過八個指標進行衡量,每乙個指標都從乙個側面反映了資料的品相。這八個指標分別是:準確性、及時性、即時性、真實性、精確性、完整性、全面性和關聯性。
我們在比較兩個資料集的品相時往往採用如下圖所示的這種圖形表示。例如常規來講,內部資料集的準確性、真實性、完整性高,而全面性、及時性、即時性、精確性和關聯性方面取決於企業內部對資料的重視程度以及採集資料的技術手段;
而外部資料集(如微博資料、網際網路**資料等)的全面性、及時性和即時性都可以通過技術手段如網路爬蟲等得到提高,但在準確性、真實性、精確性上難以保證,也難以控制,而關聯性取決於資料採集和挖掘的相關技術。
資料的準確性
資料的準確性(accuracy)是指資料的採集值或者觀測值與真實值之間的接近程度,也叫誤差值,誤差值越大,資料的準確度越低。資料的準確性由資料的採集方法決定的。
資料的精確性
資料的精確性(precision)是指對同一物件在重複測量時所得到的不同觀測資料之間的接近程度。精確性,也叫精準性,它與資料採集的精度有關係。精度越高,要求資料採集的粒度越細,誤差的容忍程度也越低。
例如在測量人的身高時,可以精確到厘公尺,多次測量結果之間的誤差只會在厘公尺級別;在測量北京到上海的距離時,可以精確到千公尺,多次測量結果之間的誤差會在千公尺級別;用游標卡尺測量乙個零件的厚度時,可以精確到 1/50 公釐,多次測量結果之間的誤差也只會在 1/50 公釐級別。因此,可以說採用的測量方法和手段直接影響著資料的精確性。
資料的真實性
資料的真實性,也叫資料的正確性(rightness)。資料的正確性取決於資料採集過程的可控程度。資料採集過程可控程度高,可追溯情況好,資料的真實性就容易得到保證,而可控程度低或者無法追溯,則資料的真實性就難以得到保證。
為了提高資料的真實性,採用無人進行過程干涉的智慧型終端直接採集資料,能夠更好地保證所採集的資料的真實性,減少人為干預,減少資料造假,從而讓資料更加準確地反映客觀事物。
資料的及時性
資料的及時性(in-time)是指能否在需要的時候獲到資料。例如企業在月初會對上個月的經營和管理資料進行統計和彙總,此時的資料及時性是指這些資料能否及時處理完成,財務能否在月度關賬後及時核算。資料的及時性是資料分析和挖掘及時性的保障。如果企業的財務核算流程複雜,核算速度緩慢,上個月的資料在本月月中才能統計彙總完成,那麼等需要調整財務策略的時候,已經到月底了,乙個月已經快過完了。特別是當企業做大了之後,業務覆蓋多個市場、多個國家,如果資料不能及時彙總,則會影響到高層決策的及時性。資料的及時性與企業的資料處理速度及效率有直接的關係,為了提高資料的及時性,越來越多的企業採用管理資訊系統,並在管理資訊系統中附加各種自動資料處理功能,在資料上傳到系統中之後自動完成絕大部分報表,從而提高了資料處理的效率。使用計算機自動處理中間層資料是提高企業資料處理效率的有效手段。
企業除要保證資料採集的及時性和資料處理的效率外,還需要從制度和流程上保證資料傳輸的及時性。資料包表製作完成後,要及時或者在要求的時間範圍內傳送到指定的部門,或者上傳到指定的儲存空間中。
資料的即時性
資料的即時性包括資料採集的時間節點和資料傳輸的時間節點,在資料源頭採集資料後立即儲存並立即加工呈現,就是即時資料,而經過一段時間之後再傳輸到資訊系統中,則資料的即時性就稍差。例如乙個生產裝置的儀表即時地反映了裝置的溫度、電壓、電流、氣壓等資料,這些資料生成資料流,隨時監控裝置的執行狀況,這個資料可以看作即時資料。而
當將裝置的即時執行資料儲存下來,用來分析裝置的執行狀況與裝置壽命的關係時,這些資料就成了歷史資料。
資料的完整性
資料的完整性是指資料採集的程度,即應採集的資料和實際採集到的資料之間的比例。例如在採集員工資訊資料時,要求員工填寫姓名、出生日期、性別、民族、籍貫、身高、血型、婚姻狀況、最高學歷、最高學歷專業、最高學歷畢業院校、最高學歷畢業時間共 12 項資訊,而某個員工僅僅填寫了部分資訊,例如只填寫了其中的 6 項,則該員工所填寫資料的完整性只有一半。
一家企業中的資料的完整性體現著這家企業對資料的重視程度。要求採集的資料在實際中並未完整採集,這就是不完整的資料,這往往是企業對資料採集質量要求不到位導致的。
另外,對於動態資料,可以從時間軸去衡量資料的完整性。比如,企業要求每小時採集一次資料,每天應該形成 24 個資料點,記錄為 24 條資料,但是如果只記錄了 20 條資料,那麼這個資料也是不完整的。
資料的全面性
資料的全面性和完整性不同,完整性衡量的是應採集的資料和實際採集到的資料之間的比例。而資料全面性指的是資料採集點的遺漏情況。例如,我們要採集員工行為資料,而實際中只採集了員工上班打卡和下班打卡的資料,上班時間員工的行為資料並未採集,或者沒有找到合適的方法來採集,那麼這個資料集就是不全面的。
再例如,我們記錄乙個客戶的交易資料,如果只採集了訂單中的產品、訂單中產品的**和數量,而沒有採集客戶的收貨位址、採購時間,則這個資料採集就是不全面的。
資料的關聯性
資料的關聯性是指各個資料集之間的關聯關係。例如員工的工資資料和績效考核資料是通過員工關聯在一起來的,而且績效資料直接關係到工資資料。採購訂單資料與生產訂單資料之間通過物料的追溯機制進行關聯,而生產訂單又是由員工完成的,即通過員工作業資料與員工資訊資料關聯起來的。
本書**的企業經營資料,每個資料集都是相互關聯的,有的是直接關聯的,如員工工資資料和員工績效資料;有的是間接關聯的,如物料採購訂單資料與員工工資資料。這些資料是由公司的資源,包括人、財、物和資訊等關聯起來的。如果有任何的資料集不能關聯到其他的資料集,就會存在資料割裂或者資料孤島。資料割裂和資料孤島是企業經營資料關聯性不足導致的。而資料的關聯性直接影響到企業經營資料集的價值。
經營企業 經營人才
沃爾瑪 從小時工做起 在沃爾瑪,員工有大學學歷,或有一張mba文憑並不見得能夠贏得高階主管的賞識,只有通過自己的努力,以傑出的工作業績證明了自己的實力才行。財富 雜誌曾這樣評價沃爾瑪 它只認同花大錢的培訓和提公升激勵以贏得雇員的忠誠和熱情。管理人員中有60 的人是從小時工做起的。當然,這並不是說沃爾...
探尋中國軟體企業經營模式
在資訊產業所包含的資訊產品製造 軟體 通訊三大門類中,軟體已越來越關鍵。在過去的幾年中,我國軟體產業取得了高速發展。但是,其總量仍舊較小。與其他兩個門類進行比較,無論是市場規模還是企業規模,都遠遠不如。作為軟體產業的構成者,我國通過雙軟認證的軟體企業已達4700家。可是,從下圖我們可以看出,年收入在...
企業經營資料分析 讀後感
非專業資料分析的同學可以一看,能夠對資料分析在企業中的應用有乙個大概的了解。評價 第一篇概述篇,介紹資料分析在企業經營中的一些應用及資料分析的思路和方法,這一部分應該是作者的主業,有一些獨到的見解和作者自己的總結,對願意深入研究資料分析的同學可能會有幫助。第二篇主要講資料分析的方 包括分類 聚類 等...