組概念 開展大資料審計前需要了解的8組概念

2021-10-13 15:58:05 字數 1876 閱讀 4764

在我們開拓新的審計領域時,對一些概念的理解是非常重要的,對概念正確的理解會影響到今後工作的方向,反之,錯誤的理解會導致錯誤的方向。方向錯了,即使做再多的技術性工作,離目標越來越遠的可能性就會越大。

一、數字、資料、資訊

數字:狹義的數字是數學上的,但在資訊科技中,資料、資訊、影象、視屏等都可以數字形式儲存在計算機、儲存器中。

資訊:資訊是對物質世界和精神世界的一種可以傳遞的描述。資訊可以是反映物質世界的,例如人們所了解到的地球繞太陽一周的時間、萬有引力定理等。資訊也可以是反映人們精神世界的,例如某位思想家的思想理論等。資訊往往是人類可以識別和理解的。資訊可以是真的資訊,也可以是假的資訊;資訊可以是有用的資訊,也可以是無用的資訊。資訊往往通過數字、資料、文字、影象、視屏等形式傳遞和儲存。

大資料:大資料(big data),並不僅僅指海量的資料,其還有四大特點,4v,分別是volume(海量)、variety(多樣)、velocity(高速)、value(價值)。

二、資料來源、資料元、元資料

資料元:就是資料元素,也可以理解為抽象化的資料項,目的是把一項項資料進行抽象、定義、規範,形成基礎元素,以便在報表中組合使用。

元資料:就是最原始、最基礎的資料,也就是資料的資料。

三、基礎資料、衍生資料、主資料

基礎資料:是企業生產經營中直接產生的,未經加工過的基礎性資料,如客戶基礎資料。

衍生資料:與基礎資料相對應,是按照一定規則對基礎資料進行加工、計算後產生的資料,不是通過業務前台直接採集的。

主資料:企業有不同的業務、財務等資訊系統,只有那些可以互動、共享的關鍵資料才稱為主資料。

四、資料管理、資料管控、資料治理

資料管理:主要側重於對不同資料流的具體管理,涵蓋資料的安全、質量、標準、需求分析等內容。

資料管控:側重於對資料的控制,例如資料安全控制、質量控制等等。

資料治理:是站在企業更高的角度,從全域性出發,以組織架構、體系入手,對資料進行頂層的設計。

五、資料標準、資料規範、資料字典

資料標準:是基於業務、管理、技術等需要而對資料屬性制訂的標準,是為了規範資料語言,使同一資料語言可以在不同系統中運用或使用,也可以在不同部門間進行溝通。

資料規範:是乙個範圍更寬泛的概念,例如制訂資料標準也是資料規範的一種,如何規範資料使其可以在報表分析中使用也是一種規範。

資料字典:是更側重於某一系統的技術屬性的標準,如sap系統有其自身的資料字典。

六、資料集市、資料倉儲、資料工廠

資料工廠:資料工廠可以對資料加工,可以根據客戶的的需求來定製不同的資料產品。

七、資料平台、大資料平台、資料服務平台

資料平台:是資訊系統相對應的,資訊系統側重於資訊和系統,而資料平台側重於為企業人員提供某種服務。例如鑽井平台,是石油工人在這個平台進行工作,而鑽井平台本身也是一種物理和資訊系統。

大資料平台:根據大資料特徵打造的平台,不是所有的資料平台都能叫做大資料平台。

資料服務平台:為業務部門提供資料服務的平台,更側重於資料的應用。

八、資料模型、資料分析模型、統計模型

資料模型:是指資料的結構和關係,分邏輯模型和物理模型,邏輯模型指的是資料的邏輯關係,物理模型可以理解為資料庫的表結構。資料模型側重於系統設計和實施。

統計模型:大部分實際工作中使用的資料分析模型都要使用統計學,也可以叫做統計模型。

學習 webpack 前,你需要了解的那些概念

關於什麼是webpack,一般的教程裡面都會提到webpack是乙個模組化打包工作,但是很多初學者沒有模組化這個概念,所以往往在第一步就被攔住了。所以在講什麼是webpack之前,我想先講一下和模組化相關的概念。在講模組化之前,我們先複習一下less,我們在a.less檔案中定義了乙個顏色變數 wh...

大資料平台需要了解的知識點

ngix協議層做阻斷應射處理 springboot 容器 mvc框架 springsecurity 認證和授權框架 mybatis orm框架 swagger ui 文件生產工具 hibernator validator 驗證框架 elasticsearch 搜尋引擎 rabbitmq 訊息佇列 r...

關於大資料獲客你需要了解的知識

大資料實時計算階段需掌握的技術有 mahout spark storm。1 spark spark是專為大規模資料處理而設計的快速通用的計算引擎,其提供了乙個全面 統一的框架用於管理各種不同性質的資料集和資料來源的大資料處理的需求,大資料開發需掌握spark基礎 sparkjob spark rdd...