乙個資料有多種屬性,在實際應用過程中,可以用多種方式對資料進行分類,無論哪種分類也只是從乙個維度將資料的特性分開,資料分類有些是為了實際應用,有些是為了技術實現。從多年的資料管理實踐工作中,認為以下分類對資料的管理和應用非常重要。
1、資料主被動產生分類
2、資料kid分類
在所有的石油資料中,有些是原始資料,有些是對原始資料經過加工後得到的中間成果,還有些是最終的研究成果。資料這些不同的特徵可以用kid分類來區別(k-知識、i-資訊、d-資料)。
可以簡單理解為d是原始測量資料,這些資料沒有經過任何後期的加工處理,如**採集資料、錄井原始資料、測井原始資料、分析化驗資料等。資料可以用以下表示式簡單表達:
d=f1(資料說明、資料定義,測量方法、單位,格式等)
資訊(i):資訊是為了說明某個事務或者某個物件的某個屬性的引數或者認識結論,它一般是依據一定的方法對一些資料進行加工而獲得的。
• i=f2(d,i』,資料處理方法,作者,時間,審核)
• 資訊是在資料基礎上進一步考慮資料加工處理的方法、作者、時間、可信度、審核等內容。
知識(k):知識是決策的依據,是用來說明決策的一系列要素,為決策提供某一方面的決策依據或者資訊。因此,知識一定是依附於決策而存在的,這是知識和資訊的最大區別。
• k=f3(決策目的,i,d,k』,方法,作者,時間,審核,批准)
• 知識是依附一定的決策目的,是在資訊或者資料基礎上加工的;知識要進一步考慮資料加工處理的方法、作者、時間、可信度、審核、批准等內容
對資料款項kid分類也是為了正確識別資料的各種要素,明確不同資料之間的kid(血緣)關係,這對正確理解資料、應用資料有特別重要的意義。
3、資料it技術分類
由於資料的複雜性,在實際系統實現上很難用乙個系統對石油資料進行管理,實際專案中一般是根據資料的it屬性對資料進行分類管理,可以分為結構化資料、非結構化成果資料、圖形(空間)資料、**資料等。不同的資料型別實現的技術思路和管理內容差異很大,一般都是分別實施。
4、資料產生方式分類
對於石油資料其產生的方式多種多樣,我們看到的乙個資料可能由不同的方式產生,針對資料產生方式,分為以下幾類:
① 源頭人工採集資料(c1):這類資料是源頭資料,並且是通過人工採集方式錄入的。
② 源頭儀器產生資料(c2):這類資料也是源頭產生,但是是由儀器產生,我們從儀器中接入的。
③ 通過其它資料計算得到(c3):是由其它資料通過專業方法計算得到。
④ 引用資料(r):是從其它資料中引用過來的,不是源頭資料。
5) 資料應用分類
資料的應用分類包含的範圍很廣,分類方法也不盡相同,常見的有動態資料和靜態資料分類、原始資料和成果資料分類等。這些資料的分類主要是從不同應用角度考慮和劃分。
當然資料分類還可以有很多其他方面的分類方案,這裡只是常規的分類方案。
資料分類的目的不是簡單的分類,而是為了後期資料管理技術的落地需要根據不同的資料分類採用不同的技術解決方案。
資料的分類方式
下面將逐個介紹各種常見分類方式,並簡單介紹每種分類的使用場景,以及對每個角色的重要程度。1 從欄位型別上 文字類 string char text等 數值類 int float number等 時間類 data timestamp等 該分類對每種角色的重要程度 2 從資料結構上 結構化資料 半結構化...
傳輸方式的分類
1 面向有連線型和面向無連線型 在傳送資料之前,需要在收發主機之間建立一條通訊線路。必須在通訊傳輸前後麼專門進行建立和斷開鏈結的處理。如果與對端之間無法通訊,就可以避免傳送不必要的資料。在面向有連線型的情況下,傳送端的資料不一定要分組傳送,電路交換也屬於面向有連線的一種方式。面向無連線型不要求建立和...
Python基本資料分類方式
一 記憶體模型 依據變數在記憶體中的組織分類 python的型別,就象絕大多數其它語言一樣,能容納乙個或多個值。乙個能儲存單個字面物件的型別我們稱它為原子或標量儲存,那些可容納多個物件的型別,我們稱之為容器儲存。容器物件有時會在文件中被稱為復合物件,不過這些物件並不僅僅指型別,還包括類似類例項這樣的...