記得在課上,老師說,結構化資料就是我們關聯式資料庫裡的表,剩下的都是半結構化和非結構化資料,好比xml文件就是半結構化資料,word文件就是非結構化資料,大資料就是半結構化和非結構化資料。心中一直有乙個疑問?難道大資料不應該包含結構化資料嗎?實在學習資料庫這門課時,就對這幾個概念有所混淆,所幸今天在書中發現了比較清晰的解釋,記錄下來,方便以後參考。
定義:業界指關係模型資料,即以關聯式資料庫表形式管理的資料
簡析:雖然專業角度上看,結構化就是關係模型的說法並不準確,但針對目前業內現狀,還是定義為關係模型最為妥善,因為它準確的代表了我們傳統上最熟悉的企業業務資料。
定義:非關係模型的、有基本固定結構模式的資料,例如日誌檔案、xml文件、json文件、email等。
簡析:區分半結構化與非結構化的意義在於,對兩者的處理方法是不同的,非結構化資料大多採用內容管理方法,而半結構化資料基本沒有有效的管理方法。
(1)結構化、半結構化、非結構化其實是按照資料格式分類。
(2)嚴格講,結構化與半結構化資料都是有基本固定結構模式的資料
(3)半結構與非結構化資料與目前流行的大資料之間只是有領域重疊的關係,本質講兩者並無必然聯絡。
(4)業界有將大資料認同為半結構/非結構化資料,是因為大資料技術最初是在半結構化資料領域發揮作用,其本質是將資料處理技術與資料格式混淆,是不正確的。
何小朝. 縱橫大資料[m]. 電子工業出版社, 2014.
結構化 半結構化和非結構化資料
在實際應用中,我們會遇到各式各樣的資料庫如nosql非關聯式資料庫 memcached,redis,mangodb rdbms關聯式資料庫 oracle,mysql等 還有一些其它的資料庫如hbase,在這些資料庫中,又會出現結構化資料,非結構化資料,半結構化資料,下面列出各種資料型別 結構化資料 ...
結構化 半結構化和非結構化資料
在實際應用中,我們會遇到各式各樣的資料庫如nosql非關聯式資料庫 memcached,redis。mangodb rdbms關聯式資料庫 oracle,mysql等 另一些其他的資料庫如hbase,在這些資料庫中。又會出現結構化資料。非結構化資料。半結構化資料,以下列出各種資料型別 結構化資料 可...
結構化資料 半結構化資料 非結構化資料
結構化資料 即行資料,儲存在資料庫裡,可以用二維表結構來邏輯表達實現的資料 所謂半結構化資料,就是介於完全結構化資料 如關係型資料庫 物件導向資料庫中的資料 和完全無結構的資料 如聲音 影象檔案等 之間的資料,html文件就屬於半結構化資料。它一般是自描述的,資料的結構和內容混在一起,沒有明顯的區分...