一、前言
隨著傳統的資料庫技術日趨成熟、計算機網路技術的飛速發展和應用範圍的擴充,資料庫應用已經普遍建立於計算機網路之上。這時集中式資料庫系統表現出它的不足:資料按實際需要已在網路上分布儲存,再採用集中式處理,勢必造成通訊開銷大;應用程式集中在一台計算機上執行,一旦該計算機發生故障,則整個系統受到影響,可靠性不高;集中式處理引起系統的規模和配置都不夠靈活,系統的可擴充性差。在這種形勢下,集中式db的「集中計算」概念向「分布計算」概念發展。分布計算主要體現在客戶機/伺服器模式和分布式資料庫體系結構兩個方面。
二、分布式資料庫系統概述
隨著傳統的資料庫技術日趨成熟、計算機網路技術的飛速發展和應用範圍的擴大,以分布式為主要特徵的資料庫系統的研究與開發受到人們的注意。分布式資料庫是資料庫技術與網路技術相結合的產物,在資料庫領域已形成乙個分支。分布式資料庫的研究始於20世紀70年代中期。世界上第乙個分布式資料庫系統sdd-1是由美國計算機公司(cca)於2023年在dec計算機上實現。20世紀90年代以來,分布式資料庫系統進入商品化應用階段,傳統的關聯式資料庫產品均發展成以計算機網路及多工作業系統為核心的分布式資料庫產品,同時分布式資料庫逐步向客戶機/伺服器模式發展。
三、ddbs(distributed database system)的分類
(1)同構同質型ddbs:各個場地都採用同一型別的資料模型(譬如都是關係型),並且是同一型號的dbms。
(2)同構異質型ddbs:各個場地採用同一型別的資料模型,但是dbms的型號不同,譬如db2、oracle、sybase、sql server等。
(3)異構型ddbs:各個場地的資料模型的型號不同,甚至型別也不同。隨著計算機網路技術的發展,異種機聯網問題已經得到較好的解決,此時依靠異構型ddbs就能訪問全網中各種異構區域性庫中的資料。
四、ddbs的特點和優缺點
ddbs的基本特點:
(1)物理分布性:資料不是儲存在乙個場地上,而是儲存在計算機網路的多個場地上。
(2)邏輯整體性:資料物理分布在各個場地,但邏輯上是乙個整體,它們被所有使用者(全域性使用者)共享,並由乙個ddbms統一管理。
(3)場地自治性:各場地上的資料由本地的dbms管理,具有自治處理能力,完成本場地的應用(區域性應用)。
(4)場地之間協作性:各場地雖然具有高度的自治性,但是又相互協作構成乙個整體。
ddbs的其他特點
(1)資料獨立性
(2)集中與自治相結合的控制機制
(3)適當增加資料冗餘度
(4)事務管理的分布性
ddbs的優點
(1)具有靈活的體系結構
(2)適應分布式的管理和控制機構
(3)經濟效能優越
(4)系統的可靠性高、可用性好
(5)區域性應用的響應速度快
(5)可擴充套件性好,易於整合現有的系統
ddbs的缺點
(1)系統開銷較大,主要花在通訊部分 。
(2)複雜的訪問結構(如輔助索引、檔案的鏈結技術),在集中式dbs中是有效訪問資料的重要技術,但在分布式系統中不一定有效。
(3)資料的安全性和保密性較難處理。
五、資料分片
型別:(1)水平分片:按一定的條件把全域性關係的所有元組劃分成若干不相交的子集,每個子集為關係的乙個片段。
(2)垂直分片:把乙個全域性關係的屬性集分成若干子集,並在這些子集上作投影運算,每個投影稱為垂直分片。
(3)匯出分片:又稱為匯出水平分片,即水平分片的條件不是本關係屬性的條件,而是其他關係屬性的條件。
(4)混合分片:以上三種方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他們的結果是不相同的。
條件:(1)完備性條件:必須把全域性關係的所有資料對映到片段中,決不允許有屬於全域性關係的資料卻不屬於它的任何乙個片段。
(2)可重構條件:必須保證能夠由同乙個全域性關係的各個片段來重建該全域性關係。對於水平分片可用並操作重構全域性關係;對於垂直分片可用聯接操作重構全域性關係。
(3)不相交條件:要求乙個全域性關係被分割後所得的各個資料片段互不重疊(對垂直分片的主鍵除外)。
六、資料分配方式
(1)集中式:所有資料片段都安排在同乙個場地上。
(2)分割式:所有資料只有乙份,它被分割成若干邏輯片段,每個邏輯片段被指派在乙個特定的場地上。
(4)全複製式:資料在每個場地重複儲存。也就是每個場地上都有乙個完整的資料副本。
(5)混合式:這是一種介乎於分割式和全複製式之間的分配方式。
七、體系結構
八、分布式資料庫管理系統
九、小結
(1)「分布計算」概念突破了集中式dbs的框架,資料分布使系統走上分布式db的道路,功能分布使系統走上c/s道路。這是dbs的兩個發展。
(2)c/s系統包括乙個計算機網路,通常用乙個區域網鏈結。幾乎在所有情況下,客戶機都是微機;伺服器有時用小型機或大型機,但多數情況下也使用微機或高檔微機。應用程式在客戶機上處理,dbms和os的資料管理分放在伺服器上。
(3)c/s結構經歷了從兩層、三層到多層的演變過程。總的趨勢是使客戶機越來越「瘦」,變成瀏覽器;而伺服器的種類越來越多,容易實現系統的組裝。
(4)c/s系統使應用與使用者更加貼近,為使用者提供較好的效能和更複雜的介面。
(5)分布式系統是在集中式系統的基礎上發展而來的。ddb是資料庫技術與網路技術結合的產物。隨著計算機網路技術的飛速發展,ddbs日趨成為資料庫領域的主流方向。
(6)ddb具有資料分布性和邏輯整體性的特點。ddbs能夠支援涉及多個場地的全域性應用。ddb的資料儲存有資料分片和資料分配兩種策略。
(7)ddb的模式結構為理解ddbs提供了一種通用的概念結構。分布透明性是ddbs追求的目標。ddbms是負責管理分布環境下,邏輯整合資料的訪問、一致性、有效性和完備性的軟體系統。
(8)ddbs中資料分布在各個場地,系統中壓倒一切的效能目標是儘量減少網路中傳送資訊的次數和傳送的資料量。分布式查詢中基於半聯接的優化策略是常用的技術。
(9)對於併發控制和恢復,ddbms環境中會出現大量在集中式dbms環境中碰不到的問題。分布式的併發控制有主場地方法和主拷貝方法,再輔之於備份場地技術。
分布式資料庫 概述
分布式資料庫是指元件分布在網路上,元件之間通過傳遞訊息進行通訊和動作協調的系統。其核心理念是讓多台伺服器協同工作,完成單台資料庫無法處理的任務。分布式資料庫設計應該滿足如下要求。透明性 分布式資料庫對於開發人員是透明的。分布式資料在使用上表現就像乙個單機資料庫一樣。擴充套件性 它可以通過橫向擴充套件...
分布式資料庫
網路選課系統中分布式資料庫設計 何翠雙王巧雲張麗麗 摘要 關鍵字 選課 分布式 資料庫 distributed system of on line course choosing abstract key words course choosing distributed database 隨著學校...
分布式資料庫
1 背景 我們知道資料是乙個公司的命脈,隨著業務越做越大,資料量也會越來越大,計算也會越來越複雜,效能,可靠性,可擴充套件性的需求就會越來越強烈,這個時候乙個集中式的資料庫顯然已經滿足不了需求了。對於技術決策者來說有兩條路可以走,第一 按照現有的大型資料庫的解決方案,比如sql server clu...