資料庫技術應用的四個方向

2021-05-05 10:41:16 字數 1902 閱讀 3115

資料庫技術發展和大多數領域發展一樣,必將是應用驅動和技術驅動相結合。傳統的關聯式資料庫,由於其自身的侷限性,在使用中受到了很多限制,在搜尋、多**、企業內容管理、計算機輔助設計等方面,資料庫技術幾乎很少涉足,如能在以下4個方面完善資料庫技術,資料庫將獲取更大市場。

方向1.實現非結構化資料管理

「如果誰能控制、支援和儲存所有型別的資料,那麼這樣的廠商也就有能力擴充套件自己其他產品和服務的市場空間。因此整合xml、物件資料、多**資料,將所有資料型別放在乙個平台上將是傳統的關聯式資料庫發展的一大趨勢。」

不過,處理結構化資料的關係型資料庫從理論到技術上經歷了30多年發展,已經相當成熟,而非結構化資料的複雜程度遠遠高於結構化資料,所以非結構化資料的儲存還存在很多有待解決的難題,比如,如何很好地解決多種異構資料來源的儲存和查詢就是其中的關鍵問題。雖然有人認為將來xml資料庫將能比較好地解決非結構化資料的管理問題,但將現有文件對映到xml文件的工作才剛剛開始,xml查詢語言也遠不如sql成熟。

方向2.實現對web資料的挖掘

近年來,隨著internet技術的快速普及和迅猛發展,使各種資訊可以以非常低的成本在網路上獲得,由於internet在全球互連互通,可以從中取得的資料量難以計算,而且internet的發展趨勢繼續看好,特別是電子商務的蓬勃發展為網路應用提供了強大支援,如何在internet這個全球最大的資料集合中發現有用資訊無疑將成為資料探勘研究的熱點。

資料庫技術應用於web挖掘主要是為了解決web資訊的管理和查詢問題。這些問題可以分為三類:web資訊的建模和查詢;資訊抽取與整合;web站點建構和重構。

長期以來,由於在資料庫觀點下資料的表示方法比較特殊,其中包含了關係層次和圖形化的資料,所以大部分建立在扁平資料集合之上的資料探勘方法不能直接使用。目前已經有人針對多層資料庫挖掘演算法進行研究。

方向3.對智慧型搜尋技術的支撐

搜尋技術是現在網際網路的熱門應用,不過由於速度慢和併發性差等瓶頸限制,資料庫和搜尋首席技術官期以來都是「大路朝天,各走一邊」。據陳華介紹,在目前的搜尋技術中,出於速度等方面的考慮,搜尋過程中很少有使用資料庫工具的情況。不過隨著搜尋技術對智慧型化要求的提高,大量的匹配資訊、描述語句出現在搜尋過程中,資料庫技術如何配合未來的智慧型搜尋,也逐漸被大家關注。

現代網路系統中存在大量的有用資料,例如,每天有幾千萬個研究。然而,得到這些資料卻非常困難。據了解, google目前正在嘗試建立乙個體繫結構能夠支援新的關於海量web資料的研究。為了支援新研究,google以壓縮的形式儲存了實際所抓到的文件。google的目標之一就是要建立乙個環境使其他研究者能夠很快進入這個領域,處理海量web資料,在這樣的情況下,無疑需要資料庫技術來對這種系統進行有效的支援。

大型web搜尋引擎將是個非常複雜的系統,為了提高搜尋效率,需要覆蓋大約1億個網頁。我們必須有乙個巧妙的演算法來決定哪些舊網頁需要重新抓取,哪些新網頁需要被抓取。受需求驅動,用**cache建立搜尋資料庫正在成為目前乙個有前途的研究領域。

方向4.輔助軟體工程及製造系統的應用

關聯式資料庫技術是為傳統的事務處理而開發的,如庫存控制、工資、賬目等。但是人們很少將關聯式資料庫技術用於計算機輔助設計、輔助工程、輔助軟體工程及輔助製造(cad,cae,case和cam)系統及其應用。

傳統的資料庫系統所支援的事務模型不適合於互動式、協作設計環境下所必須的長事務(long-duration)。傳統的資料庫系統也不提供表示和管理資料庫的臨時變化,包括如像模式的時間和版本變化以及變化的通報(notification)方面的一些工具。

其實,在計算機輔助設計過程中、製造過程中,會出現大量的結構資訊資料,包括引數、圖形、描述、**、文件等。有效構建相應結構資訊的資料庫,對所有的結構資訊、載荷資訊和技術資料進行合理的儲存,並對這些資訊資料設計專用檢索程式,可以極大的優化設計工作效果。

資料庫的應用空間將不斷地擴充套件,未來資料庫將向web這樣乙個廣闊的空間發展。然而另一方面,資料庫技術也將向著更加智慧型化、更加專業化的方向發展,甚至對其融入自然語言和肢體語言的介面,讓人們應用資料庫變得更加容易。

資料庫事務四個特性

如果乙個資料庫聲稱支援事務的操作,那麼該資料庫必須要具備以下四個特性 原子性 atomicity 原子性是指事務包含的所有操作要麼全部成功,要麼全部失敗回滾,因此事務的操作如果成功就必須要完全應用到資料庫,如果操作失敗則不能對資料庫有任何影響。一致性 consistency 一致性是指事務必須使資料...

資料庫的四個隔離級別

size medium b 髒讀 b 又稱無效資料的讀出,是指在資料庫訪問中,事務t1將某一值修改,然後事務t2讀取該值,此後t1因為某種原因撤銷對該值的修改,這就導致了t2所讀取到的資料是無效的。b 不可重複讀 b 是指在是指在資料庫訪問中,乙個事務範圍內兩個相同的查詢卻返回了不同資料。這是由於查...

資料庫事物的四個特性

到現在為止才真的搞清楚這四個事件任務的意思。我們通常應用資料庫是基於增刪改查的,比如插入一條資料到資料庫,那麼我們來分析下四個特性 1.原子性 插入資料,要麼成功要麼不成功,不會是我插入了一半資料,比如我想插入姓名和id,總不是會只插入了姓名,其他沒有插入到資料庫中。2.一致性 插入資料了,那麼資料...