1. 在生活中,一項工作時常由多個操作組成。比如a學院給b學院轉賬。
2. a的賬戶扣錢和b的賬戶加錢這兩個操作應該要麼都完成要麼都不完成才是正確的。原子性atomicity指的就是多個操作要麼全成要麼全掛。
3. 另一方面,轉賬之後,資料庫的狀態應該仍與之前保持一致,也就是說,轉賬之後,a和b的賬戶餘額之和應該與轉賬之前相同。對正確性的要求即是指一致性consistency。
4. 最後,轉賬結束之後,即使系統崩潰a和b的賬戶的餘額應該保持為轉賬之後的數目,而不是別的數字,這一點我們稱為永續性durability
6. 事務應當具備原子性、一致性。事務不能違反現有的資料庫一致性約束,如果事務開始之前db處於一致的狀態,事務結束之後,db狀態也應保持一致。但是在事務執行過程中,有可能需要臨時破壞資料庫的一致狀態,因為a賬戶扣錢b賬戶加錢這兩個操作總有先後順序。這種臨時不一致的狀態是必須的,但是,當系統崩潰時處理起來可能會比較麻煩。
7. 合理地定義事務以保持資料庫的一致性是程式設計師的責任。也可以說,把哪些操作放到乙個事務裡,由程式設計師來決定。
8. 而事務的原子性和永續性則由資料庫的恢復管理器recovery manager來實現。不出錯的話原子性很容易保證,但是出錯了的話,為了保證原子性,就不能讓出錯的事務影響到db的狀態,也就是說,要把db恢復到有問題那個事務開始之前的狀態。這種情況下,db要進行錯誤恢復faliure recovery:檢測系統錯誤,並將系統恢復到錯誤之前的某個一致狀態。
9. 當多個事務併發地更新資料時,即使單獨來看每個事務都是正確的,整個資料庫的一致性還是可能被破壞。這時候就需要併發控制管理器concurrency-controlmanager來控制併發事務之間的互動。事務管理器就由併發控制管理器和恢復管理器兩部分組成。
10. 資料庫系統的架構與支撐系統執行的計算機系統關係密切。.
14. 資料探勘大體上是指結合計算機和人力半自動地對大資料庫進行分析以發現有用的模式。類似人工智慧領域裡的機器學習machine learning或者統計分析,資料探勘也試圖從資料中發掘規律與模式,然而資料探勘與機器學習和統計分析的不同之處於在資料探勘要處理的資料多半儲存在磁碟上,因此資料探勘更多地是從資料庫中挖掘知識。
15. 通過資料探勘獲得的某些知識可用一些規則來表達,比如年收入高於5萬美元的年輕女性是最可能購買小型運動車的人群。這種規則並具有普適性,更多具有參照意義。還有些知識則以公式來表達,以揭示不同變數之間的關係,或者當某些變數發生變化時,對其可能的結果進行**。
16. 資料探勘工作的開始和結束階段一般會涉及一些人工操作,比如預處理、後處理,另外,從發掘出來的規則中遴選較優的規則也需要人工判斷。總的來說,資料探勘是一項半自動化的工作。
17. 許多大型公司的決策支援資料往往來自不同的渠道,為了高效地使用這些資料,這些公司大多建立起了資料倉儲,data warehouse。資料倉儲基於乙個統一的方案schema在某個站點從多個渠道獲取資料,以向使用者提供統一的資料訪問介面。
18. 文字資料是非結構化的,不像關聯式資料庫裡的資料那樣一行一列清楚分明。檢索非結構化的文字資料的過程稱為資訊檢索information retrieval。資訊檢索系統在資料的儲存和獲取上與資料庫系統類似,但是其重點則與資料庫系統不同,關注的是基於關鍵字進行查詢、判斷某篇文件與當前查詢的相關性、文件的分析、分類、索引等問題
19. 為了擴充套件資料庫系統的應用範圍,研究者們在關係資料模型以外又提出了關係物件模型、關結構化模型等模型。
1.11.1 基於物件的模型
20. 目前主流的資料庫提供商們大多都支援物件關係型模型,該模型結合了物件導向模型和關係模型的特點,它通過結構、集合、物件導向等擴充套件了關係模型。
1.11.2半結構化模型
21. 不同於關係模型裡乙個型別的各個資料項的屬性集完全相同,半結構化模型允許同一型別的資料項的屬性集各不相同。
22. xml應當是其中的一種。
23. 使用資料庫的人可分為兩類:使用者、管理員。
1.12.1 使用者與ui
24. 使用者有4種:
a) 一般使用者,使用寫好的應用程式,並能閱讀程式生成的較簡單的報表。
c) 高階使用者,不通過專門的程式來與db互動,而是通過查詢語言或者某種資料分析軟體來進行查詢、分析。
d) 專門使用者,最高端的使用者,寫特殊的程式,做資料探勘、專家系統等。
1.12.2管理員
25. 使用db的乙個主要原因是集中控制對資料以及使用資料的程式。能控制整個資料庫的人稱為dba。其職責包括:
a) 定義資料庫方案schema26. 資料庫管理系統dbms (database-management system)由一組相關聯的資料以及訪問這些資料的程式組成。b) 定義資料結構以及訪問方法
c) 修改資料庫方案以及其物理結構
d) 授予其他使用者訪問資料的許可權
e) 常規維護工作
27. 使用dbms的首要目的是給人們提供乙個方便、高效的訪問資料的環境。
28. dmbs用途非常廣泛,人們在日常生活中經常直接或間接的與其打交道。
29. 資料庫系統是用來儲存大批量的資料的。管理資料報括定義資訊的儲存結構、提供訪問這些資訊的機制,在出現故障時保證資料的安全,阻止未授權使用者訪問資料,多個使用者共用乙份資料時,應當避免出現反常情況。
30. 使用資料庫系統的另乙個重要目的是給使用者提供資料的某種抽象檢視,也就是說,向使用者隱藏資料的儲存、維護等細節。
31. 資料模型是用來描述資料、資料之間的關係,語法、約束等內容的一組概念性的工具conceptual tools,它支撐著整個資料庫的結構。
32. 在db中儲存資料目前最常用的是關係模型。還有其他一些模型:物件導向模型、物件-關係模型、半結構化模型等。
33. dml data-manipulation language,使用者訪問、運算元據所用的語言。非過程式dml目前使用非常廣泛,使用它時只需要指定需要什麼資料,而不用宣告如何獲取資料。
34. ddl 是是用於定義資料庫方案schema以及資料的其他屬性的語言。
35. 資料庫設計主要包括資料庫方案的設計,目前人們常用er模型來進行資料庫設計。
36. 資料庫系統由多個子系統組成:
a) 儲存管理器:作為儲存在庫中的資料與應用程式、提交給資料庫的查詢之間的介面37. 事務管理的作用是發生問題時,保證資料庫的一致性,以及多個事務併發執行時,防止出現衝突。b) 查詢處理器:編譯、執行ddl、dml語句。
38. 資料庫系統的架構受底層的計算機系統的結構影響非常大,可以是集中式的也可以是分布式的。
39. 資料庫應用一般分為在客戶端執行的前端部分和在伺服器上執行的後端部分。如果採用2層架構,前端程式直接與後端的資料庫互動,如果採用三層架構,則後端程式分解為應用程式伺服器和資料庫伺服器三部分。
40. knowledge-discovery嘗試從資料中發掘統計規律與模型,資料探勘是在人工智慧領域與統計分析領域發展起來的knowledge-discovery與將其高效地運用在大型資料庫上的技術的結合。
41. 資料庫系統的使用者可依其專業程度分成4種,不同型別的使用者用不同的方式與資料庫互動。
資料庫系統概念讀書筆記 2 實體聯絡模型
實體 聯絡 e r 模型是基於如下的一種認識 世界由一組實體和實體之間的相互聯絡組成。e r模型是一種語義模型,前面也提到過,這種模型經常作為關聯式資料庫模型的基礎。很多資料庫設計工具也都使用了e r模型的概念。下面是幾個核心概念 實體集 具有相同型別及共享相同性質的實體集合。而相應的實體集中每乙個...
資料庫系統概論 讀書筆記 2 資料模型
資料模型 對現實世界資料特徵的抽象 資料庫系統的核心和基礎 資料模型用來描述數,組織數和對資料進行操作 1.2.1 兩類資料模型 第一類 概念模型 第二類 邏輯模型 物理模型 概念模型 使用者觀點對資料和資訊建模 邏輯模型 層次模型,網狀模型,關係模型,物件導向資料模型,物件關係資料模型 半結構化資...
資料庫系統概念 回顧
資料抽象一般分三層 最底層 物理層physical level 描述資料實際上是怎樣儲存的 中間層 邏輯層logic level 描述資料庫中儲存什麼資料及這些資料間存在什麼關係 最頂層 檢視層view level 只描述整個資料庫的某個部分 關係模型 relational model logic ...