關係型資料庫最難的地方,就是建模(model)。
錯綜複雜的資料,需要建立模型,才能儲存在資料庫。所謂"模型"就是兩樣東西:實體(entity)+ 關係(relationship)。
實體指的是那些實際的物件,帶有自己的屬性,可以理解成一組相關屬性的容器。關係就是實體之間的聯絡,通常可以分成"一對一"、"一對多"和"多對多"等型別。
在關係型資料庫裡面,每個實體有自己的一張表(table),所有屬性都是這張表的字段(field),表與表之間根據關聯字段"連線"(join)在一起。所以,表的連線是關係型資料庫的核心問題。
表的連線分成好幾種型別。
內連線(inner join)
外連線(outer join)
左連線(left join)
右連線(right join)
全連線(full join)
以前,很多文章採用維恩圖(兩個圓的集合運算),解釋不同連線的差異。
上週,我讀到一篇文章,認為還有比維恩圖更好的解釋方式。我發現確實如此,換乙個角度解釋,更容易懂。
所謂"連線",就是兩張表根據關聯字段,組合成乙個資料集。問題是,兩張表的關聯欄位的值往往是不一致的,如果關聯欄位不匹配,怎麼處理?比如,表 a 包含張三和李四,表 b 包含李四和王五,匹配的只有李四這一條記錄。
很容易看出,一共有四種處理方法。
只返回兩張表匹配的記錄,這叫內連線(inner join)。
返回匹配的記錄,以及表 a 多餘的記錄,這叫左連線(left join)。
返回匹配的記錄,以及表 b 多餘的記錄,這叫右連線(right join)。
返回匹配的記錄,以及表 a 和表 b 各自的多餘記錄,這叫全連線(full join)。
下圖就是四種連線的圖示。我覺得,這張圖比維恩圖更易懂,也更準確。
上圖中,表 a 的記錄是 123,表 b 的記錄是 abc,顏色表示匹配關係。返回結果中,如果另一張表沒有匹配的記錄,則用 null 填充。
這四種連線,又可以分成兩大類:內連線(inner join)表示只包含匹配的記錄,外連線(outer join)表示還包含不匹配的記錄。所以,左連線、右連線、全連線都屬於外連線。
這四種連線的 sql 語句如下。
select * from a
inner join b on a.book_id=b.book_id;
select * from a
left join b on a.book_id=b.book_id;
select * from a
right join b on a.book_id=b.book_id;
select * from a
full join b on a.book_id=b.book_id;
上面的 sql 語句還可以加上where條件從句,對記錄進行篩選,比如只返回表 a 裡面不匹配表 b 的記錄。
select * from a
left join b
on a.book_id=b.book_id
where b.id is null;
另乙個例子,返回表 a 或表 b 所有不匹配的記錄。
select * from a
full join b
on a.book_id=b.book_id
where a.id is null or b.id is null;
此外,還存在一種特殊的連線,叫做"交叉連線"(cross join),指的是表 a 和表 b 不存在關聯字段,這時表 a(共有 n 條記錄)與表 b (共有 m 條記錄)連線後,會產生一張包含 n x m 條記錄的新錶(見下圖)。
(完)
訪問資料庫 訪問資料庫
程式執行的時候,資料都是在記憶體中的。當程式終止的時候,通常都需要將資料儲存到磁碟上,無論是儲存到本地磁碟,還是通過網路儲存到伺服器上,最終都會將資料寫入磁碟檔案。而如何定義資料的儲存格式就是乙個大問題。如果我們自己來定義儲存格式,比如儲存乙個班級所有學生的成績單 名字成績 michael99 bo...
資料庫 資料庫表連線Join
一條sql join語句對應著關係代數裡的乙個join操作,它對關聯式資料庫裡乙個或多個表的列進行合併。ansi標準的sql規定了5種型別的join inner,left outer,right outer,full outer和cross。除此之外乙個表能夠對自身進行連線,即self join。以...
訪問資料庫 資料庫並行訪問
作者姓名 neo chen 陳景峰 暱稱 netkiller 呼號 bg7nyt 手機 86 13113668890 多維度架構 知乎 www.zhihu.com 這裡主要講述有關開發中遇到的資料庫並行問題 防止並行顯示背景 我們有乙個order訂單表,工作流如下 建立訂單 訂單分配 訂單審核 批准...