二叉查詢樹:
優點:二分查詢
缺點:最差情況變成了鍊錶
平衡二叉樹:
優點:樹的高度差不超過1
缺點:每個節點儲存儲存的資料太少,每次從磁碟拿資料不夠page的16kb,導致樹的深度過大(瘦長型)。讀不夠
多路平衡查詢樹(b樹):分叉數比關鍵字多1(通過樹的合併和**來保證新加入的關鍵字的有序性)
優點:每個節點可以儲存超過1個關鍵字
加強版多路平衡查詢樹(b+樹):關鍵字數=度,非葉子結點不存資料,葉子結點形成有序鍊錶
聚集索引的葉子結點存放完整的資料
二級索引儲存索引和主鍵健值
優點:排序能力更強,效率更加穩定,磁碟讀寫能力、掃表能力更強
聚集索引:索引鍵值順序和資料行的物理儲存順序一致
innodb對事務隔離級別的支援程度
回表查詢:用二級索引去查詢資料的時候,需要多掃瞄一次自己的b+樹,然後再到主鍵索引的葉子結點中去拿資料
如果select中所有的列都在索引中,則不需要回表查詢
髒讀:讀到別的事務未提交的資料
不可重複讀(針對update和delete):事務過程中讀到和事務開始時不一樣的資料
幻讀(針對insert):事務過程中讀到和事務開始時不一樣的資料
讀一致性:資料庫讀的事務和其他事務不瓜葛,提高資料庫併發效能
例如:a賬戶原本有1000,現在b和c分別給a賬戶加100
a:1000
b:1000+100
c:1000+100
這樣a就變成1100,和預期結果不一致
mvcc核心思想
效果:建立乙個快照,同乙個事務無論查詢多少次都是相同的資料
乙個事務能夠看到的資料版本:
1. 第一次查詢之前已經提交的事務修改
2. 本事務的修改
乙個事務不能看見的資料版本:
1. 在本事務第一次查詢之後建立的事務
2. 未提交的事務修改
kNN做回歸任務
knn常用作分類任務,但是也可以做回歸任務。做法 使用knn計算某個資料點的 值時,模型會從訓練資料集中選擇離該資料點最近的k個資料點,並且把他們的y值取均值,把該均值作為新資料點的 值。此次 演示使用資料庫中的鳶尾花資料集,通過前三個的特徵值,第四個特徵值。根據前三個特徵找出新資料的k個最近鄰,將...
EXCEL做回歸分析
昨天,石頭在食堂二樓,偶遇班上同學,她問我一問題,如何在spss中做回歸分析,石頭答曰 先做散點圖,再選回歸模型。由於數學基礎差,在spss中做出了散點圖,卻不識是何種模型,沒辦法,只好從excel中模擬,具體步驟如下 這裡是關鍵。一般在開始的時候我們並不知道哪一種是最符合的模型,不要緊,姑且點選乙...
如何用excel做回歸分析
在日常資料分析工作當中,回歸分析是應用十分廣泛的一種資料分析方法,按照涉及自變數的多少,可分為一元回歸分析和多元回歸分析 按照自變數和因變數之間的關係型別,可分為線性回歸分析和非線性回歸分析。回歸分析的實施步驟 1 根據 目標,確定自變數和因變數 2 建立回歸 模型 3 進行相關分析 4 檢驗回歸 ...