第六章 頻繁項集

2021-08-20 08:10:09 字數 754 閱讀 7841

a-priori演算法步驟:

1.     

a-priori

演算法的第一遍掃瞄:第一遍掃瞄中,要建立兩張表。

如有必要,

第一張表要將項的名稱轉換為

1到n之間的整數。另一張表則是乙個計數陣列,第i個陣列元素是上述第i個項的出現次數。這些所有項的計數值的初始值都是0.

2.     a-priori演算法兩遍掃瞄之間的處理:第一遍掃瞄之後,我們檢查所有項的計數值,以確定哪些項構成單元素頻繁項集。對於a-priori的第二遍掃瞄,我們只會給頻繁項重新編號,編號範圍是1到m。此時的**是乙個下標為1到n 的陣列,如果第i項不頻繁,則對於的第i個陣列元素為0,否則為1到m之間的乙個唯一整數。我們應將此**稱為頻繁項**

3.     a-priori演算法的第二遍掃瞄:在第二遍掃瞄中,我們對兩個頻繁項組成的所有項對計數。技術細節如下:

(1)     對每個購物籃,在頻繁項集表中檢查哪些項是頻繁的;

(2)     通過乙個雙重迴圈生成所有的頻繁項對;

(3)     對每個頻繁項對,在儲存計數值的資料結構中對應的計數值上加1;

最後,在第二遍掃瞄結束時,檢查計數值結構以確定哪些項對是頻繁項對。

pcy演算法:

pcy演算法利用a-priori演算法第一遍掃瞄計數時不需要的記憶體空間來建立一張雜湊表儲存項對,並統計雜湊到每個桶的項對的個數,超過閾值的為頻繁桶;

在第二遍掃瞄中,只需對雜湊到頻繁桶的頻繁項進行計數處理。這樣,每個頻繁桶內代表的頻繁項集比較少,計算量就大大降低了。

mysql第六章 第六章 mysql日誌

第六章 mysql日誌 一 錯誤日誌 錯誤日誌的預設存放路徑是 mysql 存放資料的地方 hostname.err 1.修改錯誤日誌存放路徑 mysqld log error data mysql mysql.log 2.檢視配置命令 show variables like log error 3...

第六章 指標

1.多位元組資料的位址是在最左邊還是最右邊的位置,不同的機器有不同的規定,這也正是大端和小端的區別,位址也要遵從邊界對齊 2.高階語言的乙個特性就是通過名字而不是位址來訪問記憶體的位置,但是硬體仍然通過位址訪問記憶體位置 3.記憶體中的變數都是義序列的0或1的位,他們可以被解釋為整數或者其他,這取決...

第六章總結

6.1 使用滑鼠 6.1.1 滑鼠時間和滑鼠訊息 根據使用者操作滑鼠時滑鼠的位置,滑鼠訊息分為兩類 客戶區滑鼠訊息和非客戶區滑鼠訊息。1.客戶去滑鼠訊息 2.當滑鼠游標位於視窗的使用者區時,將生成客戶滑鼠訊息。滑鼠訊息和鍵盤訊息有所不同,windows 只將鍵盤有訊息傳送給具有輸入極點的視窗,但滑鼠...