R語言包arules進行頻繁項集挖掘的最簡單例子

2021-08-20 10:56:28 字數 594 閱讀 6359

arules是進行頻繁項集挖掘(frequent itemset mining)的有效工具,不過我在使用的時候發現網上很多例子都比較繁瑣,這裡總結一下其中apriori方法的最簡單使用方法,這裡首先給出**:

files_change<-read.transactions(input_file, format="basket", sep=",")

summary(files_change)

rules<-apriori(files_change,parameter=list(support=0.015,confidence=0.15,minlen=2,maxlen=2))

write(rules, file=output_file, sep=",", quote=true, row.names=false)

進行一些最簡單解釋,第一行**讀入檔案,這裡唯一需要注意的就是我們選擇的資料檔案的format是basket,例如這裡的資料檔案格式:

第三行需要注意的就是support、confidence這些值的設定。最後一行是直接將mining出來的rule進行輸出。

arules的官方文件:

介紹得比較詳細的部落格文章:

R開發 常用R語言包

r與python差異比較大的乙個地方就是,python的機器學習演算法集中程度比較高,比如sklearn,就整合了很多的演算法,而r語言更多時候需要乙個包乙個包去了解,比較費時費力,對於python轉過來的朋友非常不友好,抽空整理了工作中常用的r包如下 常用檢驗函式 基本上分布中常見的都羅列了 常用...

R語言包彙總 資料科學相關

資料模型和視覺化平台 結果展示 資料缺失值處理 mice vim資料探勘 機器學習 e1071 mlbench cart 包含 關聯規則概念 條件推理決策樹 party adaboost 自適應助推法 迭代式 對過擬合不敏感 bagging 自助整合法 自助法放回抽樣 adabag 隨機森林 多次自...

BT5 R3安裝中文語言包

bt5 r3發布了 很多人都想怎麼安裝中文語言包吧 很簡單 幾個命令完全搞定 首先apt get update 回車更新一下bt5的系統模組 開啟終端命令輸入 apt get install language support zh 回車 apt get install language pack z...