いろいろ書いてあるサイトがあるんだけど、
Rのパッケージには、Groceriesっていうバスケット分析用の
データが入っているので、簡単にやるのなら、以下のコマンドだけでいい。
install.packages("arules")
library(arules)
data(Groceries)
rules <- apriori(Groceries, parameter = list(support = 0.005, confidence = 0.01))
inspect(rules[1:100])
|
ここで指定してる、support(支持率)、confidence(確信度)について、くわしくは
http://sinhrks.hatenablog.com/entry/2014/12/12/081841
最後の
inspect(rules[1:100])
で、1位から100位までを表示している。[1:100]を入れないと、最後のほうしか見れない。
ファイルに書き出すには、
write(rules,file="data.csv", sep=",", col.names=NA)
なお、
write(Groceries,file="source.csv",sep=",")
とすると、サンプルデータGroceriesが書き出せる。これは、1レコード1バスケット内の商品の羅列になっている。
この形式のファイルを読みだすには、
# スーパーマーケットの買い物かごのデータをトランザクションとして読み込む
tranPosData <- read.transactions(posData, sep=",", rm.duplicates=TRUE)
詳しくは(引用元)
https://qiita.com/uchim/items/8a532945a1fb2f068b5a
レコード形式を、この形式に変換するには
#トランザクションデータに変換
data.tran<-as(as.matrix(df[2:(ncol(df)]),”transactions”)
詳しくは
https://www.gixo.jp/blog/3920/