Weka 协会
据观察,购买啤酒的人同时也会购买尿布。那就是一起买啤酒和尿布是有关联的。虽然这似乎不太令人信服,但这个关联规则是从庞大的超市数据库中挖掘出来的。同样,花生酱和面包之间也可能存在关联。
找到这样的关联对于超市来说变得至关重要,因为他们会在啤酒旁边存放尿布,这样顾客就可以轻松找到这两种物品,从而增加超市的销售额。
The Apriori 算法是 ML 中的一种这样的算法,它找出可能的关联并创建关联规则。 WEKA 提供了 Apriori 算法的实现。你可以在计算这些规则时定义最小支持和可接受的置信水平。你将应用 Apriori 算法为 超级市场 WEKA 安装中提供的数据。
加载数据中
在 WEKA 资源管理器中,打开 预处理 选项卡,单击 打开文件 ... 按钮并选择 超市.arff 安装文件夹中的数据库。数据加载完成后会出现如下画面:
该数据库包含 4627 个实例和 217 个属性。你可以轻松理解检测如此大量属性之间的关联是多么困难。幸运的是,这个任务在 Apriori 算法的帮助下是自动化的。
联想者
点击 联系 TAB 并单击 Choose 按钮。选择 Apriori 关联如截图所示:
设置 Apriori 算法的参数,点击其名称,会弹出如下图所示的窗口,可以设置参数:
设置好参数后,点击 Start 按钮。稍等片刻,你将看到如下截图所示的结果:
在底部,你将找到检测到的最佳关联规则。这将有助于超市将产品存放在适当的货架上。