Weka 协会


据观察,购买啤酒的人同时也会购买尿布。那就是一起买啤酒和尿布是有关联的。虽然这似乎不太令人信服,但这个关联规则是从庞大的超市数据库中挖掘出来的。同样,花生酱和面包之间也可能存在关联。

找到这样的关联对于超市来说变得至关重要,因为他们会在啤酒旁边存放尿布,这样顾客就可以轻松找到这两种物品,从而增加超市的销售额。

The Apriori 算法是 ML 中的一种这样的算法,它找出可能的关联并创建关联规则。 WEKA 提供了 Apriori 算法的实现。你可以在计算这些规则时定义最小支持和可接受的置信水平。你将应用 Apriori 算法为 超级市场 WEKA 安装中提供的数据。

加载数据中


在 WEKA 资源管理器中,打开 预处理 选项卡,单击 打开文件 ... 按钮并选择 超市.arff 安装文件夹中的数据库。数据加载完成后会出现如下画面:

Loading Data

该数据库包含 4627 个实例和 217 个属性。你可以轻松理解检测如此大量属性之间的关联是多么困难。幸运的是,这个任务在 Apriori 算法的帮助下是自动化的。

联想者


点击 联系 TAB 并单击 Choose 按钮。选择 Apriori 关联如截图所示:

Associate Tab

设置 Apriori 算法的参数,点击其名称,会弹出如下图所示的窗口,可以设置参数:

Apriori Algorithm

设置好参数后,点击 Start 按钮。稍等片刻,你将看到如下截图所示的结果:

Start Parameters

在底部,你将找到检测到的最佳关联规则。这将有助于超市将产品存放在适当的货架上。