Weka 是什么?


WEKA - 一种开源软件,提供用于数据预处理、多种机器学习算法的实现和可视化工具的工具,以便你可以开发机器学习技术并将其应用于现实世界的数据挖掘问题。下图总结了WEKA提供的功能:

Weka Summarized

如果你观察图像流的开始,你就会明白处理大数据有很多阶段要使其适合机器学习:

首先,你将从现场收集的原始数据开始。此数据可能包含多个空值和不相关的字段。你使用 WEKA 中提供的数据预处理工具来清理数据。

然后,你会将预处理后的数据保存在本地存储中以应用 ML 算法。

接下来,根据你尝试开发的 ML 模型的类型,你可以选择其中一个选项,例如 分类、聚类 , or 联系 . The 属性选择 允许自动选择特征以创建简化的数据集。

请注意,在每个类别下,WEKA 都提供了几种算法的实现。你将选择你选择的算法,设置所需的参数并在数据集上运行它。

然后,WEKA 会给你模型处理的统计输出。它为你提供了一个可视化工具来检查数据。

不同的模型可以应用于同一个数据集。然后,你可以比较不同模型的输出并选择最符合你目的的模型。

因此,使用 WEKA 可以更快地开发机器学习模型。

现在我们已经了解了 WEKA 是什么以及它的作用,在下一章中,让我们学习如何在本地计算机上安装 WEKA。