Python逻辑回归 测试


在将其投入生产使用之前,我们需要测试上面创建的分类器。如果测试表明模型没有达到预期的精度,我们将不得不回到上述过程,选择另一组特征(数据字段),重新构建模型,并进行测试。这将是一个迭代步骤,直到分类器满足你对所需精度的要求。所以让我们测试我们的分类器。

预测测试数据


为了测试分类器,我们使用了早期生成的测试数据。我们称 predict 创建对象上的方法并传递 X 测试数据数组如以下命令所示:

In [24]: predicted_y = classifier.predict(X_test)

这将为整个训练数据集生成一个单维数组,为 X 数组中的每一行提供预测。你可以使用以下命令检查此数组:

In [25]: predicted_y

以下是执行上述两条命令后的输出:

Out[25]: array([0, 0, 0, ..., 0, 0, 0])

输出表明第一个和最后三个客户不是 定期存款 .你可以检查整个数组以筛选出潜在客户。为此,请使用以下 Python 代码片段:

In [26]: for x in range(len(predicted_y)):
    if (predicted_y[x] == 1):
        print(x, end="\t")

运行上述代码的输出如下图所示:

Term Deposit

输出显示可能订阅 TD 的所有行的索引。你现在可以将此输出提供给银行的营销团队,他们将获取所选行中每个客户的联系方式并继续他们的工作。

在我们将此模型投入生产之前,我们需要验证预测的准确性。

验证准确性


为了测试模型的准确性,在分类器上使用 score 方法,如下所示:

In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))

运行该命令的屏幕输出如下所示:

Accuracy: 0.90

它表明我们模型的准确率是 90%,这在大多数应用中被认为是非常好的。因此,不需要进一步调整。现在,我们的客户已准备好运行下一个广告系列,获取潜在客户列表,并以可能的高成功率追逐他们打开 TD。