Python逻辑回归测试

在将其投入生产使用之前，我们需要测试上面创建的分类器。如果测试表明模型没有达到预期的精度，我们将不得不回到上述过程，选择另一组特征(数据字段)，重新构建模型，并进行测试。这将是一个迭代步骤，直到分类器满足你对所需精度的要求。所以让我们测试我们的分类器。

预测测试数据

为了测试分类器，我们使用了早期生成的测试数据。我们称 predict 创建对象上的方法并传递 X 测试数据数组如以下命令所示：

In [24]: predicted_y = classifier.predict(X_test)

这将为整个训练数据集生成一个单维数组，为 X 数组中的每一行提供预测。你可以使用以下命令检查此数组：

In [25]: predicted_y

以下是执行上述两条命令后的输出：

Out[25]: array([0, 0, 0, ..., 0, 0, 0])

输出表明第一个和最后三个客户不是 定期存款 .你可以检查整个数组以筛选出潜在客户。为此，请使用以下 Python 代码片段：

In [26]: for x in range(len(predicted_y)):
    if (predicted_y[x] == 1):
        print(x, end="\t")

运行上述代码的输出如下图所示：

输出显示可能订阅 TD 的所有行的索引。你现在可以将此输出提供给银行的营销团队，他们将获取所选行中每个客户的联系方式并继续他们的工作。

在我们将此模型投入生产之前，我们需要验证预测的准确性。

为了测试模型的准确性，在分类器上使用 score 方法，如下所示：

In [27]: print('Accuracy: {:.2f}'.format(classifier.score(X_test, Y_test)))

运行该命令的屏幕输出如下所示：

Accuracy: 0.90

它表明我们模型的准确率是 90%，这在大多数应用中被认为是非常好的。因此，不需要进一步调整。现在，我们的客户已准备好运行下一个广告系列，获取潜在客户列表，并以可能的高成功率追逐他们打开 TD。