sklearn中predict()与predict_proba()返回值意义

飞熊 • 2023年9月5日下午6:57 • Python • 阅读 466

predict：训练后返回预测结果，显示标签值

predict_proba：返回一个 n 行 k 列的数组，第 i 行第 j 列上的数值是模型预测第 i 个预测样本为某个标签的概率，并且每一行的概率和为1。

具体见下面示例：

from sklearn.linear_model import LogisticRegression
import numpy as np

# 训练数据：x_train
x_train = np.array([[1,2,3],
                    [1,3,4],
                    [2,1,2],
                    [4,5,6],
                    [3,5,3],
                    [1,7,2]])
# 训练标签：y_train
y_train = np.array([0, 0, 0, 1, 1, 1])

# 测试数据：x_test
x_test = np.array([[2,2,2],
                   [3,2,6],
                   [1,7,4]])
# 定义并训练LR模型
clf = LogisticRegression()
clf.fit(x_train, y_train)

# 返回预测标签
clf.predict(x_test)
# array([1, 0, 1])

predict 直接获得唯一的预测结果，对于上述数据：

预测[2,2,2]的标签是1
预测[3,2,6]的标签是0
预测[1,7,4]的标签是1

# 返回预测属于某标签的概率
clf.predict_proba(x_test)
# array([[ 0.43348191, 0.56651809],
#        [ 0.84401838, 0.15598162],
#        [ 0.13147498, 0.86852502]])

可以看出，predict_proba 的预测结果有三行两列，每行对应一条预测数据，两列分别对应对于0、1的预测概率。

预测[2,2,2]的标签是0的概率为0.43348191，1的概率为0.56651809
预测[3,2,6]的标签是0的概率为0.84401838，1的概率为0.15598162
预测[1,7,4]的标签是0的概率为0.13147498，1的概率为0.86852502

文章由极客之家整理，本文链接：https://www.bmabk.com/index.php/post/162814.html

sklearn中predict()与predict_proba()返回值意义

相关推荐

发表回复

分享到:

请登录