predict:训练后返回预测结果,显示标签值
predict_proba:返回一个 n 行 k 列的数组, 第 i 行 第 j 列上的数值是模型预测 第 i 个预测样本为某个标签的概率,并且每一行的概率和为1。
具体见下面示例:
from sklearn.linear_model import LogisticRegression
import numpy as np
# 训练数据:x_train
x_train = np.array([[1,2,3],
[1,3,4],
[2,1,2],
[4,5,6],
[3,5,3],
[1,7,2]])
# 训练标签:y_train
y_train = np.array([0, 0, 0, 1, 1, 1])
# 测试数据:x_test
x_test = np.array([[2,2,2],
[3,2,6],
[1,7,4]])
# 定义并训练LR模型
clf = LogisticRegression()
clf.fit(x_train, y_train)
# 返回预测标签
clf.predict(x_test)
# array([1, 0, 1])
predict 直接获得唯一的预测结果,对于上述数据:
- 预测[2,2,2]的标签是1
- 预测[3,2,6]的标签是0
- 预测[1,7,4]的标签是1
# 返回预测属于某标签的概率
clf.predict_proba(x_test)
# array([[ 0.43348191, 0.56651809],
# [ 0.84401838, 0.15598162],
# [ 0.13147498, 0.86852502]])
可以看出,predict_proba 的预测结果有三行两列,每行对应一条预测数据,两列分别对应 对于0、1的预测概率。
- 预测[2,2,2]的标签是0的概率为0.43348191,1的概率为0.56651809
- 预测[3,2,6]的标签是0的概率为0.84401838,1的概率为0.15598162
- 预测[1,7,4]的标签是0的概率为0.13147498,1的概率为0.86852502
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之家整理,本文链接:https://www.bmabk.com/index.php/post/162814.html