Sklearn-如何预测所有目标标签的概率
问题内容:
我有一个带有目标变量的数据集,该变量可以具有7个不同的标签。我的训练集中的每个样本都只有一个目标变量标签。
对于每个样本,我想计算每个目标标签的概率。所以我的预测将由每行7个概率组成。
在sklearn网站上,我读到了有关多标签分类的信息,但这似乎不是我想要的。
我尝试了以下代码,但是每个样本只能给我一个分类。
from sklearn.multiclass import OneVsRestClassifier
clf = OneVsRestClassifier(DecisionTreeClassifier())
clf.fit(X_train, y_train)
pred = clf.predict(X_test)
有人对此有意见吗?谢谢!
问题答案:
您可以通过简单地删除OneVsRestClassifer
和使用predict_proba
方法来做到这一点DecisionTreeClassifier
。您可以执行以下操作:
clf = DecisionTreeClassifier()
clf.fit(X_train, y_train)
pred = clf.predict_proba(X_test)
这将为您提供7种可能类别中每一种的概率。
希望有帮助!