查准率和查全率是衡量偏斜类问题的评估度量,它们往往是一对矛盾的值,如何权衡它们,具体情况具体分析。
对于癌症问题,如果需要准确率,我们提升临界阈值,查准率会上升,但同时查全率会下降。反之亦然。
假设我们有三个学习算法:
如何选择?
取平均?不太好。。。
F值(F1 Score),挺好的,它的公式决定了PR都必须比较大才行。
查准率和查全率是衡量偏斜类问题的评估度量,它们往往是一对矛盾的值,如何权衡它们,具体情况具体分析。
对于癌症问题,如果需要准确率,我们提升临界阈值,查准率会上升,但同时查全率会下降。反之亦然。
假设我们有三个学习算法:
如何选择?
取平均?不太好。。。
F值(F1 Score),挺好的,它的公式决定了PR都必须比较大才行。