分类问题和回归问题

如果单从结果上来看,分类模型是认为模型的输出是离散的,例如大自然的生物被划分为不同的种类,是离散的。回归模型的输出是连续的,例如人的身高变化过程是一个连续过程,而不是离散的。

下面是很好的一幅图可以比较两者的区别:
分类vs 回归

最后知乎上有个回答我觉得比较认可:回归和分类的根本区别在于输出空间是否为一个度量空间。

我们不难看到,回归问题与分类问题本质上都是要建立映射关系:
image.png

这两者的区别在于:

  • 对于回归问题,其输出空间B是一个度量空间,即所谓“定量”。也就是说,回归问题的输出空间定义了一个度量 d=F(ytrue,ypred)去衡量输出值与真实值之间的“误差大小”。例如:预测一瓶700毫升的可乐的价格(真实价格为5元)为6元时,误差为1;预测其为7元时,误差为2.这两个预测结果是不一样的,是有度量定义来衡量这种“不一样”的。(于是有了均方误差这类误差函数)。

  • 对于分类问题,其输出空间B不是度量空间,即所谓“定性”。也就是说,在分类问题中,只有分类“正确”与“错误”之分,至于错误时是将Class 5分到Class 6,还是Class 7,并没有区别,都是在error counter上+1

(内容基于网络参考后梳理,用于个人学习,如有侵权,请留言)