240 发简信
IP属地:河北
  • Resize,w 360,h 240
    机器学习必刷题-手撕推导篇(1):逻辑回归与k-means

    本系列文章对常见的机器学习面试题进行了搜集、分类和整理,主要包括”手撕推导篇“、“模型比较篇”、“工程经验篇”以及“基础概念篇”等多个板块,旨在...

  • 决策树ID3 C4.5 CART的区别

    决策树是机器学习中非常经典的一类学习算法,它通过树的结构,利用树的分支来表示对样本特征的判断规则,从树的叶子节点所包含的训练样本中得到预测值。决...

  • Resize,w 360,h 240
    正则化

    一、正则化基础 正则化等价于结构风险最小化,就是在经验风险后面加上了表示模型复杂度的正则化项或惩罚项。 正则化的作用是 选择经验风险和模型复杂度...

  • Python面试必刷题系列(1)

    下面给大家分享的是python面试必刷题系列文章,后面会陆续整理更多python相关的问题给大家,无论是求职者还是新人都可以通过面试题来考察自己...

  • Resize,w 360,h 240
    过拟合

    一、什么是过拟合 过拟合的表现:模型训练时候的误差很小,但在测试的时候误差很大。 过拟合本质原因: 模型相对于训练样本数据量过于复杂,模型要学习...

  • bagging&boosting

    bagging和boosting都属于组合学习算法,都是将简单的分类或者回归算法组合在一起来提高模型的分类或者回归效果,但是两者还是有区别的,这...

  • 随机森林

    1、什么是随机森林? 随机森林就是用随机的方式建立一个森林,在森林里有很多决策树组成,并且每一棵决策树之间是没有关联的。当有一个新样本的时候,我...

    0.2 4731 0 4 1
  • 交叉验证

    1、为什么要进行交叉验证? 目的:为了得到可靠稳定的模型 交叉验证是一种模型选择方法,其将样本的一部分用于训练,另一部分用于验证。因此不仅考虑了...

  • Resize,w 360,h 240
    k-means

    一、kmeans简介 k-means:无监督学习算法,用于将给定训练样本D划分成k个类,用Ck表示。 算法原理: (1) 随机选取k个中心点; ...