240 发简信
IP属地:江苏
  • Resize,w 360,h 240
    一次完整的数据挖掘的过程

    任务描述 kaggle 案例 california-housing-priceshttps://www.kaggle.com/camnugent...

    13.3 8833 7 138
  • Resize,w 360,h 240
    如何进行一场数据挖掘算法竞赛

    一. 为什么要参加竞赛? 二. 需要哪些技能? 三. 怎么选择比赛合适的比赛? 建议去kaggle学习. 里面大牛分享的想法 , 还有开源.c...

    2.0 1815 0 13
  • Resize,w 360,h 240
    对模型评价指标AUC的理解

    AUC是一种衡量机器学习模型分类性能的重要且非常常用的指标,其只能用于二分类的情况.AUC的本质含义反映的是对于任意一对正负例样本,模型将正样本...

    0.9 9862 0 10
  • Resize,w 360,h 240
    关于交叉验证与偏差/方差的一连串理解

     在机器学习训练模型时,对于数据集的划分其实是很重要的一个步骤.如果数据集划分出现问题,那么将会导致模型过拟合(over fitting)或者欠...

  • 关于OrdinalEncoder 、OneHotEncoder 、get_dummies、LabelEncoder的用法与作用

    OrdinalEncoder / OneHotEncoder /get_dummies 三个方法都能够将离散的类别特征转换成由数字代表的类别特征...

  • 关于pandas merge 合并操作的讲解

    pandas 中的merge是一种功能比较强大的用于两个DataFrame或者Series进行合并的方法. 合并时会将所有的列进行合并,但是指定...

  • Ridge & Lasso & Elastic Net

     这边文章主要是记录自己对于Ridge & Lasson & Elastic Net的理解和总结.内容较为粗浅,偏向应用而没有太多的数学理论. ...

  • Resize,w 360,h 240
    学习曲线

    在机器学习中,模型的欠拟合和过拟合是需要格外注意的问题,同时也是经常发生的问题,其中过拟合最为常见. 欠拟合,即训练出的算法模型不足以表达数据间...

  • pandas中使用get_dummies和one-hot编码

    一: 为什么要用one-hot编码   在进行机器学习的模型训练时,通常在数据集中会遇到一些离散特征.  这些特征以int类型的数据形式存在于数...