任务描述 kaggle 案例 california-housing-priceshttps://www.kaggle.com/camnugent...
一. 为什么要参加竞赛? 二. 需要哪些技能? 三. 怎么选择比赛合适的比赛? 建议去kaggle学习. 里面大牛分享的想法 , 还有开源.c...
AUC是一种衡量机器学习模型分类性能的重要且非常常用的指标,其只能用于二分类的情况.AUC的本质含义反映的是对于任意一对正负例样本,模型将正样本...
在机器学习训练模型时,对于数据集的划分其实是很重要的一个步骤.如果数据集划分出现问题,那么将会导致模型过拟合(over fitting)或者欠...
OrdinalEncoder / OneHotEncoder /get_dummies 三个方法都能够将离散的类别特征转换成由数字代表的类别特征...
pandas 中的merge是一种功能比较强大的用于两个DataFrame或者Series进行合并的方法. 合并时会将所有的列进行合并,但是指定...
这边文章主要是记录自己对于Ridge & Lasson & Elastic Net的理解和总结.内容较为粗浅,偏向应用而没有太多的数学理论. ...
在机器学习中,模型的欠拟合和过拟合是需要格外注意的问题,同时也是经常发生的问题,其中过拟合最为常见. 欠拟合,即训练出的算法模型不足以表达数据间...
一: 为什么要用one-hot编码 在进行机器学习的模型训练时,通常在数据集中会遇到一些离散特征. 这些特征以int类型的数据形式存在于数...