SeekerLinJunYu

SeekerLinJunYu

IP属地：江苏

一次完整的数据挖掘的过程
任务描述 kaggle 案例 california-housing-priceshttps://www.kaggle.com/camnugent...

13.3 8833 7 138
如何进行一场数据挖掘算法竞赛
一. 为什么要参加竞赛? 二. 需要哪些技能? 三. 怎么选择比赛合适的比赛? 建议去kaggle学习. 里面大牛分享的想法 , 还有开源.c...

2.0 1815 0 13

对模型评价指标AUC的理解
AUC是一种衡量机器学习模型分类性能的重要且非常常用的指标,其只能用于二分类的情况.AUC的本质含义反映的是对于任意一对正负例样本,模型将正样本...

0.9 9862 0 10
关于交叉验证与偏差/方差的一连串理解
在机器学习训练模型时,对于数据集的划分其实是很重要的一个步骤.如果数据集划分出现问题,那么将会导致模型过拟合(over fitting)或者欠...

1.1 1592 0 4
关于OrdinalEncoder 、OneHotEncoder 、get_dummies、LabelEncoder的用法与作用
OrdinalEncoder / OneHotEncoder /get_dummies 三个方法都能够将离散的类别特征转换成由数字代表的类别特征...

0.2 7294 0 3
关于pandas merge 合并操作的讲解
pandas 中的merge是一种功能比较强大的用于两个DataFrame或者Series进行合并的方法. 合并时会将所有的列进行合并,但是指定...

4702 0 1
Ridge & Lasso & Elastic Net
这边文章主要是记录自己对于Ridge & Lasson & Elastic Net的理解和总结.内容较为粗浅,偏向应用而没有太多的数学理论. ...

0.2 1362 0 1

学习曲线
在机器学习中,模型的欠拟合和过拟合是需要格外注意的问题,同时也是经常发生的问题,其中过拟合最为常见. 欠拟合,即训练出的算法模型不足以表达数据间...

0.4 1377 0 1
pandas中使用get_dummies和one-hot编码
一: 为什么要用one-hot编码在进行机器学习的模型训练时,通常在数据集中会遇到一些离散特征. 这些特征以int类型的数据形式存在于数...

0.5 2285 0 1