240 发简信
IP属地:山东
  • Resize,w 360,h 240
  • Resize,w 360,h 240
    logistic 回归(内附推导)

    主要思考几个问题: 1、logistic回归的应用场景 Logistic回归是一种用于解决二分类问题的机器学习方法,是一种判别模型:表现为直接对...

  • Resize,w 360,h 240
    交叉验证梳理

    疑问: 为什么要分训练集、验证集、测试集? 为什么采用交叉验证? 交叉验证的应用场景是什么? 最终预测模型是怎么得到的? 预备知识:什么是超参数...

    0.6 4207 2 11 1
  • 1.1 Python科学计算生态

    1.1.1 为什么使用python 1.1.1.1 科学家的需求 获取数据(模拟、实验控制) 操作和处理数据 可视化结果、快速理解、绘制高质量图...

  • 随机森林的优缺点

    1、 在当前的很多数据集上,相对其他算法有着很大的优势,表现良好2、它能够处理很高维度的数据,并且不用做特征选择,因为特征子集是随机选择的3、在...

  • Resize,w 360,h 240
    基于python的全面数据探索(house prices)

    总体思路: 理解问题:查看每个变量并且根据他们的意义和对问题的重要性进行哲学分析。单因素研究:只关注因变量(SalePrice)并且进行更深入的...

  • 什么是过拟合,如何避免?

    过拟合:训练集上表现很好,但是在测试集上表现很差,泛化性能差。 降低过拟合的方法:(1)试着寻找最简单的假设(2)正则化(3)early sto...

  • 随机森林中oob以及oob的作用?

    在随机森林bagging法中可以发现booststrap每次约有1/3的样本不会出现在bootstrap所采集的样本集合中,故没有参加决策树的建...

    0.3 15129 0 6 1
  • gbdt和随机森林的区别?

    相同点:(1)都是由多棵树组成的,都是集成学习算法(2)最终的结果都是由多颗树一起决定 不同点:(1)组成随机森林的树可以是分类树,也可以是回归...

个人介绍
梦想还是要有的,万一实现了呢🤔🤔🍀🍀