240 发简信
  • 损失函数之交叉熵

    一、交叉熵的由来 信息量香农提出的“信息熵”, 是用来解决信息量化问题。信息的不确定性越强, 需要用来表达的数据量也就越多。事件的不确定性通常是...

  • 120
    深度模型Attention

    Attention机制源于对Seq2Seq模型的几个问题优化。Seq2Seq是基于Encoder-Decoder架构思想实现。Encoder和D...

    0.2 1062 0 10
  • 120
    SVM支持向量机

    SVM是数据挖掘算法中比较复杂难懂的,反复观看斯坦福机器学习的视频, 以及网上零散学习各种数学和SVM相关资料, 对SVM还只能算有个粗浅的理解...

  • 特征工程之缺失值与离群值处理

    缺失值处理方式 删除 均值缺点:当缺失数据不是随机数据时会产生偏差.对于正常分布的数据可以使用均值代替, 中位值数据是倾斜的,使用中位数比均值可...

  • 回归系列之逻辑回归

    逻辑回归是回归系列中一个分类模型,而且是一个二分类模型。逻辑回归模型简单但应用广泛,本文从模型介绍、适用场景以及优缺点等几个方面介绍下。 模型介...

  • 120
    回归系列之L1和L2正则化

    机器学习监督算法的基本思路是 让拟合的模型尽量接近真实数据, 换句更通俗的话, 要让我们的模型尽量简单又能很好的反应已知数据之间关系。在这个贴近...

    0.2 23572 2 33 1
  • 120
    回归系列之梯度下降

    上一篇文章中,线性回归关键问题之一:求解系数的方法梯度下降。梯度下降在数据挖掘很多算法中都有应用, 属于比较基本的数学基础方法, 本文对此算法进...

  • 回归系列之线性回归的关键问题

    如上篇文章, 岭回归、Lasso回归和ElasticNet 回归都是以普通的线性回归为基础,先列举下线性回归的模型公式: 岭回归为解决共线性问题...

  • 120
    回归系列之入门篇

    常见回归算法基础概念,参见下如下文章,个人感觉是介绍比较好的文章: 7 Types of Regression Techniques you s...