240 发简信
  • 120
    主成分分析(PCA)教程(1)

    主成分分析(PCA)是现代数据分析的主要方法之一,它被广泛使用但其内在机制仍不为太多人理解。这篇文章的主旨就是厘清并解释其原理。这篇教程不仅能帮...

    0.4 1975 11
  • 标准化与归一化 with Scikit-learn

    1. 范数公式 L0 范数:所有非零元素个数 L1 范数: L2 范数: Lp 范数: 2. 标准化(Standardization) 对于一个...

  • Python中sorted方法与operator.itemgetter方法的共用

    Python中的sorted函数和operator.itemgetter可以说经常一起用,主要是处理一些复杂的排序问题的时候。 operator...

  • 10行代码实现kNN算法

    使用 numpy 库,只需 10 行简单的代码就能实现 k 近邻算法。 算法逻辑 对要分类的点(X)进行下列运算: 计算 X 与已知分类的所有点...

    0.1 547 2
  • 数据预处理与特征工程初步

    Intro 使用鸢尾花数据集: 其中features是特征矩阵,labels是真实分类。 1. 预处理(preprocessing) 1.1 预...

    0.1 526 1
  • 120
    不只是线性回归(2):多重共线性与正则化

    Intro 线性回归(Linear Regression)是机器学习的基本方式,但为了提升其性能,人们发明了无数优化方式。这个“不只是线性回归”...

  • 120
    不只是线性回归(1):稳健回归

    Intro 线性回归(Linear Regression)是机器学习的基本方式,但为了提升其性能,人们发明了无数优化方式。这个“不只是线性回归”...

  • 120
    最大似然估计、最大后验概率与贝叶斯估计

    Intro 众所周知,机器学习的过程一般分两个要点,第一是“模型”,第二是“优化”。“模型”这一点很好理解,就是要找到适合用于解决手头上预测问题...

    0.2 2312 13
  • 120
    互联网金融用户增长数据模型

    Intro 最近很集中地系统梳理了互金理财行业在用户增长(Growth)方面的 methodology 与 practice,尝试以文章的形式予...

    0.2 2505 8