240 发简信
  • 用python辅助理解mapreduce的sort排序

    概念简介 map 含义是映射,即把一个值A变成另一个值B,这里的是B往往是被压缩后的信息。比如要从一组字符串中找出最长字符串,那么我需要先计算每...

  • Pandas实现常用SQL操作

    本文是写给有 SQL 基础,而对于 pandas 的 API 不够熟悉的同学的。将各种常见的 SQL 操作“翻译”成 pandas 的形式,从而...

  • 如何在命令行获取iPhone照片的宽和高?

    苹果手机(试过7和8,其他的没试过)拍摄的照片,有个问题,不管这张图在 Mac 上显示是竖图还是横图,其宽高值是一样的。 比如,有个图片叫 ve...

  • 120
    逻辑回归算法

    应用场景 算法服务于业务,有必要了解其商业应用背景。目前了解到的应用场景有信用卡反欺诈(是否敢给这个人办信用卡)、医学、制药业等。尽管可以进行多...

  • 置信区间 confidence interval

    预备知识 这里提到的内容可能在其他笔记中有出现,但是考虑到重复能够加深记忆,就这样吧。 随机变量之差的方差 已知条件:。 另有随机变量,那么有:...

  • 矩阵的特征值(一)基本性质

    定义 对于方阵构成的方程中,非平凡解被称为的特征向量,被称为的特征值。其含义在于向量经过矩阵描述的线性变换后,仍然和自身共线。比较特殊的是零向量...

  • Hive函数 - cube, rollup 详解

    使用场景 很多时候我们除了需要在报表中罗列出每个具体项的数据,还需要进行汇总,并且是不同维度的汇总。如果在展示表格的时候汇总,可能会比较慢,我们...

  • 矩阵求导入门

    机器学习中,往往是对整个数据集操作,“原子化”的运算过于繁琐,将其抽象成矩阵,使得思路更加清晰,也更便于转换成具体的代码。 基本定义 矩阵求导的...

  • 120
    拉格朗日乘子法

    学习背景:理解SVM时需要这部分背景知识。 对于条件最佳化constrained optimization,我们使用拉格朗日乘子法。所谓cons...