240 发简信
IP属地:广东
  • Scala 学习笔记

    Scala 学习笔记 1.函数式编程 函数式编程:函数式编程把函数当作一等公民,充分利用函数,支持函数的多种使用方式。在scala中,函数可以像...

  • Resize,w 360,h 240
    Scala实现:KD-Tree(k-dimensional tree)

    Scala实现:KD-Tree(k-dimensional tree) kd-tree是一种分割k维数据空间的数据结构。主要应用于多维空间数据的...

  • Spark 本地连接OSS

    Spark 本地连接OSS 1. 对象存储 OSS 阿里云对象存储服务(Object Storage Service,简称 OSS),是阿里云提...

  • 已知一点经纬度及与另一点距离和航向,求另一点经纬度

    本文结合Vincenty公式计算椭圆形地球模型目标点的方法 参考资料 http://www.movable-type.co.uk/scripts...

  • Flink 异步I/O

    1.为什么需要异步IO flink在做实时处理时,有时候需要和外部数据交互,但是通常情况下这个交互过程是同步的,这样就会产生大量的等待时间;而异...

  • 大数据之统计学基础(二):随机变量及其概率分布

    随机变量及其概率分布 随机变量(r.v)是研究随机试验中的一串事件:比如掷一颗骰子,用X表示骰子的点数,由于X的取值我们无法确定,所以称X是一个...

  • Spark DataFrame中rollup和cube使用

    我们平时在做报表的时候,经常会有各种分维度的汇总计算,在spark中我们最常用的就是groupBy操作,groupBy就是按照给定的字段名分组,...

  • 大数据之统计学基础(一) -- 描述统计

    描述统计 1.描述数据水平的统计量 平均数(平均数反映了一组数的平均水平,平均数会受到极端值的影响),在计算时一般使用算术平均数: 分位数:四分...