240 发简信
  • 数据的一些思考

    一、背景 最近领导和团队沟通,想提高数据建模团队的能力。结合自己工作的经验和朋友的交流,来总结下如何去做。 二、我做过什么 很多大数据数据仓库人...

    0.1 1 0 1
  • 120
    数据分析03 - 决策树

    标签(空格分隔): 数据分析 CART 创建决策树做分类 分类树如下: CART 回归树做预测

    0.2 0 1 1
  • 120
    数据分析02 - 线性回归

    可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回...

    0.1 1 0 1
  • 数据分析01 - 规范化方法

    标签(空格分隔): 数据分析 Min-max 规范化将原始数据规范到[0-1]之间,公式如下: 代码实现: 2.Z-Score规范化 假设 A ...

    0.1 1 0 1
  • Python简易的HTTP服务器

    python 3 python 2 即可以当前所在目录为Server的根目录,然后访问 http://localhost:8080/ 即可看到所...

  • 120
    GreenPlum的那些事《七》——GP监控小工具

    今天搞了一个监控GP的demo,直接上图,可丰富的功能还很多,该项目引用率开源项目:https://github.com/sqshq/sampl...

    0.2 21 0 1
  • GreenPlum的那些事《六》——时间计算

    计算小时 计算分钟 计算秒 可以看到上面 都是求取时分秒的差,不是整体的时间差,只是取了对应的位。 下面是求取真正的相差多少秒,然后可以根据秒求...

    0.2 87 0 2
  • 浅谈数据中台

    标签(空格分隔): 数据仓库 一、什么是数据中台 数据中台的概念最是阿里提出来的是为了实现数据的分层和水平解耦,提供数据服务能力。看了那么多中台...

  • GreenPlum的那些事《五》——浅谈GPDB中的资源队列

    资源队列介绍 当你安装好数据库的时候就会有一个默认的资源队列 pg_default,所有用户默认使用该队列。GPDB建议你对不同类型的用户建立不...

个人介绍
欢迎关注公众号:数据社