240 投稿
收录了67篇文章 · 146人关注
  • Resize,w 360,h 240
    MLSQL Stack 一键体验

    体验地址:http://docs.mlsql.tech/mlsql-console/blog/demo.html 命令 在终端执行如下指令: 注...

  • 是时候丢掉Spark Streaming 升级到Structured Streaming了

    前言 又是一个超长的标题(摊手┓( ´∀` )┏)。Spark Streaming 历史比较悠久,也确实非常好用,更重要的是,大家已经用熟了,有...

    0.5 祝威廉 9 16
  • Resize,w 360,h 240
    为什么去开发一个MLSQL

    算法和工程之殇 算法和工程结合,有两个非常大的痛点: 第一个,算法的着眼点是,用最快速的方式清洗一些数据出来,然后接着建模训练,评估预测效果,之...

    0.3 祝威廉 4 16 1
  • 数据部门起步阶段需要建立数仓么?

    之前我写了一篇关于数据中台和数仓的关系 的文章,里面理清了数仓和中台的关系。后面我了解到更通用的技术词汇去表达数据管理的两种方式: 数据联邦和数...

  • Resize,w 360,h 240
    Spark 2.0 Structured Streaming 分析

    前言 Spark 2.0 将流式计算也统一到DataFrame里去了,提出了Structured Streaming的概念,将数据源映射为一张无...

    0.9 祝威廉 13 26 1
  • MLSQL数据源开发指南

    前言 MLSQL支持标准的Spark DataSource数据源。典型使用如下: 那么我们如何实现自己的数据源呢?下面我们会分两部分,第一部分是...

  • StreamingPro使用教程

    准备工作 下载Spark 1.6.2 下载StreamingPro 我们假设你下载的StreamingPro包在/tmp目录下。 复制如下模板 ...

  • Resize,w 360,h 240
    产品和运营如何利用MLSQL完成excel处理

    概览 MLSQL Console 是一款集数据研发,数据分析,机器学习等于一体Web产品。他的目标是让产品,运营,分析师,研发,算法等都有一个统...

    3.6 祝威廉 1 26

专题公告

MLSQL unifies Big Data and Machine Learning