前言 先给MLSQL做个定义: MLSQL是首先是一门语言,SQL的超集。 这意味着他的门槛足够低,无论分析师,研发,算法,运营,产品经理都可以...
收录了67篇文章 · 146人关注
前言 先给MLSQL做个定义: MLSQL是首先是一门语言,SQL的超集。 这意味着他的门槛足够低,无论分析师,研发,算法,运营,产品经理都可以...
前言 MLSQL 由三部分构成: MLSQL Engine. MLSQL Cluster MLSQL 控制台(就是我们今天要介绍的) 一个MLS...
Spark Streaming 非常适合ETL。但是其开发模块化程度不高,所以这里提供了一套方案,该方案提供了新的API用于开发Spark St...
概览 MLSQL Console 是一款集数据研发,数据分析,机器学习等于一体Web产品。他的目标是让产品,运营,分析师,研发,算法等都有一个统...
前言 Spark 2.0 将流式计算也统一到DataFrame里去了,提出了Structured Streaming的概念,将数据源映射为一张无...
前言 又是一个超长的标题(摊手┓( ´∀` )┏)。Spark Streaming 历史比较悠久,也确实非常好用,更重要的是,大家已经用熟了,有...
算法和工程之殇 算法和工程结合,有两个非常大的痛点: 第一个,算法的着眼点是,用最快速的方式清洗一些数据出来,然后接着建模训练,评估预测效果,之...
昨天还是前天,正好看到朋友圈里大家都在发AI前线推的一篇文章。数据中台已成下一风口,它会颠覆数据工程师的工作吗?, 个人认为风口谈不上,但是确实...
先看看做算法有哪些痛点(我们假设大部分算法的代码都是基于Python的): 项目难以重现,可阅读性和环境要求导致能把另外一个同事写的python...
专题公告
MLSQL unifies Big Data and Machine Learning