简单总结下日志平台的核心需求,至少有以下2点: 1、数据分析 数据分析又分成2类,一类是预先定义好的分析逻辑,另一类是即时的,突发奇想的分析ad...
我使用的是mlsql的master分支最新版本,1.3.0-snapshot,编译时选择的是spark2.4.3 版本不兼容的问题 通过jdbc...
一个scala常用的json工具 java里面的fastjson,gson,和Jackson是我最熟悉的json序列化框架,用起来没什么问题,接...
MLSQL是一个非常棒的项目,为了更加了解该项目,我需要建立MLSQL的开发调试环境,由于项目目前已经比较成熟,搭建环境其实也比较简单,这里记录...
最近2周开始接手apache flink全链路监控数据的作业,包括指标统计,业务规则匹配等逻辑,计算结果实时写入elasticsearch. 昨...
最近看了一个项目用到了GraphQL 官网地址在这里哈,https://graphql.org/,简单说GraphQL是一种提供api接口的方式...
流计算场景里distinct很常用,spark sql对 stream dataset不支持 SELECT COUNT(DISTINCT Com...
java8的uuid生成方式比较方便,但是速度不够快UUID.randomUUID().toString()我在自己电脑虚拟机上进行测试4cor...
sss如何实现eoc的 spark structed Streaming简称sss,它主要还是采用微批的模式提供端到端的eoc(exactly-...