hongshen - 简书

hongshen

IP属地：浙江

日志平台的核心需求
简单总结下日志平台的核心需求，至少有以下2点： 1、数据分析数据分析又分成2类，一类是预先定义好的分析逻辑，另一类是即时的，突发奇想的分析ad...

0.1 635 2 1
mlsql通过jdbc链接hive1.1.0版本时遇到的问题
我使用的是mlsql的master分支最新版本，1.3.0-snapshot，编译时选择的是spark2.4.3 版本不兼容的问题通过jdbc...

1122 0 0

使用spray json的一点小经验
一个scala常用的json工具 java里面的fastjson,gson,和Jackson是我最熟悉的json序列化框架，用起来没什么问题，接...

1174 0 0
MLSQL 开发环境配置指南
MLSQL是一个非常棒的项目，为了更加了解该项目，我需要建立MLSQL的开发调试环境，由于项目目前已经比较成熟，搭建环境其实也比较简单，这里记录...

0.2 2206 0 2
记录一次Flink作业异常的排查过程
最近2周开始接手apache flink全链路监控数据的作业，包括指标统计，业务规则匹配等逻辑，计算结果实时写入elasticsearch. 昨...

317 0 0
GraphQL是什么
最近看了一个项目用到了GraphQL 官网地址在这里哈，https://graphql.org/，简单说GraphQL是一种提供api接口的方式...

1360 0 0
mlsql流任务实现distinct
流计算场景里distinct很常用，spark sql对 stream dataset不支持 SELECT COUNT(DISTINCT Com...

0.3 530 0 1

一种快速生成UUID的方式
java8的uuid生成方式比较方便，但是速度不够快UUID.randomUUID().toString()我在自己电脑虚拟机上进行测试4cor...

0.1 1909 0 1
spark structedStreaming是如何实现容错的
sss如何实现eoc的 spark structed Streaming简称sss，它主要还是采用微批的模式提供端到端的eoc(exactly-...

0.1 1032 0 1