240 发简信
IP属地:浙江
  • 日志平台的核心需求

    简单总结下日志平台的核心需求,至少有以下2点: 1、数据分析 数据分析又分成2类,一类是预先定义好的分析逻辑,另一类是即时的,突发奇想的分析ad...

  • mlsql通过jdbc链接hive1.1.0版本时遇到的问题

    我使用的是mlsql的master分支最新版本,1.3.0-snapshot,编译时选择的是spark2.4.3 版本不兼容的问题 通过jdbc...

  • 使用spray json的一点小经验

    一个scala常用的json工具 java里面的fastjson,gson,和Jackson是我最熟悉的json序列化框架,用起来没什么问题,接...

  • Resize,w 360,h 240
    MLSQL 开发环境配置指南

    MLSQL是一个非常棒的项目,为了更加了解该项目,我需要建立MLSQL的开发调试环境,由于项目目前已经比较成熟,搭建环境其实也比较简单,这里记录...

  • Resize,w 360,h 240
    记录一次Flink作业异常的排查过程

    最近2周开始接手apache flink全链路监控数据的作业,包括指标统计,业务规则匹配等逻辑,计算结果实时写入elasticsearch. 昨...

  • GraphQL是什么

    最近看了一个项目用到了GraphQL 官网地址在这里哈,https://graphql.org/,简单说GraphQL是一种提供api接口的方式...

  • Resize,w 360,h 240
    mlsql流任务实现distinct

    流计算场景里distinct很常用,spark sql对 stream dataset不支持 SELECT COUNT(DISTINCT Com...

  • 一种快速生成UUID的方式

    java8的uuid生成方式比较方便,但是速度不够快UUID.randomUUID().toString()我在自己电脑虚拟机上进行测试4cor...

  • Resize,w 360,h 240
    spark structedStreaming是如何实现容错的

    sss如何实现eoc的 spark structed Streaming简称sss,它主要还是采用微批的模式提供端到端的eoc(exactly-...