240 发简信
IP属地:浙江
  • Resize,w 360,h 240
    MLSQL 开发环境配置指南

    MLSQL是一个非常棒的项目,为了更加了解该项目,我需要建立MLSQL的开发调试环境,由于项目目前已经比较成熟,搭建环境其实也比较简单,这里记录...

  • Resize,w 360,h 240
    典型日志系统架构及其缺点

    典型日志系统架构 典型的日志架构如图所示,简单介绍下基本流程 日志通过filebeat或者api写入到kafka或者其它队列系统,这个队列通常是...

  • 日志平台的核心需求

    简单总结下日志平台的核心需求,至少有以下2点: 1、数据分析 数据分析又分成2类,一类是预先定义好的分析逻辑,另一类是即时的,突发奇想的分析ad...

  • Resize,w 360,h 240
    spark structedStreaming是如何实现容错的

    sss如何实现eoc的 spark structed Streaming简称sss,它主要还是采用微批的模式提供端到端的eoc(exactly-...

  • 日志平台的一点思考

    我对日志平台的理解 日志平台的对开发、运维人员的帮助是非常大的,它可以方便开发、运维人员快速定位问题,从这个角度,日志平台是个搜索平台;同时还可...

  • 一种快速生成UUID的方式

    java8的uuid生成方式比较方便,但是速度不够快UUID.randomUUID().toString()我在自己电脑虚拟机上进行测试4cor...

  • Resize,w 360,h 240
    mlsql流任务实现distinct

    流计算场景里distinct很常用,spark sql对 stream dataset不支持 SELECT COUNT(DISTINCT Com...

  • Resize,w 360,h 240
    记录一次Flink作业异常的排查过程

    最近2周开始接手apache flink全链路监控数据的作业,包括指标统计,业务规则匹配等逻辑,计算结果实时写入elasticsearch. 昨...

  • 日志平台设计时考虑的一些问题

    日志其实也是一种时序数据,在典型的opentsdb中,时序数据模型包括metricname,value,ts(tiimestamp)以及若干ta...