240 发简信
IP属地:北京
  • 防御性SQL

    SQL中增加防御性 接到产品一个的临时跑数需求,如下: 近30天的uva表中条件c1b表中条件c2c表中条件c3 以上业务虽然很简单,但是对于上...

  • 好的开发者应该拥有强大的抽象能力

    笔者在这篇文章[https://www.jianshu.com/p/3fc9b458bdab]中提到了如何使用SQL来完成时间段的一个合并,在完...

  • SQL中时间段合并

    问题:现有一堆的时间段,s表示开始时间,e表示结束时间。需要将所有时间段合并。合并规则: 如果2个时间段有重叠则合并成一个时间。 不重叠则作为一...

  • SQL中的集合优化

    今天写SQL的时候有个逻辑是要取2个时间窗口有交集的数据,过滤条件如下:2个时间窗大小 [start_time1, end_time1] 和 [...

  • 利用数据湖特性加速数据校验

    数据湖自身会提供一些元数据的信息,我们可以利用这些信息进行快速粗略的数据校验 分区数据数校验 以Iceberg为例,catalog.db.tb2...

  • Rust和大数据

    笔者从事大数据行业,最近对Rust语言比较感兴趣,特地关注了一下Rust在大数据生态中的建设情况,以下是一些由Rust编写的大数据框架,感兴趣的...

  • 数仓开发的一些业务素养

    近期组内产品分享了关于指标的一些内容,其中最令我印象深刻的就是指标体系的构建,虽说在日常的业务开发中很多概念,比如活跃,留存,激活等都是明白的,...

    0.5 75 0 2
  • 关于软件架构设计的几点想法

    今天在看《Computer Networks:A Systems Approach》,读到这段的时候有些感触,基本涵盖了整个软件架构(开发)的整...

  • 留存概念

    这几天做一个有留存指标的需求,发现对留存的理解有点想当然了。留存是当天有A行为,在第二天有B行为的用户群体。一般来讲A和B是相同的,但是有些时候...