240 发简信
IP属地:上海
  • 120
    漫谈数据库中的join

    Prologue join是我们这些整天与数据打交道的人绕不开的一个词,不管是在传统的关系型数据库,还是在大数据领域的数据仓库/数据湖中,join都是常客。特别是对于OLAP...

  • 你们现在解决了吗?

    Hive bitmap udf

    背景 在hive中使用Roaring64Bitmap实现精确去重功能 主要目的:1.提升 hive 中精确去重性能,代替hive 中的 count(distinct uuid...

  • spark sql 使用这些udf会报错:Caused by: java.lang.ClassNotFoundException: org.roaringbitmap.ArraysShim,是什么原因呀

  • ClickHouse遇见RoaringBitmap

    Q&A Q:如图。 A:当然是自带的。其实RoaringBitmap正是ClickHouse位图的底层实现(笑 RoaringBitmap的预备知识请见这里。 在CH中产生位...

  • 连接数据库

    自身问题 一. 对自己写的代码不自信。二.遇到问题总是想着很难,自己解决不了。三.遇到问题喜欢退缩,不喜欢花时间。四.花费时间周期太长,要加快进度五.没有头绪 代码问题 a...

  • @_大叔_ :+1:

    hive导入到clickhouse的几种方式总结

    在开发过程中,需要从HDFS中导入数据到clickhouse中,探索了几种方式,以及一些坑与大家分享; Waterdrop 参考大神的文章,实现快速的安装,和相关配置如何快速...

  • 120
    SpringBoot框架:使用mybatis连接mysql数据库完成数据访问

    需要技术 java,MySql基本使用,mybatis技术的了解,maven基本安装使用,SpringBoot使用,git的使用,idea使用基础,mvc结构。 Java基础...

  • mindsdb 源码解析

    应用对接的方式包含: mysql mongodb http 三种方式都可以实现对于预测器的透出;当然我们常见的都是http或者mysql的方式; 下面介绍mysql的方式实现...

  • Dubbo中的设计模式

    最近在看阿里开源RPC框架Dubbo的源码,顺带梳理了一下其中用到的设计模式。下面将逐个列举其中的设计模式,并根据自己的理解分析这样设计的原因和优劣。 责任链模式 责任链模式...

  • 一定要自己画图

    MVC设计模式

    MVC是常用的设计模式之一,将程序分成三个层次分别是:视图模型层(V),控制器层(C),数据模型层(M) 好处: 1.程序结构灵活,清晰2.描述各个对象之间的通信方式3.降低...

  • 120
    MVC设计模式

    MVC是常用的设计模式之一,将程序分成三个层次分别是:视图模型层(V),控制器层(C),数据模型层(M) 好处: 1.程序结构灵活,清晰2.描述各个对象之间的通信方式3.降低...

  • 周学习复盘2021-11-07

    非常快的两个星期过去了,自己的状态还没有找回来,似乎在这两个星期停止了学习的脚步一样,感觉自己是一个遇到难就想逃避的一个人,明明知道解决这个难题会有非常大的进步,面对问题敢于...

  • 120
    代理模式

    代理模式学习 目的 提供一个代理者进入其他对象,并且能够控制它 例如,购买火车票不一定要去火车站买,可以通过 12306 网站或者去火车票代售点买。又如找女朋友、找保姆、找工...

  • 周学习复盘2021-10-25

    国庆回来状态挺好的意识到了自己还要学习的非常多,时间也不会有多少了,Java基础没有学完Mysql数据库上课也听不懂了,课后没有花时间去看,所以在上个星期一有时间就会去图书馆...

  • 周学习复盘2021-10-10

    国庆在家几乎就是没有心去学习,自己的打算是明天都学习,想着是每天都废寝忘食,想的好,但是没有一天是做到了的,这几天也是意识到时间实在是不多了,一刻也不能放纵自己,放松了,应该...

  • 知道和做到

    知道和做到是世界上最遥远的距离,每个人的脑子都有自己的打算,都有自己非常好的安排,非常好的想法,但是去仅仅是头脑上的知道,真正的做出来需要代价,知道要好好学习,行出来的不一样...

  • 暑假复盘

    一个暑假转眼间就过去了,在放假前还在考虑暑假要去干嘛,最后的选择还是挺喜乐的,先去培训了18天,这18天的收获还是挺大的,手机上交了,脱离了世界,早上每天都是6点起床,8点上...

  • Nessie 像git一样管理你的数据

    Nessie可以管理像git 分支,合并数据源等一些特性; 受git的版本管理启发 跨表事务和可见性 支持hive,spark,AWS Athena,dremio,管理其数据...

  • 120
    再谈基数估计之HyperLogLog算法

    前言 在很久(好像也没多久,4个月)之前,我曾经写了一篇和主业无关的有点意思的小文章《基数估计探秘:Linear Counting与Flajolet-Martin算法》。但是...