240 发简信
IP属地:陕西
  • @祝威廉 ok,我试试.多谢

    为什么说Spark SQL远远超越了MPP SQL

    Apache Spark Future 吐槽Spark,其实我看了半天没看懂他在说啥。不过总体而言DataBricks公司目前很多的做法其实蛮合我的理念的。 前言 这里说的并...

  • @祝威廉 谢谢!再请教一个问题.目前常驻的thriftserver,如果交互式查询qps比较高的话,thriftserver会出现由于full gc导致的stw.看了一下heap dump,发现MemoryStore#entries占用比较多空间.有什么调优建议么?
    (有点伸手党了,主要没想到好的办法)

    为什么说Spark SQL远远超越了MPP SQL

    Apache Spark Future 吐槽Spark,其实我看了半天没看懂他在说啥。不过总体而言DataBricks公司目前很多的做法其实蛮合我的理念的。 前言 这里说的并...

  • 对于并发查询有什么实践经验吗?
    单个thriftserver实时查询会被大查询阻塞

    为什么说Spark SQL远远超越了MPP SQL

    Apache Spark Future 吐槽Spark,其实我看了半天没看懂他在说啥。不过总体而言DataBricks公司目前很多的做法其实蛮合我的理念的。 前言 这里说的并...

  • 编译jdk(mac)

    之前都是想看啥源码就直接搜grepcode上面的看看。最近闲了,就在看tcp ip相关,想着从user层一步步怎么走到kernel的。就想编译一下openjdk玩玩,基本步骤...

  • mit6.824-(lab1)

    mit-6.824 lab1文档这部分是实现和理解mapreduce论文,实现简单的mapreduce框架 主要设计点 先执行完map再执行reduce 没有在map之后对同...

  • mit6.824-(lab1)

    mit-6.824 lab1文档这部分是实现和理解mapreduce论文,实现简单的mapreduce框架 主要设计点 先执行完map再执行reduce 没有在map之后对同...

  • 线上运维-memcache timeout

    首先介绍一下:netstat netstat有两个重要的指标: recv-Q 表示网络接收队列表示收到的数据已经在本地接收缓冲,但是还有多少没有被进程取走,recv()如果接...

个人介绍
西交-》浙大,关注后端,分布式等等,偶尔跟踪下ml的paper
网易-》小米(now) 码农

github:
https://github.com/canezk
https://github.com/caneGuy
领英:
http://www.linkedin.com/in/%E5%BA%B7-%E5%91%A8-8a5529a2?trk=nav_responsive_tab_profile_pic