OLAP组件对比:Druid/Impala/Presto/Spark SQL/Kylin/Elasticsearch

olap
  • Druid :
    是一个实时处理时序数据的OLAP数据库,因为它的索引按照时间分片,查询的时候也是按照时间线去路由索引。
  • Kylin
    核心是Cube,Cube是一种预计算技术,基本思路是预先对数据作多维索引,查询时只扫描索引而不访问原始数据从而提速。
  • Presto:
    它没有使用MapReduce,大部分场景下比hive快一个数量级,其中的关键是所有的处理都在内存中完成
  • Impala:
    基于内存运算,速度快,支持的数据源没有Presto多。
  • Spark SQL:
    基于Spark平台上的一个OLAP框架,基本思路是增加机器来并行运算,从而提高查询速度。
  • ES:
    最大的特点是使用了倒排索引解决问题。ES在数据获取和聚集用的资源比在Druid高。

推荐阅读更多精彩内容