240 发简信
IP属地:四川
  • ES中文分词器之精确短语匹配(解决了match_phrase匹配不全的问题)

    分词器选择 调研了几种分词器,例如IK分词器,ansj分词器,mmseg分词器,发现IK的分词效果最好。举个例子: 在上述例子中,IK和Mmsg...

    1.0 45035 7 22 1
  • parquet常用操作

    1、创建parquet表 1.1、创建内部表 网上有第二种创建方法: 第一种是hive0.13之后的版本,第二种时0.13之前的版本。目前大都是...

  • ES 查询优化(一)

    1、能用term就不用match_phrase The Lucene nightly benchmarks show that a simple...

  • keepalived保证mysql主从自动切换

    关于mysql主从配置请查看文章:https://www.jianshu.com/p/86eac0db552b。本篇将的是如何用keepaliv...

  • ES节点丢失导致实时数据导入速度特别慢

    一个节点死机了,无法自动重启。通过logtash导数据,由于当天入的数据是0备份,节点丢失后,某些shard丢失,导致集群一直处于red状态。节...

  • Resize,w 360,h 240
    ES-Spark连接ES后,ES Client节点流量打满分析

    问题描述 前段时间用es-spark读取es数遇到了client节点流量打满的现象。es-spark配置的es.nodes是es的域名。由于其中...

  • ES 深度分页scroll使用方式

    我们知道ES对于from+size的个数是有限制的,二者之和不能超过1w。当所请求的数据总量大于1w时,可用scroll来代替from+size...

  • ES查询常见问题

    1 must嵌套should条件查询 注意:1)如果must或者should中用到多个条件,每个条件必须用大括号括起来,嵌套的bool查询必须从...

  • kudu简介与操作方式

    1、kudu整体介绍 Kudu是cloudera开源的运行在hadoop平台上的列式存储系统,拥有Hadoop生态系统应用的常见技术特性,运行在...