240 发简信
IP属地:四川
  • ES中文分词器之精确短语匹配(解决了match_phrase匹配不全的问题)

    分词器选择 调研了几种分词器,例如IK分词器,ansj分词器,mmseg分词器,发现IK的分词效果最好。举个例子: 在上述例子中,IK和Mmsg...

    1.0 45012 7 22 1
  • Resize,w 360,h 240
    ES-Spark连接ES后,ES Client节点流量打满分析

    问题描述 前段时间用es-spark读取es数遇到了client节点流量打满的现象。es-spark配置的es.nodes是es的域名。由于其中...

  • Resize,w 360,h 240
    ES中文分词器之精确短语匹配(自定义分词器)

    楼主在上篇文章中,提出了将词和字分开,用不同的分词器分别构建索引,来解决match_phrase在中文中的短语或者句子匹配问题。详细的内容请看上...

  • kudu简介与操作方式

    1、kudu整体介绍 Kudu是cloudera开源的运行在hadoop平台上的列式存储系统,拥有Hadoop生态系统应用的常见技术特性,运行在...

  • keepalived保证mysql主从自动切换

    关于mysql主从配置请查看文章:https://www.jianshu.com/p/86eac0db552b。本篇将的是如何用keepaliv...

  • ES 查询优化(一)

    1、能用term就不用match_phrase The Lucene nightly benchmarks show that a simple...

  • logstash 重复消费kafka问题

    前两天业务方突然找到我说当天索引ES查询很慢,原来毫秒级的查询现在竟然要20s,让我处理下。我看了下索引大小,原来是1分片6g左右,今天突然就变...

  • ES集群如何做到高可用

    ES集群的高可用可分为读高可用、写高可用与发生改变(集群状态改变)时高可用。其实这么说不是很准确,因为部分集群状态的改变会影响读和写的高可用。读...

  • Python3编码与mysql编码介绍

    Python3自诩解决了编码问题,但还是有一系列的坑。本文就记录下前几天遇到的python3编码问题。mysql编码问题附带介绍。 python...