240 发简信
  • 如何让简书支持目录?

      最近重启开始写blog了,一开始本来想自己搭一个博客但试了几个之后,最终结论是不如直接找个第三方平台来的简单,so最终选择回归简书。但简书有...

  • [JVM] GC调优

    最近遇到一些jvm上的问题,查了一些资料,基本解决问题了,下面这些文章写得非常好,值得仔细读一读。 垃圾收集简介 - GC参考手册 Java中的...

  • Elasticsearch之映射与分析

    倒排索引 Elasticsearch 使用一种称为 倒排索引 的结构,它适用于快速的全文搜索。一个倒排索引由文档中所有不重复词的列表构成,对于其...

  • Google工程规范指南[译]

    1 简介    Google具有许多涵盖所有语言和所有项目的通用工程实践,这些文档代表了我们随着时间的推移积累的各种最佳实践的集体经验。开源项目...

  • 120
    Elasticsearch之分片内部原理

    使文本可被搜索 最好的支持 一个字段多个值 需求的数据结构是我们在 倒排索引 章节中介绍过的 倒排索引 。 倒排索引包含一个有序列表,列表包含所...

  • 120
    Elasticsearch之执行分布式检索

    一个 CRUD 操作只对单个文档进行处理,文档的唯一性由 _index, _type, 和 routing values (通常默认是该文档的 ...

  • Elasticsearch之索引管理

    删除索引 用以下的请求来 删除索引: 对一些人来说,能够用单个命令来删除所有数据可能会导致可怕的后果。如果你想要避免意外的大量删除, 你可以在你...

  • Elasticsearch之数据输入与输出

    文档元数据 一个文档不仅仅包含它的数据 ,也包含 元数据 —— 有关 文档的信息。 三个必须的元数据元素如下: _index,文档在哪存放一个索...

  • [Hadoop] 自定义InputFormat文件输入格式

    最近在着手公开数据Common Crawl的解析,commoncrawl提供的数据有三类格式: 我们需要的是网页正文的数据wet file。如果...

个人介绍
分享知识,记录思考