Flieddata

Most fields are indexed by default, which makes them searchable. Sorting, aggregations, and accessing field values in scripts, however, requires a different access pattern from search.
大多数字段默认是被索引了的,索引使他们可检索。排序、聚合和访问字段值在脚本中,然而,需要从搜索中获得一个不同的访问模式。

Search needs to answer the question "Which documents contain this term?", while sorting and aggregations need to answer a different question: "What is the value of this field for this document?".
搜索需要回答这个问题“哪个文档包含这分词?”,同时排序和聚合需要回答不同的问题“这个文档的字段值是什么?”

Most fields can use index-time, on-disk doc_values
for this data access pattern, but text fields do not support doc_values.
大多数字段可以使用 index-time(文档索引时间), 磁盘上的 doc_values(文档值)为这个数据的访问模式,但是"text"类型的字段不支持 doc_values 。

注释:doc_values文档值是磁盘上的数据结构,它建立在文档索引时间内,这使得数据访问模式成为可能。几乎所有字段类型都支持文档值,其中分析字符串字段的显着例外。所有支持文档值的字段默认启用它们。如果您确信不需要在字段上排序或聚集,或从脚本中访问字段值,则可以禁用文档值以节省磁盘空间。

Instead, text fields use a query-time in-memory data structure called fielddata. This data structure is built on demand the first time that a field is used for aggregations, sorting, or in a script. It is built by reading the entire inverted index for each segment from disk, inverting the term ↔︎ document relationship, and storing the result in memory, in the JVM heap.
相反,文本字段使用 fielddata 一个在内存中的数据结构里的 query-time(查询时间)。这个数据结构被构建在首次一个字段被使用与聚会、排序、或在脚本中的时候。它是通过读取磁盘的每个段的全部倒排索引来建立的。颠倒这个分词 ↔︎ 文档关系 并在JVM 堆栈 内存中存储这个结果。

Fielddata is disabled on text fields by default

Fielddata can consume a lot of heap space, especially when loading high cardinality text fields. Once fielddata has been loaded into the heap, it remains there for the lifetime of the segment. Also, loading fielddata is an expensive process which can cause users to experience latency hits. This is why fielddata is disabled by default.
Fielddata 会消耗大量的堆空间,尤其是加载高基数的文本字段时。一旦 fielddata 已经被加载进入堆栈,它保留在那里直到段的一生。同时,加载 fielddata 是一个昂贵的过程,它会引起用户经历延迟的攻击。这就是为什么 fielddata 默认被禁用的原因。

If you try to sort, aggregate, or access values from a script on a text field, you will see this exception:
如果你尝试排序、聚合或访问来自一个文本字段的脚本中的值,你讲看到这个例外:

Fielddata is disabled on text fields by default. Set fielddata=true on [your_field_name] in order to load fielddata in memory by uninverting the inverted index. Note that this can however use significant memory.
Fielddata 在文本字段中默认被禁用。Set fielddata=true on [your_field_name] 的目的是为了加载 fielddata 到内存里通过反逆转这个倒排索引。注意,这会使用大量的内存。

Before enabling fielddata

Before you enable fielddata, consider why you are using a text field for aggregations, sorting, or in a script. It usually doesn’t make sense to do so.
在你激活 fielddata 之前,就聚合、排序或在一个脚本里而言,思考为什么你要使用一个文本字段?这通常是没有意义的。

A text field is analyzed before indexing so that a value like New York can be found by searching for new or for york. A terms aggregation on this field will return a new bucket and a york bucket, when you probably want a single bucket called New York.
索引之前分析一个文本字段,以便通过搜索“new” 或 “york”能发现像“New York”这样的值。当你想要一个单一的New York桶的时候,在这个字段上的一个分词聚合将返回一个 new 桶和一个 york 桶。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,847评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,208评论 1 292
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,587评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,942评论 0 205
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,332评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,587评论 1 218
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,853评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,568评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,273评论 1 242
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,542评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,033评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,373评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,031评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,073评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,830评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,628评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,537评论 2 269

推荐阅读更多精彩内容

  • **2014真题Directions:Read the following text. Choose the be...
    又是夜半惊坐起阅读 8,577评论 0 23
  • 目前国内的医疗资源分布不平衡,医院医生信息不对称,想找对一个医生对普通人来说实在不是件容易的事情。就医前患者通常面...
    子凌阅读 622评论 0 2
  • 时隔一年零四个月,我又回到了这里,大焦作!是的,大焦作,至少我觉得他是大的,我和我的朋友们一直这样叫他。 今天是清...
    宋不走阅读 191评论 0 0
  • vhjhhuisnwbbjjsjbbdbjsjj
    仇志轩阅读 185评论 0 5