如题:elasticsearch 从 _source 与 stored_fields 获取数据不一致?
大伙都知道,使用 elasticsearch 进行数据存储的时候,查询数据会默认存储在_source中,但是若开启了 store 存储(默认关闭),那么,就可以使用 stored_fields 进行查询。
但是查询出来的数据,有时候会和预想的结果不一致,那么我们来探究一下。
探索设置一个mapping
PUT store_test_document{ "mappings": { "properties": { "title": { "type": "text", "store": true }, "date": { "type": "date", "store": true }, "content": { "type": "text" } } }}
将 title 与 date 两个字段 store设置为 true,那么,这两个字段将能被 stored_fields 所查询。
接下来存储一条数据
PUT store_test_document/_doc/1{ "title": "Some short title", "date": "2022-02-13", "content": "A very long content field..."}
先进行普通查询:
GET store_test_document/_search{ "_source": [ "title", "date" ]}{ "_index" : "store_test_document", "_type" : "_doc", "_id" : "1", "_score" : 1.0, "_source" : { "date" : "2022-02-13", "title" : "Some short title" }}
我们能看到结果数据和预期的一致,那么再进行 stored_fields 查询呢?
GET store_test_document/_search{ "stored_fields": [ "title", "date" ]}{ "_index" : "store_test_document", "_type" : "_doc", "_id" : "1", "_score" : 1.0, "fields" : { "date" : [ "2022-02-13T00:00:00.000Z" ], "title" : [ "Some short title" ] }}
我们发现,查询的结果并不是我们所希望的,它被数组所包装,那么这是为什么呢?其实,官方文档已经给出了解释。
For consistency, stored fields are always returned as an array because there is no way of knowing if the original field value was a single value, multiple values, or an empty array.
If you need the original value, you should retrieve it from the _source field instead.
由于不清楚使用的人会存啥,所以都以数组的形式进行存储。
如果需要返回原始的值,那么还是得使用 _source 进行查询。