我正在使用elasticsearch 0.90.2和elasticsearch-river-mongodb 1.7.0从mongodb的oplog中检索数据。在我要索引的集合中,我有成千上万的结构化记录,我们仅将它们命名为“ field1”,“ field2”,“ field3” ...“ field10”
有没有办法只索引“ field1”和“ field2”?这些作为字符串还是日期对象有关系吗?
谢谢
我从未使用过River插件,但我知道的一件事是,您可以通过映射或模板来控制字段的索引。对于每个字段,您可以在映射或模板中将属性“索引”指定为三个不同的选项:analysted,not_analyzed,no。这是官方文档。
设置为分析后,使用分析器将其分解为令牌后将要索引和可搜索的字段。not_analyzed表示其仍可搜索,但不经过任何分析过程或分解为标记。no表示根本无法搜索(作为单个字段;它仍可能包含在_all中)。设置为no将禁用include_in_all。默认为分析。
如果希望您的字段仍可搜索,请使用“ not_analyzed”,否则为“ no”。字段的类型应该无关紧要。
这是官方网站上的映射示例
{
"tweet" : {
"properties" : {
"user" : {"type" : "string", "index" : "not_analyzed"},
"message" : {"type" : "string", "null_value" : "na"},
"postDate" : {"type" : "date"},
"priority" : {"type" : "integer"},
"rank" : {"type" : "float"}
}
}
}
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句