在Elasticsearch中为pdf编制索引时出现mapper_parsing_exception错误

帕万奇

我正在尝试使用elasticsearch 2.3.4和python为PDF编制索引。想要从pdf提取文本和元数据到索引。使用mapper_attachment插件。

当我尝试编制索引时,出现“ mapper_parsing_exception”错误。以下是我的代码,

#Configuration

DIR = 'D:/QA_Testing/testing/data'
ES_HOST = {"host" : "localhost", "port" : 9200}
INDEX_NAME = 'testing'
TYPE_NAME = 'documents'
URL = "D:/xyz.pdf"

es = Elasticsearch(hosts = [ES_HOST])

mapping = {
  "mappings": {
    "documents": {
      "properties": {
        "cv": { "type": "attachment" }
}}}}

file64 = open(URL, "rb").read().encode("base64")
data_dict = {'cv': file64}
data_dict = json.dumps(data_dict)

res = es.indices.create(index = INDEX_NAME, body = mapping)

es.index(index = INDEX_NAME, body = data_dict ,doc_type = "attachment", id=1)

错误:

Traceback (most recent call last):
  File "C:/Users/537095/Desktop/QA/IndexingWorkspace/MainWorkspace/index3.py", line 51, in <module>
    es.index(index = INDEX_NAME, body = data_dict ,doc_type = "attachment", id=1)
  File "C:\Python27\lib\site-packages\elasticsearch\client\utils.py", line 69, in _wrapped
    return func(*args, params=params, **kwargs)
  File "C:\Python27\lib\site-packages\elasticsearch\client\__init__.py", line 261, in index
    _make_path(index, doc_type, id), params=params, body=body)
  File "C:\Python27\lib\site-packages\elasticsearch\transport.py", line 329, in perform_request
    status, headers, data = connection.perform_request(method, url, params, body, ignore=ignore, timeout=timeout)
  File "C:\Python27\lib\site-packages\elasticsearch\connection\http_urllib3.py", line 106, in perform_request
    self._raise_error(response.status, raw_data)
  File "C:\Python27\lib\site-packages\elasticsearch\connection\base.py", line 105, in _raise_error
    raise HTTP_EXCEPTIONS.get(status_code, TransportError)(status_code, error_message, additional_info)
RequestError: TransportError(400, u'mapper_parsing_exception', u'failed to parse')

我做错什么了吗?

您需要更改doc_type,应该更改documents而不是attachment

es.index(index = INDEX_NAME, body = data_dict ,doc_type = "documents", id=1)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

mapper_parsing_exception为自定义分析器,同时在Elasticsearch中创建索引?

来自分类Dev

Elasticsearch 6.5.4 中的 mapper_parsing_exception

来自分类Dev

Elasticsearch中的mapper_parsing_exception(原因:未为字段[X]指定类型)

来自分类Dev

在弹性搜索6.4.0中创建索引时使用mapper_parsing_exception

来自分类Dev

邮递员中的“mapper_parsing_exception”错误

来自分类Dev

mapper_parsing_exception | Elasticsearch | 全球序数

来自分类Dev

Elasticsearch:升级到7.9.3后无法创建索引(mapper_parsing_exception)

来自分类Dev

当使用decode_json_fields时,elasticsearch filebeat mapper_parsing_exception

来自分类Dev

将 Elasticsearch 从 5.5.1 降级到 2.1.0 mapper_parsing_exception

来自分类Dev

MongoConnector mapper_parsing_exception 与来自 Mongodb 的 elasticsearch

来自分类Dev

新的Elasticsearch 2.1.1版本中的mapper_parsing_exception

来自分类Dev

Elasticsearch中的索引编制

来自分类Dev

elasticsearch mapper_parsing_exception根映射定义的参数不受支持

来自分类Dev

Rails __elasticsearch __。create_index!“根映射定义具有不受支持的参数(mapper_parsing_exception)”

来自分类Dev

在Elasticsearch中克隆索引和为其重新编制索引有什么区别?

来自分类Dev

Swift数组下标索引编制中的错误?

来自分类Dev

确保Elasticsearch中的自动索引编制时不会发生重复

来自分类Dev

ElasticSearch-使用Java API为大型文件编制索引

来自分类Dev

索引编制期间Elasticsearch MapperParsingException [无法解析,文档为空]

来自分类Dev

索引编制期间Elasticsearch MapperParsingException [无法解析,文档为空]

来自分类Dev

ElasticSearch-使用Java API为大型文件编制索引

来自分类Dev

如何使Google桌面为可搜索的pdf编制索引

来自分类Dev

Logstash JSON 序列化在有效 JSON 上失败(mapper_parsing_exception)

来自分类Dev

将数据索引到Elasticsearch中时出现批量API错误

来自分类Dev

在映射已经存在的Elasticsearch索引中的新字段时遇到错误action_request_validation_exception

来自分类Dev

ElasticSearch中令人难以置信的缓慢索引编制

来自分类Dev

从mongodb仅对ElasticSearch中的某些字段编制索引

来自分类Dev

错误无效格式:在ElasticSearch中为日志建立索引时[ISO8601]

来自分类Dev

如何在Haystack中为CommentsField编制索引?

Related 相关文章

  1. 1

    mapper_parsing_exception为自定义分析器,同时在Elasticsearch中创建索引?

  2. 2

    Elasticsearch 6.5.4 中的 mapper_parsing_exception

  3. 3

    Elasticsearch中的mapper_parsing_exception(原因:未为字段[X]指定类型)

  4. 4

    在弹性搜索6.4.0中创建索引时使用mapper_parsing_exception

  5. 5

    邮递员中的“mapper_parsing_exception”错误

  6. 6

    mapper_parsing_exception | Elasticsearch | 全球序数

  7. 7

    Elasticsearch:升级到7.9.3后无法创建索引(mapper_parsing_exception)

  8. 8

    当使用decode_json_fields时,elasticsearch filebeat mapper_parsing_exception

  9. 9

    将 Elasticsearch 从 5.5.1 降级到 2.1.0 mapper_parsing_exception

  10. 10

    MongoConnector mapper_parsing_exception 与来自 Mongodb 的 elasticsearch

  11. 11

    新的Elasticsearch 2.1.1版本中的mapper_parsing_exception

  12. 12

    Elasticsearch中的索引编制

  13. 13

    elasticsearch mapper_parsing_exception根映射定义的参数不受支持

  14. 14

    Rails __elasticsearch __。create_index!“根映射定义具有不受支持的参数(mapper_parsing_exception)”

  15. 15

    在Elasticsearch中克隆索引和为其重新编制索引有什么区别?

  16. 16

    Swift数组下标索引编制中的错误?

  17. 17

    确保Elasticsearch中的自动索引编制时不会发生重复

  18. 18

    ElasticSearch-使用Java API为大型文件编制索引

  19. 19

    索引编制期间Elasticsearch MapperParsingException [无法解析,文档为空]

  20. 20

    索引编制期间Elasticsearch MapperParsingException [无法解析,文档为空]

  21. 21

    ElasticSearch-使用Java API为大型文件编制索引

  22. 22

    如何使Google桌面为可搜索的pdf编制索引

  23. 23

    Logstash JSON 序列化在有效 JSON 上失败(mapper_parsing_exception)

  24. 24

    将数据索引到Elasticsearch中时出现批量API错误

  25. 25

    在映射已经存在的Elasticsearch索引中的新字段时遇到错误action_request_validation_exception

  26. 26

    ElasticSearch中令人难以置信的缓慢索引编制

  27. 27

    从mongodb仅对ElasticSearch中的某些字段编制索引

  28. 28

    错误无效格式:在ElasticSearch中为日志建立索引时[ISO8601]

  29. 29

    如何在Haystack中为CommentsField编制索引?

热门标签

归档