R 错误:1:输入的 UTF-8 不正确,请指出编码!XML到列表

杰里米

这是我的代码,我有一个在 UTF8 中转换的查询,但最后我收到一个错误,该查询不在 UTF8 中,我无法修复它:

library("XML")
library("methods")
library("httr")

query = http://export.arxiv.org/api/query?search_query=(au:( \"Benoit Bertrand\"))&start=0&max_results=2000
xml_data = xmlToList(iconv(URLencode(query),to="UTF-8"))

错误:1:输入的 UTF-8 不正确,请指出编码!
字节:0xC9 0x70 0x69 0x6A

我发现这是使代码崩溃的空格字符,但这就是我得到的

帕纳吉奥蒂斯·卡纳沃斯

由于拼写错误,问题的代码将无法编译。即使修复了这些错误,代码也不会做任何有用的事情 -xmlToList应用于URL,而不是 GET 请求的结果。这足以产生错误:

query<-"http://export.arxiv.org/api/query?search_query=(au:( \"Benoit Bertrand\"))&start=0&max_results=2000"
xmlToList(query)

再多的 URL 编码和转换都无法解决这个问题。也不需要转换,因为 URL 属于 US-ASCII 范围。在该范围内,UTF8 字符串与 ASCII 字符串无法区分。

获取和解析这个 Arxiv 页面的正确代码是:

//Just a URL
query<-"http://export.arxiv.org/api/query?search_query=(au:( \"Benoit Bertrand\"))&start=0&max_results=2000"
//Get the contents
r <- GET(query)
//Extract the text from the response
xml<-content(r, "text")
//Read as lists
l<-xmlToList(xml)

响应r不仅仅是一个字符串,它是一个包含标头(包括编码)、响应状态和响应内容的对象。标题之一是 Content-Type :

> r
Response [http://export.arxiv.org/api/query?search_query=(au:( "Benoit Bertrand"))&start=0&max_results=2000]
  Date: 2019-09-30 12:54
  Status: 200
  Content-Type: application/atom+xml; charset=UTF-8
  Size: 786 B

content(r, "text") 使用存储在该标头中的编码将内容转换为文本。

之后,xmlToList可以解析XML字符串

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

输入的UTF-8不正确,表示编码

来自分类Dev

XML错误:输入的UTF-8不正确,表示编码!从PHP5更改为PHP7之后

来自分类Dev

rvest read_html 输入不正确 UTF-8 编码错误

来自分类Dev

R:“错误:1:输入不正确的UTF-8,指示编码!字节:0xC9 0x74 0x61 0x74”

来自分类Dev

PHP中的错误?:XMLReader :: readOuterXml当输入IS UTF-8时生成“输入不正确的UTF-8”

来自分类Dev

XMLSyntaxError:输入不正确的UTF-8,表示编码,Odoo

来自分类Dev

输出CSV文件编码不正确的UTF-8

来自分类Dev

R的UTF-8编码问题

来自分类Dev

如何让R维护utf8编码?

来自分类Dev

UTF-8编码仍然错误的输出

来自分类Dev

在 ruby utf-8 错误中编码

来自分类Dev

R 编码 - 用错误的字符保存为 UTF-8(我认为)

来自分类Dev

在 R 中将默认 html 编码转换为 UTF-8 或 latin1

来自分类Dev

从utf8到latin1

来自分类Dev

R Corpus正在弄乱我的UTF-8编码文本

来自分类Dev

R中的表情符号[UTF-8编码]

来自分类Dev

UTF-8的交叉编译ncurses显示不正确

来自分类Dev

SQLplus和Oracle,UTF-8显示不正确

来自分类Dev

可能编码错误,格式错误的 UTF-8 字符

来自分类Dev

错误:在 SQL Server 2008 R2 中创建记录 RoR 时出现“不兼容的字符编码:ASCII-8BIT 和 UTF-8”和“UTF-8 中的无效字节序列”

来自分类Dev

Firefox中错误显示的UTF-8编码文本

来自分类Dev

Spring表格和UTF-8编码错误

来自分类Dev

错误:编码“ UTF8”的字节序列无效

来自分类Dev

UTF8字符编码错误

来自分类Dev

mitmproxy记录到outfile utf8编码错误

来自分类Dev

Python + Scrapy + MySQL UTF8编码错误

来自分类Dev

错误!blahfile不是UTF-8编码的。储存已停用

来自分类Dev

如何处理libpq中的UTF-8编码错误?

来自分类Dev

如何避免编码UTF-8错误的问题

Related 相关文章

  1. 1

    输入的UTF-8不正确,表示编码

  2. 2

    XML错误:输入的UTF-8不正确,表示编码!从PHP5更改为PHP7之后

  3. 3

    rvest read_html 输入不正确 UTF-8 编码错误

  4. 4

    R:“错误:1:输入不正确的UTF-8,指示编码!字节:0xC9 0x74 0x61 0x74”

  5. 5

    PHP中的错误?:XMLReader :: readOuterXml当输入IS UTF-8时生成“输入不正确的UTF-8”

  6. 6

    XMLSyntaxError:输入不正确的UTF-8,表示编码,Odoo

  7. 7

    输出CSV文件编码不正确的UTF-8

  8. 8

    R的UTF-8编码问题

  9. 9

    如何让R维护utf8编码?

  10. 10

    UTF-8编码仍然错误的输出

  11. 11

    在 ruby utf-8 错误中编码

  12. 12

    R 编码 - 用错误的字符保存为 UTF-8(我认为)

  13. 13

    在 R 中将默认 html 编码转换为 UTF-8 或 latin1

  14. 14

    从utf8到latin1

  15. 15

    R Corpus正在弄乱我的UTF-8编码文本

  16. 16

    R中的表情符号[UTF-8编码]

  17. 17

    UTF-8的交叉编译ncurses显示不正确

  18. 18

    SQLplus和Oracle,UTF-8显示不正确

  19. 19

    可能编码错误,格式错误的 UTF-8 字符

  20. 20

    错误:在 SQL Server 2008 R2 中创建记录 RoR 时出现“不兼容的字符编码:ASCII-8BIT 和 UTF-8”和“UTF-8 中的无效字节序列”

  21. 21

    Firefox中错误显示的UTF-8编码文本

  22. 22

    Spring表格和UTF-8编码错误

  23. 23

    错误:编码“ UTF8”的字节序列无效

  24. 24

    UTF8字符编码错误

  25. 25

    mitmproxy记录到outfile utf8编码错误

  26. 26

    Python + Scrapy + MySQL UTF8编码错误

  27. 27

    错误!blahfile不是UTF-8编码的。储存已停用

  28. 28

    如何处理libpq中的UTF-8编码错误?

  29. 29

    如何避免编码UTF-8错误的问题

热门标签

归档