CSQuery解析非英语文本

debugcn 发表于 Dev

拉马尔

我正在使用CSQuery解析阿拉伯语网站。当我使用text（）函数时，它按原样返回文本，但是当我使用html（）函数时，它使用html编码。例如，这是我的html标签：

<div>تعلن عن إرسالها مركبة فضائية للمريخ قريباً جداً</div>

当我使用时：

dom["div"].Text();

它返回：“宣布它将很快将一艘航天器送往火星。” 但是，当我使用：

dom["div"].Html();

它返回：

&amp;#1578;&amp;#1593;&amp;#1604;&amp;#1606; &amp;#1593;&amp;#1606; &amp;#1573;&amp;#1585;&amp;#1587;&amp;#1575;&amp;#1604;&amp;#1607;&amp;#1575; &amp;#1605;&amp;#1585;&amp;#1603;&amp;#1576;&amp;#1577; &amp;#1601;&amp;#1590;&amp;#1575;&amp;#1574;&amp;#1610;&amp;#1577; &amp;#1604;&amp;#1604;&amp;#1605;&amp;#1585;&amp;#1610;&amp;#1582; &amp;#1602;&amp;#1585;&amp;#1610;&amp;#1576;&amp;#1575;&amp;#1611; &amp;#1580;&amp;#1583;&amp;#1575;&amp;#1611;

问题是如何在保留实际文本而不进行编码的情况下如何使用HTML？我需要Html（）函数来检索选择器标记内的任何现有标记。

编辑：这是原始html页面的内容类型：

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

拉马尔

我最终使用System.Net.WebUtility.HtmlDecode（）解码Html（）函数的输出。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-21

我来说两句

0条评论

登录后参与评论

来自分类Dev

用Python标记非英语文本

来自分类Dev

非英语文本的情感分析

来自分类Dev

从非英语文件名和非英语文本读取C ++

来自分类Dev

MLkIT的文本识别无法识别非英语文本

来自分类Dev

如何在英语Windows 7上指示非英语文本？

来自分类Dev

如何从文本文件中读取非英语文本并以python打印？

来自分类Dev

如何将非英语文本分解为javascript中的组成字符？

来自分类Dev

非英语文本中单词的频率：如何合并单数和复数形式等？

来自分类Dev

使用条形码阅读器C＃.NET解码非英语文本

来自分类Dev

如何使浏览器在由beforeunload事件触发的弹出窗口中显示非英语文本？

来自分类Dev

如何用记事本++在包含非ASCII（日语）字符的行中排列英语文本？

来自分类Dev

如何使用android：inputType =“ textPassword”在密码EditText中键入非英语文本

来自分类Dev

在Android TextView中，Text.BoringLayout WIDTH设置为0（未显示）当我有非英语文本时？

来自分类Dev

Android TextView中的Text.BoringLayout WIDTH设置为0（未显示）当我有非英语文本时？

来自分类Dev

非英语语言的文本识别

来自分类Dev

用于RTL希伯来语文本和英语文本的CSS，两者在blockquote中都有合理的对齐方式

来自分类Dev

PostgreSQL数据库中的阿拉伯语和英语文本

来自分类Dev

如何使用Java获取除英语文本以外的其他内容作为响应

来自分类Dev

哪个NLP库适合对共享主机上的英语文本进行基本分析？

来自分类Dev

PostgreSQL数据库中的阿拉伯语和英语文本

来自分类Dev

IBM Text to Speech：如何在德语文本中正确发音英语单词？

来自分类Dev

jQuery检查文本是否非英语

来自分类Dev

非英语语言的语音到文本的转换

来自分类Dev

检测文本是否为非英语

来自分类Dev

从网络解析日语文本不能提供正确的字符

来自分类Dev

使用英语文化将日期时间解析为月日时，仍使用土耳其语进行解析

来自分类Dev

用CSQuery解析HTML

来自分类Dev

在Abp Framework .NET Core 3中使用具有非英语文化的公历日期

来自分类Dev

如何解析非英语字符串中的月份

Related 相关文章

文章