搜索

搜索

如何使用 tm 包进行希伯来语或阿拉伯语文本分析

debugcn 发表于 Dev

9

MQL4初学者

我想使用 tm 包进行希伯来语或阿拉伯语文本分析。我尝试了几种方法来查看 tm 是否能够处理一些单词，但我遇到了错误，有没有办法解决这个问题？

 text  <- "הנוסעים חיכו זמן רב לנסיעה"
 Encoding(text)
#[1] "unknown"
 Encoding(text)  <- "UTF-8"
 ap.corpus <- Corpus(DataframeSource(data.frame(text)))
 ap.corpus <- tm_map(ap.corpus, removePunctuation)
 ap.corpus <- tm_map(ap.corpus, content_transformer(tolower))
Error in FUN(content(x), ...) : 
  invalid input 'הנוסעים חיכו זמן רב לנסיעה' in 'utf8towcs'

MQL4初学者

这就是答案，我们需要添加这种编码方法：

iconv(text, "ISO-8859-8", "UTF-8")[1]

而不是使用： Encoding(text) <- "UTF-8"

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-13

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

使用R进行阿拉伯语文本挖掘

来自分类Dev

如何从右到左更改特定列表项文本（例如阿拉伯语/希伯来语）？

来自分类Dev

如何使用 PHP 阅读阿拉伯语文本

来自分类Dev

如何防止希伯来语和阿拉伯语从右向左自动显示文字方向？

来自分类Dev

如何使我的编辑文本以编程方式使用阿拉伯语键盘？

来自分类Dev

如何使我的编辑文本以编程方式使用阿拉伯语键盘？

来自分类Dev

如何正确地将阿拉伯语脚本插入Tkinter文本小部件？

来自分类Dev

如何在日食中用阿拉伯语读写

来自分类Dev

阿拉伯语单词如何与“ tashkel”匹配？

来自分类Dev

如何用html写阿拉伯语段落？

来自分类Dev

阿拉伯语单词如何与“ tashkel”匹配？

来自分类Dev

如何用html写阿拉伯语段落？

来自分类Dev

如何在arraylist中用阿拉伯语写

来自分类Dev

如何使Ubuntu与阿拉伯语兼容

来自分类Dev

使用codeigniter插入和选择阿拉伯语

来自分类Dev

使用itext用pdf书写阿拉伯语

来自分类Dev

使用PowerShell过滤阿拉伯语单词

来自分类Dev

使用JSMPP发送阿拉伯语SMS

来自分类Dev

使用阿拉伯语时数字会颠倒

来自分类Dev

在R中使用LDA和tm进行文本分析

来自分类Dev

在R中使用LDA和tm进行文本分析

来自分类Dev

希伯来语、阿拉伯语、意第绪语文本在 PDFBox 2.0.5 中以相反的顺序书写

来自分类Dev

如何使用libraqm使用FreeType2渲染正确的字形（阿拉伯语）？

来自分类Dev

如何从文本文件中删除俄语和阿拉伯语字符串

来自分类Dev

使用Javascript替换文本字符串中的某些阿拉伯语单词

来自分类Dev

使用阿拉伯语时如何防止从右到左的文字出现？

来自分类Dev

如何添加事件处理程序以使用变音符号（阿拉伯语）跨越？

来自分类Dev

我的某些Windows 10使用阿拉伯语。我如何将其英文化？

来自分类Dev

如何在使用iText创建的PDF中显示阿拉伯语

Related 相关文章

文章

热门标签

归档