lix剂将编码EUC-KR(JP,CH)...转换为UTF-8

申eh贤

我正在制作抓取应用。我想解析一些字符。但是某些页面不是UTF-8字符集。

我有页面正文,现在我想对正文字符串做一些工作。首先,如果页面编码不是UTF-8,我应该将编码转换为UTF-8。

我能怎么做?

帕特里克·奥斯西

您可以使用Erlang iconv库进行此类转换。这简单!

  1. 确保已iconv安装系统
  2. 添加{:iconv, "~> 1.0.0"}到部门和:iconv应用程序中mix.exs
  3. 转换为 :iconv.convert("euc-kr", "utf-8", "input")

您可以在libiconv页面上或通过iconv --list在命令行中运行找到支持的编码列表

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在Ruby 2.1中将ISO-2022-JP-2转换为UTF-8

来自分类Dev

在Ruby 2.1中将ISO-2022-JP-2转换为UTF-8

来自分类Dev

将ANSI转换为UTF8

来自分类Dev

将CSV转换为UTF-8

来自分类Dev

将编码的 html 实体转换为 utf-8

来自分类Dev

在C ++中使用utf8库将UTF 16转换为UTF8

来自分类Dev

在PHP中将UTF8 IAST编码转换为SLP

来自分类Dev

在Go中将任何编码转换为UTF 8

来自分类Dev

获取编码错误无法将ascii-8bit转换为utf-8bit

来自分类Dev

将字符串转换为UTF 8

来自分类Dev

将Python 3 unicode转换为utf-8

来自分类Dev

将“普通” std :: string转换为utf-8

来自分类Dev

将Unicode代码转换为UTF-8

来自分类Dev

将数字实体转换为UTF-8

来自分类Dev

将UTF-8转换为字符串

来自分类Dev

无法将连字符转换为UTF-8

来自分类Dev

将字符串转换为UTF8

来自分类Dev

将Unicode转义序列转换为UTF-8

来自分类Dev

将French_CI_AS(ASCII)转换为UTF8

来自分类Dev

无法将连字符转换为UTF-8

来自分类Dev

Rails 4:将转义的Unicode转换为utf-8

来自分类Dev

将byte []转换为UTF8的字符串

来自分类Dev

将“ gzencode()”的返回值转换为UTF-8

来自分类Dev

将 UTF8 字符转换为斜线转义数值

来自分类Dev

使用php脚本将ANSI编码的文件转换为UTF-8编码的文件?

来自分类Dev

为什么将UTF-8 VARCHAR列转换为XML需要转换为NVARCHAR并更改编码?

来自分类Dev

编码:: UndefinedConversionError:“ \ x8C”从ASCII-8BIT转换为UTF-8

来自分类Dev

如何将csv文件编码转换为utf-8

来自分类Dev

将URL编码的字符串(UTF-8)转换为Python中的字符串?