我正在制作抓取应用。我想解析一些字符。但是某些页面不是UTF-8字符集。
我有页面正文,现在我想对正文字符串做一些工作。首先,如果页面编码不是UTF-8,我应该将编码转换为UTF-8。
我能怎么做?
您可以使用Erlang iconv库进行此类转换。这简单!
iconv
安装系统{:iconv, "~> 1.0.0"}
到部门和:iconv
应用程序中mix.exs
:iconv.convert("euc-kr", "utf-8", "input")
您可以在libiconv页面上或通过iconv --list
在命令行中运行找到支持的编码列表。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句