为什么 grep 命令不适用于 UTF-16 LE 编码的文本文件?

轻八神

我想将所有行保存在另一个文本文件中以某个字符串开头的文本文件中。所以,我用这个grep命令来做到这一点:

grep '^This' input.txt > output.txt

但是输出文件output.txt是空的,尽管文件中有很多行以input.txt“this”开头。我的一位导师建议该文件input.txt采用UTF-16 LE格式并要求我将其更改为UTF-8. 然后命令运行良好。

为什么 grep 命令不适用于具有UTF-16 LE格式的文件

grep不知道编码。它不搜索“字符”,而是搜索bytes您的控制台正在发送 UTF-8/ASCII 编码的文本(在本例中与字符串“^This”相同)以grep供搜索。如果文件包含 UTF-16 编码的文本,则不会匹配,因为字节表示不同。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

为什么无法搜索以UTF-16编码的文本文件内容?

来自分类Dev

为什么`^ [] {0,}`不适用于linux grep?

来自分类Dev

为什么 admob 不适用于 API 16

来自分类Dev

如何在Julia中加载UTF16编码的文本文件?

来自分类Dev

为什么文本文件中的这个正则表达式不适用于 smartmatch?

来自分类Dev

为什么文本utf-16而不是utf-8

来自分类Dev

为什么文本文件的编码从UTF-8更改为ANSI(以及如何解决此问题)?

来自分类Dev

为什么我的脚本仅适用于文本文件的最后一行?

来自分类Dev

Java为什么将UTF-16用于内部文本表示

来自分类Dev

为什么ExtractMpegFramesTest不适用于旋转的输入文件?

来自分类Dev

grep命令用于多个目录中的文本文件

来自分类Dev

为什么附加文本区域仅适用于.text而不适用于.val?

来自分类Dev

为什么File.WriteAllBytes不适用于.db文件,但适用于.csv文件?

来自分类Dev

为什么此正则表达式不适用于grep?

来自分类Dev

Firefox 52:Javascript parseFloat 不适用于 UTF-16 字符串

来自分类Dev

使用 powershell 读取文本文件仅适用于 powershell 屏幕命令,而不适用于脚本

来自分类Dev

utf-16-le BOM CSV文件

来自分类Dev

utf-16-le BOM CSV文件

来自分类Dev

为什么bash brace扩展不适用于命令?

来自分类Dev

为什么bash brace扩展不适用于命令?

来自分类Dev

USB为什么将UTF-16用于字符串(为什么不使用UTF-8)

来自分类Dev

USB为什么将UTF-16用于字符串(为什么不使用UTF-8)

来自分类Dev

表示用于文本文件的编码

来自分类Dev

为什么Powershell文件串联会将UTF8转换为UTF16?

来自分类Dev

为什么我的 sudo 命令适用于 ansible 而不适用于 ansible-playbook?

来自分类Dev

Python-读取具有奇怪utf-16格式的文本文件

来自分类Dev

是否可以将文本文件设置为UTF-16?

来自分类Dev

jsPDF将html转换为pdf:utf-8仅适用于文本,不适用于html

来自分类Dev

为什么此模式不适用于敲除验证?(分隔的邮政编码)

Related 相关文章

  1. 1

    为什么无法搜索以UTF-16编码的文本文件内容?

  2. 2

    为什么`^ [] {0,}`不适用于linux grep?

  3. 3

    为什么 admob 不适用于 API 16

  4. 4

    如何在Julia中加载UTF16编码的文本文件?

  5. 5

    为什么文本文件中的这个正则表达式不适用于 smartmatch?

  6. 6

    为什么文本utf-16而不是utf-8

  7. 7

    为什么文本文件的编码从UTF-8更改为ANSI(以及如何解决此问题)?

  8. 8

    为什么我的脚本仅适用于文本文件的最后一行?

  9. 9

    Java为什么将UTF-16用于内部文本表示

  10. 10

    为什么ExtractMpegFramesTest不适用于旋转的输入文件?

  11. 11

    grep命令用于多个目录中的文本文件

  12. 12

    为什么附加文本区域仅适用于.text而不适用于.val?

  13. 13

    为什么File.WriteAllBytes不适用于.db文件,但适用于.csv文件?

  14. 14

    为什么此正则表达式不适用于grep?

  15. 15

    Firefox 52:Javascript parseFloat 不适用于 UTF-16 字符串

  16. 16

    使用 powershell 读取文本文件仅适用于 powershell 屏幕命令,而不适用于脚本

  17. 17

    utf-16-le BOM CSV文件

  18. 18

    utf-16-le BOM CSV文件

  19. 19

    为什么bash brace扩展不适用于命令?

  20. 20

    为什么bash brace扩展不适用于命令?

  21. 21

    USB为什么将UTF-16用于字符串(为什么不使用UTF-8)

  22. 22

    USB为什么将UTF-16用于字符串(为什么不使用UTF-8)

  23. 23

    表示用于文本文件的编码

  24. 24

    为什么Powershell文件串联会将UTF8转换为UTF16?

  25. 25

    为什么我的 sudo 命令适用于 ansible 而不适用于 ansible-playbook?

  26. 26

    Python-读取具有奇怪utf-16格式的文本文件

  27. 27

    是否可以将文本文件设置为UTF-16?

  28. 28

    jsPDF将html转换为pdf:utf-8仅适用于文本,不适用于html

  29. 29

    为什么此模式不适用于敲除验证?(分隔的邮政编码)

热门标签

归档