我正在尝试验证是否将大文件正确分割为多个部分。作为一个玩具示例,我有一个文件out_sample
:
123456789012
123456789012
123456789012
123456789012
123456789012
存储时有64个字节。当我使用cut将文件分割成六部分时,结果文件各有15个字节:
#!/bin/sh
FILENAME="out_sample"
cut -c1-2 $FILENAME > a
cut -c3-4 $FILENAME > b
cut -c5-6 $FILENAME > c
cut -c7-8 $FILENAME > d
cut -c9-10 $FILENAME > e
cut -c11-12 $FILENAME > f
总共意味着6 * 15 = 90字节。原始文件的大小和新文件的大小之和之间的26个字节有什么区别?我注意到cut
在文件末尾附加换行符,这可能是每个文件1个字节吗?其余的呢?
当您从文件中切出2列时,请cut
在每行上添加一个换行符。因此,每个输出文件由5行组成,每个行有2个数字和一个换行符。
这就解释了25个额外的字节(文件1到5;第六个文件只是删除了第13列(输入文件中的换行符)而添加的换行符)。
有最后一个字节来自吗?我假设您使用的编辑器不会在输入文件的最后一行强制换行。
所以什么都没有丢失。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句