如何在文件中使用随机字符序列跳过某些行

debugcn 发表于 Dev

领主12

我有以下格式的文件：

    Name Salary Age
    bob  10000  18
    sally 5555  20
   @not found 4fjfjhdfjfnvndf
   @not found 4fjfjhdfjfnvndf
   9/2-10/2

但是然后我在文件中有4-6行随机字符的随机点。这些文件有200万行。我想知道infile语句是否自动跳过这些随机的行，还是我必须进入文件并自动删除这些行。

乔

您可能必须以某种方式处理它们。如果你有truncover或missover在infile声明中，也不会做任何伤害（你必须有一个，不过，也可能导致你的下一行得到了转移）。但是您的程序中将有一条垃圾线需要处理。

快速而肮脏的方法将是这样的：

data have;
infile "blah.txt" dlm=' ' dsd lrecl=32767 truncover;
input name $ salary age;
if missing(salary) and missing(age) then delete;
run;

如果垃圾很可能为数字生成丢失的值，那将起作用。但是，您的日志中可能会有一些警告，但这些警告不是很好，而且如果垃圾可能是数字值，那么在发现的内容中也不是完美的。（如果完全是数字值，则可以测试是否name为数字。）

更好的方法是预处理_infile_-这有点“先进”，但肯定是个好方法。

data have;
infile "blah.txt" dlm=' ' dsd lrecl=32767 truncover;
input @;
if countw(_infile_) ne 3 then delete;  *if there are not exactly 3 "words" then delete it;
if notdigit(scan(_infile_,2)) or notdigit(scan(_infile_,3)) then delete; *if the 2nd or 3rd word contain non-digit values then delete;
input name $ salary age;
run;

两种方法都需要与数据保持一定的一致性才能正常工作，并且可能需要进行一些调整-例如，如果可以接受工资和年龄的缺失，这两种方法都会删除您不希望删除的行。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-6

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何在文件中使用随机字符序列跳过某些行

如何在文件中使用随机字符序列跳过某些行

如何在文件中使用随机字符序列跳过某些行

如何使用Python跳过某些行来读取此文件？

如何在Python中使用熊猫跳过读取空文件

如何在资源文件中包含的字符串中使用转义序列

如何在C ++中使用fstream从文本文件中获取某些行

如何在硒中使用XPath的'not start-with'属性来跳过python中的某些网站

如何从文本文件中打印随机行但排除包含某些字符的行？C＃

如何在Linux中使用crontab删除某些文件

如何在HTML中使用随机数制作无序列表

如何在shell脚本中使用while按行加入空行的字符文件？

如何在UNIX上使用某些脚本将丢失的字符添加到文件的一行文本中？

批量插入如何在 SQL Server 2017 中使用格式文件跳过列

Laravel中如何使用文件跳过行

如何在python中使用随机函数？

在Windows Batch文件中使用`^`转义行尾字符在某些行上不起作用？

如何在Subversion中使用@字符移动/重命名文件

如何在文件中使用vim获取特定字符的数量

如何在 HTML 文件中使用 Javascript 替换字符？

fread-跳过以某些字符开头的行-“＃”

如何在Python中生成随机字符串字符的随机序列

如何在Python /金字塔中使用多个随机字符串？

如何在转义序列中使用变量？

如何在序列中使用sed

如何在python中使用faulhaber序列？

如何在使用python读取CSV文件时跳过空白行

如何在Java中字符串的某些部分中使用正则表达式？

如何在UNIX中使用文件中的模式查找行

如何在grep命令中使用从文件中读取的行

如何在VBA中使用FileSystemObject替换文本文件行中的字符串？