了解sed / awk ^和[]

debugcn 发表于 Dev

p1nesap

首先，是否有比使用sed和awk更好的命令行Linux处理从wget下载的HTML页面中的文本的方法？如果是这样，请告诉我或链接到doc。

其次，我对以下表达式感到困惑...因为^从新行的开头开始搜索，为什么空格会gsub(/[^a-z]]*/, " ")替换非字母字符，而逗号,在这里又起什么作用？为何]这种表达方式无与伦比？

乔纳森·勒夫勒（Jonathan Leffler）

对于HTML的处理，您需要描述您想对处理进行什么操作。

如果该^字符不在字符类中，并且可以指示行的开头（例如，如果regex为/^[^a-z]/），则该字符用作“行的开始” 。当它位于字符类（用方括号括起来[]）中并且是第一个字符时，则它是一个元字符，表示“除以下字符外的所有字符”。

该gsub函数是全局搜索和替换操作：

gsub(/[^a-z]]*/, " ")

意思是“用z代替任何不在az中的内容，然后用零个或多个接近的方括号替换为空白（双引号中的字符串" "）。逗号是参数分隔符，用于将正则表达式参数与替换字符串参数分隔开。正则表达式中的第二个方括号令人惊讶；这很容易是一个错误。

由于该gsub函数没有第三个参数，因此它将$0在当前输入行上进行操作。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

了解sed / awk ^和[]

了解sed / awk ^和[]

awk和sed分割文件

sed和awk导致换行

需要SED和/或awk帮助

使用列-AWK和SED

了解sed命令的语法和sed命令

使用awk和sed合并特定行

sed，grep和awk文件排序

如何使用剪切和AWK sed的？

sed，grep和awk文件排序

在perl中使用awk和sed命令

特定行和列的sed / awk

awk和sed的新手，我该如何改善呢？多个sed和awk命令

组合awk和sed以匹配行并替换字符

使用AWK或SED删除字段的尾部和前导空格

sed regex查找和替换（欢迎awk解决方案）

结合awk和sed以匹配行并替换字符

使用awk和sed在字符串中递增数字

如何在sed或awk流中添加页眉和/或页脚？

如何使用sed和awk处理csv文件中的^ M？

python-需要帮助在python中调用awk和sed

如何使用awk和sed对数据进行统计

使用sed或awk使用数字查找和替换路径url

tr（translate）to sed和awk之间的主要区别

使用sed和awk替换搜索文本中的文本？

使用SED和/或AWK将行替换为模式

用 awk 或 sed 替换和增加字母和数字

awk和sed在每行相关行的末尾追加

如何使用 awk 和 sed 读取 JSON 文件中的列表

使用awk从bash shell中提取json值，而无需同时使用awk和sed