了解sed / awk ^和[]

p1nesap

首先,是否有比使用sed和awk更好的命令行Linux处理从wget下载的HTML页面中的文本的方法?如果是这样,请告诉我或链接到doc。

其次,我对以下表达式感到困惑...因为^从新行的开头开始搜索,为什么空格会gsub(/[^a-z]]*/, " ")替换非字母字符,而逗号,在这里又起什么作用?为何]这种表达方式无与伦比

乔纳森·勒夫勒(Jonathan Leffler)

对于HTML的处理,您需要描述您想对处理进行什么操作。

如果该^字符不在字符类中,并且可以指示行的开头(例如,如果regex为/^[^a-z]/,则字符用作“行的开始” 当它位于字符类(用方括号括起来[])中并且是第一个字符时,则它是一个元字符,表示“除以下字符外的所有字符”。

gsub函数是全局搜索和替换操作:

gsub(/[^a-z]]*/, " ")

意思是“用z代替任何不在az中的内容,然后用零个或多个接近的方括号替换为空白(双引号中的字符串" ")。逗号是参数分隔符,用于将正则表达式参数与替换字符串参数分隔开。正则表达式中的第二个方括号令人惊讶;这很容易是一个错误。

由于该gsub函数没有第三个参数,因此它将$0在当前输入行上进行操作。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

awk和sed分割文件

来自分类Dev

sed和awk导致换行

来自分类Dev

需要SED和/或awk帮助

来自分类Dev

使用列-AWK和SED

来自分类Dev

了解sed命令的语法和sed命令

来自分类Dev

使用awk和sed合并特定行

来自分类Dev

sed,grep和awk文件排序

来自分类Dev

如何使用剪切和AWK sed的?

来自分类Dev

sed,grep和awk文件排序

来自分类Dev

在perl中使用awk和sed命令

来自分类Dev

特定行和列的sed / awk

来自分类Dev

awk和sed的新手,我该如何改善呢?多个sed和awk命令

来自分类Dev

组合awk和sed以匹配行并替换字符

来自分类Dev

使用AWK或SED删除字段的尾部和前导空格

来自分类Dev

sed regex查找和替换(欢迎awk解决方案)

来自分类Dev

结合awk和sed以匹配行并替换字符

来自分类Dev

使用awk和sed在字符串中递增数字

来自分类Dev

如何在sed或awk流中添加页眉和/或页脚?

来自分类Dev

如何使用sed和awk处理csv文件中的^ M?

来自分类Dev

python-需要帮助在python中调用awk和sed

来自分类Dev

如何使用awk和sed对数据进行统计

来自分类Dev

使用sed或awk使用数字查找和替换路径url

来自分类Dev

tr(translate)to sed和awk之间的主要区别

来自分类Dev

使用sed和awk替换搜索文本中的文本?

来自分类Dev

使用SED和/或AWK将行替换为模式

来自分类Dev

用 awk 或 sed 替换和增加字母和数字

来自分类Dev

awk和sed在每行相关行的末尾追加

来自分类Dev

如何使用 awk 和 sed 读取 JSON 文件中的列表

来自分类Dev

使用awk从bash shell中提取json值,而无需同时使用awk和sed