具有合并结果的递归正则表达式

x0rz0r

我的输入文件是没有扩展名的html文件。所需的输出是来自root_dir的所有文件的正则表达式匹配的URL,并将结果合并到单个文件中。我的正则表达式工作正常,我可以从单个文件输出结果。

import re
with open('/Users/files/filename') as f:
    for line in f:
        urls = re.findall (r"([\w%~\+-=]*\.mp3)", line);
        print (*urls)

我可以使用glob,但不确定如何:

import glob
import re
root_dir = '/Users/files/'
for filename in glob.iglob(root_dir + '**/*.*', recursive=True):
        urls = re.findall (r"([\w%~\+-=]*\.mp3)", line);
        print (*urls)
Ryszard捷克

采用

import re, glob                                 # Import the libraries

root_dir = r'/Users/files'                      # Set root directory
save_to_file = r'/Users/urls_extracted.txt'     # File path to save results to
all_files = glob.glob("{}/*".format(root_dir))  # Get a glob with filepaths

with open(save_to_file, 'w') as fw:             # Open stream to write to
  for filename in all_files:                    # Iterate over the files
    with open(filename, 'r') as fr:             # Open file to read from  
      for url in re.findall(r"[\w%~+\-=]*\.mp3", fr.read()): # Get all matches and iterate over them
        fw.write("{}\n".format(url))            # Write each URL to write stream

请注意,如果要表示-字符而不是范围,则必须在正则表达式中将破折号转义

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

PHP-递归正则表达式以获取具有其内部内容的完整Div类

来自分类Dev

JavaScript中的递归正则表达式模式

来自分类Dev

递归正则表达式模式

来自分类Dev

高级正则表达式:无法确定可以使用(?R)递归正则表达式的情况

来自分类Dev

如何编写与嵌套括号匹配的递归正则表达式?

来自分类Dev

为较旧的Perl版本重写递归正则表达式

来自分类Dev

SPARQL查询中的递归正则表达式以识别匹配的括号

来自分类Dev

如何在递归正则表达式中匹配一个组?

来自分类Dev

用于匹配 gnu r 中的括号对的递归正则表达式

来自分类Dev

使用preg_match_all中的php对/数组创建多维递归正则表达式

来自分类Dev

递归正则表达式:如何设置与字符串而不是单个字符的不匹配

来自分类Dev

正则表达式匹配具有递归的逗号分隔的平衡方括号

来自分类Dev

编写没有递归规则的正则表达式

来自分类Dev

无法在Ansible中打印具有正则表达式匹配结果的变量

来自分类Dev

javascript中的正则表达式具有组意外结果

来自分类Dev

如何在Python中使用递归正则表达式或其他方法来递归验证类似BBcode的标记?

来自分类Dev

如何合并正则表达式?

来自分类Dev

java正则表达式合并

来自分类Dev

合并正则表达式结构

来自分类Dev

具有某些条件的名字的正则表达式

来自分类Dev

具有动态需求的正则表达式

来自分类Dev

nginx正则表达式具有多个选项

来自分类Dev

具有正则表达式的Sublime Bug

来自分类Dev

具有几种不同模式的正则表达式

来自分类Dev

具有正则表达式的密码查询

来自分类Dev

正则表达式具有多个可能的选项

来自分类Dev

具有重复组名的正则表达式

来自分类Dev

具有If Else条件的正则表达式

来自分类Dev

具有正则表达式的组的数量可变

Related 相关文章

  1. 1

    PHP-递归正则表达式以获取具有其内部内容的完整Div类

  2. 2

    JavaScript中的递归正则表达式模式

  3. 3

    递归正则表达式模式

  4. 4

    高级正则表达式:无法确定可以使用(?R)递归正则表达式的情况

  5. 5

    如何编写与嵌套括号匹配的递归正则表达式?

  6. 6

    为较旧的Perl版本重写递归正则表达式

  7. 7

    SPARQL查询中的递归正则表达式以识别匹配的括号

  8. 8

    如何在递归正则表达式中匹配一个组?

  9. 9

    用于匹配 gnu r 中的括号对的递归正则表达式

  10. 10

    使用preg_match_all中的php对/数组创建多维递归正则表达式

  11. 11

    递归正则表达式:如何设置与字符串而不是单个字符的不匹配

  12. 12

    正则表达式匹配具有递归的逗号分隔的平衡方括号

  13. 13

    编写没有递归规则的正则表达式

  14. 14

    无法在Ansible中打印具有正则表达式匹配结果的变量

  15. 15

    javascript中的正则表达式具有组意外结果

  16. 16

    如何在Python中使用递归正则表达式或其他方法来递归验证类似BBcode的标记?

  17. 17

    如何合并正则表达式?

  18. 18

    java正则表达式合并

  19. 19

    合并正则表达式结构

  20. 20

    具有某些条件的名字的正则表达式

  21. 21

    具有动态需求的正则表达式

  22. 22

    nginx正则表达式具有多个选项

  23. 23

    具有正则表达式的Sublime Bug

  24. 24

    具有几种不同模式的正则表达式

  25. 25

    具有正则表达式的密码查询

  26. 26

    正则表达式具有多个可能的选项

  27. 27

    具有重复组名的正则表达式

  28. 28

    具有If Else条件的正则表达式

  29. 29

    具有正则表达式的组的数量可变

热门标签

归档