此脚本遍历下载csv文件的url列表:
#!/usr/bin/python
import subprocess
file = open('links20151111.txt','r')
for url in file:
print ('[+] downloadin ' + url.strip())
subprocess.call(['wget', '--content-disposition', url.strip()])
网址不包含文件名。
需要做的是将文件名中的所有“-”替换为“ _”。文件名可能类似于“ traffic_injuries_2001-2014.csv”。
如果我对问题的理解正确,那么每次下载新文件时,都可以遍历下载目录中的文件,并在其中查找带有破折号的文件,然后对该文件进行字符替换。这应该做到这一点:
#!/usr/bin/python
import subprocess, os
def rename_file():
for f in os.listdir(os.getcwd()):
if '-' in f and f.endswith('.csv'):
os.rename(f,f.replace('-','_'))
file = open('links20151111.txt','r')
for url in file:
print ('[+] downloadin ' + url.strip())
subprocess.call(['wget', '--content-disposition', url.strip()])
rename_file()
根据文件名的结构,您可能需要加强文件搜索的条件。您可以编译正则表达式以更严格地匹配文本格式。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句