我有一些类似下面的网址
https://data.hova.com/strap/nik/sql_output1574414532.89.zip
https://data.hova.com/strap/asr/sql_output1574414532.89.zip
https://data.hova.com/strap/olr/sql_output1574414532.89.zip
现在我想只提取zip
文件名,即sql_output1574414532.89.zip
,sql_output1574414532.89.zip
,sql_output1574414532.89.zip
分别。
现在,我可以用一个简单的split
获取文件名,但如果你注意观察,目录名前的zip
文件更改,如nik
,asr
,olr
等。
因此,我想使用它,regex
以便仅查看以sql开头和以zip结尾的任何内容。
这就是我所做的
import re
string = "https://data.hova.com/strap/nik/sql_output1574414532.89.zip"
pattern = r'^sql\.zip$'
match = re.search(pattern, string)
print(match)
但是match
来了None
。我究竟做错了什么?
该模式r'^sql\.zip$'
仅匹配一个字符串:“ sql.zip”。
出于您的目的,您需要类似的内容sql.+zip$
,或者,如果您希望sql
在文件名之前的URL中可以遇到字符串,请将其更改为sql[^/]+zip$
。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句