搜索

搜索

在大字符串中搜索文件路径。返回文件路径+文件名

tkezy 发表于 Dev

10

疯狂

我有一个小项目，试图从网页上下载一系列壁纸。我是python的新手。

我正在使用该urllib库，该库将返回一长串的网页数据，其中包括

<a href="http://website.com/wallpaper/filename.jpg">

我知道我需要下载的每个文件名都有

'http://website.com/wallpaper/'

如何在页面源中搜索这部分文本，并返回其余图像链接（以“ * .jpg”扩展名结尾）？

r'http://website.com/wallpaper/ xxxxxx .jpg'

我在想是否可以格式化xxxx部分不评估的正则表达式？只需检查路径和.jpg扩展名即可。找到匹配项后返回整个字符串

我在正确的轨道上吗？

蒂莫西·施密兹（Timothy Schmitz）

BeautifulSoup对于此类事情非常方便。

import re
import urllib3
from bs4 import BeautifulSoup

jpg_regex = re.compile('\.jpg$')
site_regex = re.compile('website\.com\/wallpaper\/')

pool = urllib3.PoolManager()
request = pool.request('GET', 'http://your_website.com/')
soup = BeautifulSoup(request)

jpg_list = list(soup.find_all(name='a', attrs={'href':jpg_regex}))
site_list = list(soup.find_all(name='a', attrs={'href':site_regex}))

result_list = map(lambda a: a.get('href'), jpg_list and site_list)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-21

0

我来说两句

0条评论

登录后参与评论

上一篇：保存Typescript文件时，Visual Studio 2015 RC不会创建源地图

相关文章

来自分类Dev

在大字符串中搜索文件路径。返回文件路径+文件名

来自分类Dev

从路径字符串中提取文件名

来自分类Dev

cmd-在文件夹中的所有文件中搜索字符串-找到时返回文件名

来自分类Dev

Linux终端：仅在具有给定文件扩展名的文件中递归搜索字符串；显示文件名和绝对路径

来自分类Dev

我需要找到与字符串lastline匹配的文件的文件路径和文件名

来自分类Dev

使用PowerShell在文件名中搜索字符串

来自分类Dev

从路径获取文件名

来自分类Dev

如何从路径目录字符串中删除文件名？

来自分类Dev

替换字符串中的本地路径以仅显示文件名

来自分类Dev

String.Format是否可以在XAML中显示路径字符串的文件名

来自分类Dev

打开路径和文件名存储在字符串变量中的工作簿

来自分类Dev

c ++将文件的路径作为字符串与文件名合并

来自分类Dev

处理包含文件路径的字符串以仅获取文件名

来自分类Dev

获取目录路径中的文件名

来自分类Dev

从特定路径中删除文件名？

来自分类Dev

使路径中的文件名动态化

来自分类Dev

在bat中搜索部分路径\文件名

来自分类Dev

获取不带文件名的文件的路径

来自分类Dev

Hadoop-搜索特定字符串，然后返回包含字符串的文件名

来自分类Dev

文件名和路径中的特殊字符

来自分类Dev

搜索包含字符串的文件名

来自分类Dev

搜索包含文件名的字符串

来自分类Dev

搜索没有特定字符串的文件名

来自分类Dev

从原始字典返回文件名

来自分类Dev

使用 zipgrep 返回文件名

来自分类Dev

从文件名路径列表中仅提取maya文件中使用的纹理文件名

来自分类Dev

无法打开“文件名”：找不到文件（文件：<错误的文件路径>/文件名）

来自分类Dev

C# 忽略 Windows 字符串路径只获取文件名

来自分类Dev

检查HttpHostedFileBase中的FileName是文件名还是文件路径

Related 相关文章

文章

热门标签

归档