如何从此网址获取jpg?

德维尔班克

该API提供了网站的缩略图。

<img style="-webkit-user-select: none" src="http://webthumb.bluga.net/easythumb.php?user=00000&url=www.consumerreports.com&hash=sdf9g879d8f7g9sd8fg7s9df&size=medium&cache=30">

用户ID和哈希值已删除,但如果正确,此标记将在您的页面上产生一个名为的小缩略图easythumb.jpeg

有什么办法可以抓取该缩略图并将其存储在数据库或AWS中?

还是为防止这种行为而精心设计的webthumb?

编辑:

根据下面的建议尝试了Nokogiri,这是回报。似乎无法从中获取jpg。我对吗?

锡人

重要的是要了解什么事情会做什么。这是一些代码,已经过测试,可以下载图像:

require 'nokogiri'
require 'open-uri'

html = '<img style="-webkit-user-select: none" src="http://webthumb.bluga.net/easythumb.php?user=00000&url=www.consumerreports.com&hash=sdf9g879d8f7g9sd8fg7s9df&size=medium&cache=30">'
doc = Nokogiri::HTML(html)

uri = URI.parse(doc.at('img')['src']) 
# => #<URI::HTTP:0x007f8e13258520 URL:http://webthumb.bluga.net/easythumb.php?user=00000&url=www.consumerreports.com&hash=sdf9g879d8f7g9sd8fg7s9df&size=medium&cache=30>

File.basename(uri.path) 
# => "easythumb.php"

File.open(File.basename("#{ uri.path }.jpeg"), 'wb') { |fo| fo.write(open(uri).read) }

也就是说,该网址无效。打开浏览器页面并粘贴到该URL中将返回“错误哈希”,而不是图像。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何从此网址提取YouTube ID

来自分类Dev

如何从此网址提取YouTube ID

来自分类Dev

如何从此API获取数据

来自分类Dev

如何从此请求获取属性?

来自分类Dev

如何从此数组获取类型

来自分类Dev

如何从图像网址数组中获取第一个jpg / png图像网址?

来自分类Dev

如何从此ActionDispatch获取文件名

来自分类Dev

如何从此类获取所有documentID

来自分类Dev

如何从此ActionDispatch获取文件名

来自分类Dev

钛:如何从此功能获取数据?

来自分类Dev

jQuery如何从此数组获取数据

来自分类Dev

我如何从此数组中获取值

来自分类Dev

如何从此查询中获取正确的输出

来自分类Dev

如何从此表中获取所需的列?

来自分类Dev

如何从此函数中获取特定文本?

来自分类Dev

如何从此api获取jsonp链接?

来自分类Dev

如何获取iframe的网址?

来自分类Dev

如何从网址获取参数?

来自分类Dev

如何从网址获取ID

来自分类Dev

如何从网址获取文本

来自分类Dev

如何从网址获取参数

来自分类Dev

如何从引用网址获取网址路径

来自分类Dev

从网址列表中获取wget jpg并保持相同的结构

来自分类Dev

如何从此python 3代码获取最大的文件?

来自分类Dev

如何从此字符串获取alt值?

来自分类Dev

如何使用Clang从此示例获取基类?

来自分类Dev

Android:如何从此json获取JSON对象密钥:

来自分类Dev

如何通过使用Selenium从此代码中获取价值?

来自分类Dev

Python如何从此api字典中获取所有ID