正则表达式从链接URL获取ID

亚历克斯琴科

我有这样的链接:

<div class="zg_title">
  <a href="https://rads.stackoverflow.com/amzn/click/com/B000O3GCFU" rel="nofollow noreferrer">Thermos Foogo Leak-Proof Stainless St...</a>     
</div>

我像这样刮它们:

  product_asin = product.xpath('//div[@class="zg_title"]/a/@href').first.value 

问题在于,它占用了整个URL,而我只想获取ID:

B000O3GCFU

我想我需要做这样的事情:

product_asin = product.xpath('//div[@class="zg_title"]/a/@href').first.value[ReGEX_HERE]

在这种情况下,我能使用的最简单的正则表达式是什么?

编辑:

奇怪的是,链接URL似乎不完整:

http://www.amazon.com/Thermos-Foogo-Leak-Proof-Stainless-10-Ounce/dp/B000O3GCFU/ref=zg_bs_baby-products_1
虚假的

用途/\w+$/

p doc.xpath('//div[@class="zg_title"]/a/@href').first.value[/\w+$/]

/\w+$/匹配尾随字母,数字,_


require 'nokogiri'

s = <<EOF
<div class="zg_title">
  <a href="http://rads.stackoverflow.com/amzn/click/B000O3GCFU">Thermos Foogo Leak-Proof Stainless St...</a>     
</div>
EOF

doc = Nokogiri::HTML(s)
p doc.xpath('//div[@class="zg_title"]/a/@href').first.value[/\w+$/]
# => "B000O3GCFU"

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

正则表达式vevo URL视频ID

来自分类Dev

用于获取ID的URL的正则表达式

来自分类Dev

删除链接的正则表达式

来自分类Dev

查找与正则表达式的链接

来自分类Dev

获取与javascript正则表达式的链接

来自分类Dev

如何使用正则表达式从URL获取主键?

来自分类Dev

正则表达式-链接格式

来自分类Dev

使用javascript正则表达式自动链接URL

来自分类Dev

尝试更新vimeo正则表达式以从包含“频道/职员”的URL获取ID

来自分类Dev

正则表达式从URL提取ID

来自分类Dev

如何使用正则表达式获取以下URL类型的文章ID

来自分类Dev

正则表达式以获取URL的特定部分

来自分类Dev

正则表达式从URL中提取链接

来自分类Dev

使用正则表达式获取唯一的ID

来自分类Dev

正则表达式,获取所有超链接

来自分类Dev

用于获取ID的URL的正则表达式

来自分类Dev

Python正则表达式获取URL

来自分类Dev

正则表达式php获取ID号

来自分类Dev

PHP正则表达式显示链接或URL

来自分类Dev

JavaScript正则表达式以获取url值

来自分类Dev

URL中的正则表达式,用于匹配ID

来自分类Dev

正则表达式-链接格式

来自分类Dev

使用正则表达式获取链接文本

来自分类Dev

使用正则表达式从URL检索“ id”

来自分类Dev

如何使用正则表达式获取以下URL类型的文章ID

来自分类Dev

正则表达式以获取URL的特定部分

来自分类Dev

正则表达式以获取URL中的文件类型

来自分类Dev

特定 url id 的正则表达式

来自分类Dev

如何编写正则表达式以从 URL 获取参数