我必须从旧站点拆分HTML块以存储在数据库中。我使用带有jQuery插件的Node.js进行基本拆分,但是有3个部分我无法拆分。
1)产品ID,位于网址中。此ID在最后一个/之后开始,并在以下之前停止-
2)价格,从第一个开始;并在以下“”(空格)之前停止
3)名称,该名称在第一个>之后开始,并在此字符串“ item listing”之前停止
我不想让别人为我工作,但我现在知道如何从弄清楚如何针对这些情况提出正则表达式开始。也许朝正确的方向推动就足够了。
<a href="privateurl/2332/32322-product-name-blah">
<div>
<span>Product Name Blah item listing</span>
<div>
<span>
Our price:<br />
$0.25 USD
</span>
</div>
</div>
</a>
它简化了一些,但是您可以将ID,名称和价格分开。
var s = '<a href="privateurl/2332/32322-product-name-blah">\n\
<div>\n\
<span>Product Name Blah item listing</span>\n\
<div>\n\
<span>\n\
Our price:<br />\n\
$0.25 USD\n\
</span>\n\
</div>\n\
</div>\n\
</a>';
s.match(/\/([^/-]*)-(?!.*\/.*)/)[1] // => "32322"
s.match(/;([^ ]+)/)[1] // => "0.25"
s.match(/>(.*?) item listing/i)[1] // => "Product Name Blah"
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句