regexp不是我的强项之一,因此需要您的帮助,让此regexp在网站源代码上获取pdf网址
if (preg_match("/http\:\/\/.*?\.pdf/i", $source)) {
在大多数情况下都可以正常工作,但例如当我获得具有链接网址的网站时,例如
http://doc.pdfsomething.com/somemore/name.pdf
我得到的是匹配的http://doc.pdf,而不是完整的pdf网址。
任何正则表达式大师,您的帮助将不胜感激。
您可以尝试在单词边界上进行匹配
preg_match("/http:\/\/.*?\.pdf\b/i", $source)
也就是说,.pdf
如果在之后的非单词字符将只匹配pdf
,例如"
,空格等。
或者,如果您知道该URL总是后面要跟一个特定字符(双引号"
?),那么您可以使用
preg_match("/http:\/\/.*?\.pdf\"/i", $source)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句