pdf regexp在php上匹配

尼斯克

regexp不是我的强项之一,因此需要您的帮助,让此regexp在网站源代码上获取pdf网址

if (preg_match("/http\:\/\/.*?\.pdf/i", $source)) {

在大多数情况下都可以正常工作,但例如当我获得具有链接网址的网站时,例如

http://doc.pdfsomething.com/somemore/name.pdf

我得到的是匹配的http://doc.pdf,而不是完整的pdf网址。

任何正则表达式大师,您的帮助将不胜感激。

马丁·康尼

您可以尝试在单词边界上进行匹配

preg_match("/http:\/\/.*?\.pdf\b/i", $source)

也就是说,.pdf如果在之后的非单词字符将只匹配pdf,例如",空格等。

或者,如果您知道该URL总是后面要跟一个特定字符(双引号"?),那么您可以使用

preg_match("/http:\/\/.*?\.pdf\"/i", $source)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章