我有正确的正则表达式来查找文本中的网址,但是我无法解决一件事。如果网址以DOT结尾-该点作为网址的一部分匹配。
这是我的模式:
/(^|[\?\s])(www\.[^\? ]+\/[^\/ ]*\?[^\? ]+|www\.[^\? ]+)/g
例如,文字是 'The url is www.domain.com. Second is wiki.org.'
Urls最后一个点不是url的一部分,但是正则表达式也替换了它。
最简单的解决方法是要求非标点字符作为最后一个字符:
/(^|[?\s])(www\.[^? ]+\/[^/ ]*\?[^? ]*[^?.,! ]|www\.[^? ]*[^?.,! ])/g
请注意,我删除了您的一些反斜杠,因为它们不是必需的。
但是,这仍然不是可靠的URL模式。那么,为什么要重新发明轮子而不是仅仅使用一些已建立的URL模式呢?
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句