我有以下代码,可获取存储在字符串变量中的YouTube URL:
function getVideoUrlsFromString($html) {
$regex = '#((?:www\.)?(?:youtube\.com\/(?:watch\?v=|embed\/)|youtu\.be\/)([a-zA-Z0-9-]*))#i';
preg_match_all($regex, $html, $matches);
$matches = array_unique($matches[0]);
usort($matches, function($a, $b) {
return strlen($b) - strlen($a);
});
return $matches;
}
$html = 'https://www.youtube-nocookie.com/embed/VWrlXsmcL2E';
$html = getVideoUrlsFromString($html);
print_r($html);
但这不适用于:
https://www.youtube-nocookie.com/embed/VWrlXsmcL2E
http://www.youtube.com/v/NLqAF9hrVbY?fs=1&hl=en_US
有什么方法可以更改正则表达式以使其与这两个常用YouTube URL一起使用?
这样的事情应该可以解决问题:
<?php
function getVideoUrlsFromString($html) {
$regex = '#((?:www\.)?(?:youtube\.com\/(?:watch\?v=|embed\/|v\/)|youtu\.be\/|youtube\-nocookie\.com\/embed\/)([a-zA-Z0-9-]*))#i';
preg_match_all($regex, $html, $matches);
$matches = array_unique($matches[0]);
usort($matches, function($a, $b) {
return strlen($b) - strlen($a);
});
return $matches;
}
$html = '
https://www.youtube-nocookie.com/embed/VWrlXsmcL2E
http://www.youtube.com/v/NLqAF9hrVbY?fs=1&hl=en_US
';
$html = getVideoUrlsFromString($html);
print_r($html);
输出:
Array
(
[0] => www.youtube-nocookie.com/embed/VWrlXsmcL2E
[1] => www.youtube.com/v/NLqAF9hrVbY
)
这是两者的区别,以了解添加了什么:
#((?:www\.)?(?:youtube\.com\/(?:watch\?v=|embed\/ )|youtu\.be\/ )([a-zA-Z0-9-]*))#i
#((?:www\.)?(?:youtube\.com\/(?:watch\?v=|embed\/|v\/)|youtu\.be\/|youtube\-nocookie\.com\/embed\/)([a-zA-Z0-9-]*))#i
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句