我正在使用simple_html_dom [ http://sourceforge.net/projects/simplehtmldom/ ]通过HTML进行解析。
我试图获取所有的<script>
URL,获取内容,然后将其替换为$html
变量...我有这个,它几乎可以像我想要的那样工作:
$html_elements = str_get_html( $html );
$current_src = array( );
$new_src = array( );
foreach($html_elements->find('script') as $element) {
if( $element->src != '' )
{
$script_url = $element->src;
$script_data = get_script( $script_url );
$current_src[] = $element->outertext;
$new_src[] = "<script>" . $element->innertext . "\n" . $script_data . "</script>";
}
}
$html = str_replace( $current_src, $new_src, $html );
function get_script( $url )
{
$data = file_get_contents( $url );
return $data;
}
问题是当一切都说完之后,似乎正在将javascript文件中的加号转为空格?
请参考上面的评论部分。
经过进一步调试后,我将urldecode()
在代码的后面部分多次解析数据。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句