php-获得网页的所有链接

2021-11-27 152 0

<?php
$url="http://www.baidu.com";
// 获取链接的HTML代码
$html=file_get_contents($url);
// 创建DOMdocument对象
$dom=new DOMdocument();
@$dom->loadHTML($html);
$xpath=new DOMxpath($dom);
// $xpath->evaluate对给定的XPath表达式并返回一个类型的结果,如果可能的话
$hrefs = $xpath->evaluate('/html/body//a');
for($i=0;$i<$hrefs->length;$i++){
	$href=$hrefs->item($i);
	$url=$href->getAttribute("href");
	// echo $url.'<br>';
	// 保留以http开头的链接
	if(substr($url, 0, 4) == 'http')
	echo $url.'<br >';
}
?>

相关文章

Linux-如何升级php的版本
WordPress-更换链接格式之后报404错误
Linux-使用Remi源安装最新版PHP
PHP-WordPress连接数据库失败问题
php-网络安全实验室脚本关快速口算题
php-从网页中提取关键字

发布评论