关于php抓取页面信息的简单代码_PHP_编程开发_程序员俱乐部

中国优秀的程序员网站程序员频道CXYCLUB技术地图
热搜:
更多>>
 
您所在的位置: 程序员俱乐部 > 编程开发 > PHP > 关于php抓取页面信息的简单代码

关于php抓取页面信息的简单代码

 2011/10/11 8:12:41  mj133233  http://mj133233.iteye.com  我要评论(0)
  • 摘要:?利用phpDOM函数实现简单的单页信息抓取(在这里尽抓取a标签,功能实现了,但是扩展页链接抓取没有实现,欢迎大家批评指导)<?phperror_reporting(E_ERROR);$pages=file_get_contents('http://www.php100.com');//$pages=htmlspecialchars($pages);$doc=newDOMDocument();$new_doc=newDOMDocument('1.0','utf-8');$doc->
  • 标签:PHP 代码
?利用php DOM函数实现简单的单页信息抓取   (在这里尽抓取a标签,功能实现了,但是扩展页链接抓取没有实现,欢迎大家批评指导)
<?php
error_reporting(E_ERROR);
$pages = file_get_contents('http://www.php100.com');
//$pages = htmlspecialchars($pages);
$doc = new DOMDocument();
$new_doc = new DOMDocument('1.0', 'utf-8');
$doc->loadhtml($pages);
$dom = $doc->getElementsByTagName('a');
for ($i=0;$i<$dom->length;$i++){
$node = $new_doc->createElement('a',$dom->item($i)->nodeValue);
$newnode = $new_doc->appendChild($node);
$newnode->setAttribute('href',$dom->item($i)->getAttribute('href'));
$newnode->setAttribute('style','display:block;margin-left:30px;');//echo $dom->item($i)->getAttribute('src').'</br>';
}
echo $new_doc->saveHTML();
?>
发表评论
用户名: 匿名