教程集 www.jiaochengji.com
教程集 >  脚本编程  >  php  >  正文 php 模仿蜘蛛抓取内容并分析

php 模仿蜘蛛抓取内容并分析

发布时间:2016-10-27   编辑:jiaochengji.com
教程集为您提供php 模仿蜘蛛抓取内容并分析等资源,欢迎您收藏本站,我们将为您提供最新的php 模仿蜘蛛抓取内容并分析资源
这是一款模仿baidu,google抓取你网页时的样子哦,下面就是代码看看吧。

header("Content-Type:text/html;charset=gbk");
$message=$_POST['message'];
$contents = @file_get_contents("$message");
if($contents=="Forbidden"){
 $ch = curl_init();
 $timeout = 5;
 curl_setopt ($ch, CURLOPT_URL, "$message");
 curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
 curl_setopt ($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)");
 curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
 $contents = curl_exec($ch);
 curl_close($ch);
}
preg_match_all("/<title(.*?)</title>/is",$contents,$title);
preg_match_all("/<meta(.*?)>/is",$contents,$meta);
preg_match_all("/<body(.*?)body>/is",$contents,$body);
echo 'title:'.strip_tags($title[0][0]).'<br><br>';
for($i=0;$i<count($meta[0]);$i ){
 if(preg_match("/keywords/i",$meta[0][$i])){
  preg_match_all("/content="(.*?)"/is",$meta[0][$i],$keywords);

 }
 if(preg_match("/description/i",$meta[0][$i])){
  preg_match_all("/content="(.*?)"/is",$meta[0][$i],$description);

 }
}
echo 'keywords:'.strip_tags($keywords[1][0]).'<br><br>';
echo 'description:'.strip_tags($description[1][0]).'<br><br>';
echo 'body:'.strip_tags($body[0][0]);
?>

您可能感兴趣的文章:
php 模仿蜘蛛抓取内容并分析
搜索引擎蜘蛛爬行统计分析
GOOGLE 工作原理分析
Google排名不稳定问题
php 抓取蜘蛛爬虫痕迹的代码分享
python和爬虫有什么关系
photoshop设计蜘蛛侠纹理文字效果制作教程
python的爬虫是什么意思
通过PHP程序知道蜘蛛是否访问你的网站(附代码)
python爬虫能干什么

[关闭]
~ ~