教程集 www.jiaochengji.com
教程集 >  脚本编程  >  php  >  正文 php 抓取蜘蛛爬虫痕迹的代码分享

php 抓取蜘蛛爬虫痕迹的代码分享

发布时间:2016-09-11   编辑:jiaochengji.com
本文介绍下,php实现抓取蜘蛛爬虫痕迹的一段代码,有需要的朋友参考下。

用php代码分析web日志中蜘蛛爬虫痕迹,代码如下:

<?php
//获取蜘蛛爬虫名或防采集
//by www.jbxue.com
function isSpider(){
    $bots = array(
                    'Google'    => 'googlebot',
                    'Baidu'        => 'baiduspider',
                    'Yahoo'        => 'yahoo slurp',
                    'Soso'        => 'sosospider',
                    'Msn'        => 'msnbot',
                    'Altavista'    => 'scooter ',
                    'Sogou'        => 'sogou spider',
                    'Yodao'        => 'yodaobot'
            );
    $userAgent = strtolower($_SERVER['HTTP_USER_AGENT']);
    foreach ($bots as $k => $v){
        if (strstr($v,$userAgent)){
            return $k;
            break;
        }
    }
    return false;
} //by www.jbxue.com

//获取哪种蜘蛛爬虫后保存蜘蛛痕迹。
//根据采集时HTTP_USER_AGENT是否为空来防止采集
//抓蜘蛛爬虫 --by www.jbxue.com
$spi    = isSpider();
if($spi){
    $tlc_thispage    = addslashes($_SERVER['HTTP_USER_AGENT']);
    $file            = 'robot.txt';
    $time            = date('Y-m-d H:i:s',mktime());
    $handle            = fopen($file,'a+');
    $PR                = $_SERVER['REQUEST_URI'];
    fwrite($handle, "Time:{$time} ROBOT:{$spi} AGENT:{$tlc_thispage} URL:{$PR} \n\r");
    fclose($handle);
}
?>

您可能感兴趣的文章:
php 抓取蜘蛛爬虫痕迹的代码分享
python和爬虫有什么关系
零基础python爬虫需要多久
搜索引擎蜘蛛爬行统计分析
python爬虫能做什么
python的爬虫是什么意思
python爬虫能干什么
PHP采集器的简单示例代码
Python2爬虫入门:爬虫基础知识
python爬虫技术可以干什么

[关闭]
~ ~