通过IP反查(nslookup)判断百度蜘蛛IP真假

我们经常会碰到黑客利用伪装蜘蛛扫描网站,今天我们介绍下如何利用IP反查方法,判断蜘蛛是否为百度搜索引擎蜘蛛。

以百度为例,通常我们判断是否是百度蜘蛛抓取看用户代理字符串也就是User-Agent,但是User-Agent是可以模拟的,所以很多时候也会有虚假的模拟伪装成百度蜘蛛来抓取,这时候我们就需要学会分辨真伪。

通过IP反查(nslookup)判断百度蜘蛛IP真假

首先是百度User-Agent代理字符串,百度官方公布的有如下User-Agent:

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

新增渲染UA:

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

需要注意的是百度新增了一个移动的User-Agent,和一个PC的User-Agent。我们知道了百度蜘蛛的User-Agent,如何正确识别和判断某条抓取是否是真实的百度蜘蛛。

如何识别百度蜘蛛

1、首选我们需要通过关键词找User-Agent中是否包含Baiduspider;

2、如果想区分移动和PC的蜘蛛的话,我们还需要在结果中再进行关键词过滤,移动端的User-Agent包含:Android 、iPhone、Mobile等三个中至少一个。

3、通过上述操作我们可以分辨出哪些抓取是百度蜘蛛抓取,但并不能分辨真伪。

判断百度蜘蛛真伪

1、验证百度蜘蛛真伪我们一般使用的是DNS反查IP的方式来进行判断,首选我们需要找到上述抓取记录中蜘蛛的IP。

通过IP反查(nslookup)判断百度蜘蛛IP真假

通过IP反查(nslookup)判断百度蜘蛛IP真假

2、以windows操作系统为例,开始运行中输入cmd 弹出窗口中输入 nslookup (上述IP地址),判断百度蜘蛛的真伪,真是百度蜘蛛结果中会返回以*.baidu.com 或*.baidu.jp 的格式命名hostname,如不包含则为假百度蜘蛛。

常见HTTP状态码解读:

1、200代码,表示蜘蛛爬取正常

2、404代码,访问的这个链接是错误链接

3、301代码,永久重定向

4、302代码,表示临时重定向

5、304代码,客户端已经执行了GET,但文件未变化。

6、500代码,表示网站内部程序或服务器有错

主题测试文章,只做测试使用。发布者:佰搜SEM,转转请注明出处:https://baidusem.com/8595.html

(0)
佰搜SEM的头像佰搜SEM
上一篇 2024年12月11日 上午11:41
下一篇 2024年12月11日 上午11:41

相关推荐

  • 如何写出一份优秀的seo优化方案

    一 、网站定位在建设一个网站之前,我们首先要做的就是一个网站清晰的定位,会带来转化率相对较高的客户群体,我们建站的目的就是为了营销,只有集中来做某一件事,才会更好的展现我们的网站,这样网站内容建设相当也会比较简单。在做SEO的同时,我们首先就要先确认网站优化的最终SEO目标,有了一个明确的目标才能更好的安排具体的工作。这个目标可以是长期的、具有战略意义的,也…

    SEO优化 2022年5月7日
    6300
  • 铁矿:价格支撑会有吗?

      来源:紫金天风期货研究所   【20250305】铁矿:价格支撑会有吗?   观点小结    周度评述  供应端全球发运总量继续回升,澳洲天气好转后,发运量报复性回升,巴西北部降水回升,非主流地区发运偏高,到港量即将触底回升,供应端总体由偏宽松。需求端铁水和成材利润回升;废铁价差转强,247样本日均铁水环比+0.4万吨至227.9万吨…

    2025年6月3日
    4300
  • 如何让搜狗高效收录网站信息,实用技巧解析

    随着互联网的飞速发展,网站已经成为企业展示形象、拓展市场的重要平台,一个网站能否被搜索引擎收录,直接影响到网站的曝光度和流量,搜狗作为国内领先的搜索引擎之一,拥有庞大的用户群体,如何让搜狗高效收录网站信息呢?本文将为您解析实用技巧。 提高网站质量 1、优化网站结构 清晰的网站结构有助于搜索引擎更好地抓取网站内容,建议遵循以下原则: (1)使用简洁的URL,避…

    2025年4月25日
    2700
  • 网站有收录却无权重,揭秘优化困境及解决方案

    随着互联网的快速发展,越来越多的企业开始重视网站建设,希望通过网站提升品牌知名度、拓展业务渠道,许多企业在网站优化过程中遇到一个棘手的问题:网站有收录但是没有权重,本文将针对这一问题进行分析,并提出相应的解决方案。 网站收录与权重的关系 1、网站收录:指搜索引擎抓取并收录网站页面,使其在搜索引擎结果页面(SERP)中显示。 2、网站权重:指搜索引擎对网站的综…

    2025年4月2日
    6700
  • 揭秘被收录视频网站导航,一站式观影指南,轻松畅享海量影视资源

    随着互联网的飞速发展,视频网站如雨后春笋般涌现,为我们提供了丰富的观影选择,面对众多视频网站,如何快速找到心仪的影视资源,成为许多用户的一大难题,就让我们来揭秘被收录视频网站导航,为您打造一站式观影指南,轻松畅享海量影视资源。 被收录视频网站导航概述 被收录视频网站导航,顾名思义,是指将各大视频网站按照分类、类型、地区等进行整理,方便用户快速查找和浏览的网站…

    2025年5月15日
    3200

联系我们

在线咨询: QQ交谈

邮件:3413323304@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
网站+域名可转让!