别让网站的robots成为最大的安全漏洞

       你的网站信息安全吗?树大招风,一些公司往往再收到攻击之后,才想起网站安全。网站注册的个人信息能被黑客们轻易的拿下,对用户造成的损失无法估量。没有100%安全而完美的系统,黑客们乐此不彼的研究着这些网站的安全漏洞,总有一天会被攻破。

       网站根目录下的robots.txt文件告诉搜索引擎的访问范围,使用方法很简单,但是搜索引擎还是个人来说都是可以访问的, 很多新人不知道这个文件的重要性,对于渗透测试人员或黑客,可以通过robots.txt文件发现敏感信息,比如猜测这是什么后台用什么数据库等,意味着自己的网站是真空上阵。

别让网站的robots成为最大的安全漏洞

如何防止别人访问呢?

       网上有人这么做:在IIS中,选中robots.txt,右键属性里,选中重定向到URL,输入任意一个非本站的URL路径,勾选“上面准确的URL”以及“资源的永久重定向”,有点基础的童鞋知道,访问 http://域名/robots.txt 时,是自动跳转到指定的那个非本站URL路径。 这个方法在Apache环境中可以借助.htaccess达到这个重定向的目的。

       但是对于蜘蛛来说,这样的跳转意味着站内不存在这个文件,那蜘蛛就不会遵守这个规则,把能发现的URL都抓了。

       为防止别人利用robots文件泄露了网站的结构,做其他手脚,站长们是绞尽脑汁。不让搜索引擎来抓这个文件,那就不遵从抓取范围,都会放进索引库,对不想让搜索引擎建立索引的方法参考:页面不让搜索引擎建立索引。

实用的防护措施,推荐采用通配符(*)替换敏感文件或文件夹

      比如某个重要文件夹为admin,可以这样写robots

User-agent:
Disallow:/a*/

       意思是禁止所有搜索引擎索引根目录下a开头的目录,一般的网站的比较通用的命名有admin,include,templets,plus等,这些都是重要的文件夹,可以修改文件名,但是其他关联一并修改,否则系统会出错。

用.htaccess禁止垃圾蜘蛛访问

一搜YisouSpider   #无视robots规则
宜搜EasouSpider   #无视robots规则
易查   #无视robots规则
MSNmsnbot-media
有道youdao
必应bingbot

       当然你也要看流量来源,如果有,那就不要屏蔽,实在是少得很有每天很勤快的来访的话,可以屏蔽。

robots屏蔽蜘蛛

User-agent: YisouSpider
Disallow: /
User-agent: EasouSpider
Disallow: /
User-agent: msnbot-media
Disallow: /
User-agent: YoudaoBot
Disallow: /
User-agent: bingbot
Disallow: /

.htaccess屏蔽蜘蛛

SetEnvIfNoCase User-Agent "^Yisou" bad_bot
SetEnvIfNoCase User-Agent "^Easou" bad_bot
SetEnvIfNoCase User-Agent "^Youdao" bad_bot
SetEnvIfNoCase User-Agent "^msn" bad_bot
Deny from env=bad_bot 

       或者如下写法,中间加就行了

RewriteCond %{HTTP_USER_AGENT} (jikeSpider|easouSpider|YisouSpider|bingbot|YoudaoBot|) [NC]

主题测试文章,只做测试使用。发布者:佰搜SEM,转转请注明出处:https://baidusem.com/8747.html

(0)
佰搜SEM的头像佰搜SEM
上一篇 2024年12月24日 下午12:13
下一篇 2024年12月24日

相关推荐

  • 揭秘电影网站劫持收录的真相及应对策略

    随着互联网的快速发展,电影网站成为了人们获取电影资源的重要渠道,近年来,电影网站劫持收录的现象愈发严重,不仅损害了用户的观影体验,还严重影响了电影行业的健康发展,本文将深入剖析电影网站劫持收录的真相,并提出相应的应对策略。 电影网站劫持收录的真相 1、竞争激烈,利益驱动 在电影网站领域,竞争日益激烈,一些网站为了获取更多流量,提高自己的排名,不惜采取不正当手…

    2025年4月8日
    6300
  • 网站被搜索引擎收录,揭秘搜索引擎优化策略与技巧

    随着互联网的快速发展,网站已成为企业展示形象、拓展业务的重要平台,如何让自己的网站在搜索引擎中脱颖而出,被大量用户搜索到,成为许多网站运营者关心的问题,本文将为您揭秘搜索引擎优化(SEO)策略与技巧,帮助您的网站顺利被收录。 搜索引擎收录原理 搜索引擎收录是指搜索引擎通过爬虫程序(如百度蜘蛛、谷歌爬虫等)抓取网站内容,并将其存储在索引库中,以便用户通过关键词…

    2025年4月1日
    5100
  • 深入解析课题论文收录的黄金网站,掌握学术资源的秘籍

    在学术研究领域,课题论文的收录情况直接关系到研究成果的传播与认可度,一份高质量的课题论文,若能被权威网站收录,无疑将为作者带来更高的学术声誉和更广泛的学术影响力,哪些网站是课题论文收录的黄金阵地呢?本文将为您一一揭晓。 中国知网(CNKI) 作为中国最大的学术文献数据库,中国知网(CNKI)收录了大量的中文期刊、学位论文、会议论文等学术资源,其收录的课题论文…

    2025年3月21日
    3500
  • 什么是301重定向怎么设置方法

    301重定向设置给网站带来什么好处        301重定向设置作为网站的常见设置之一,是基础优化良好的衡量标准之一,让网站集中权重,降低页面重复率的有效措施。 1.网站更换新的域名        如果想保留原来站点的权重,那最好是做301重定向。比如原来的京东域名:360bu…

    2025年1月14日
    4800
  • 网站没收录怎么回事?揭秘搜索引擎收录难题及解决方案

    随着互联网的飞速发展,越来越多的企业开始重视网络营销,将网站作为展示企业形象、拓展业务的重要平台,在运营过程中,很多企业都会遇到网站没收录的问题,这无疑给企业带来了巨大的困扰,网站没收录怎么回事?下面我们就来揭秘搜索引擎收录难题及解决方案。 网站没收录的原因 1、网站结构不合理 网站结构是搜索引擎抓取网站内容的关键因素之一,如果网站结构混乱,层次不清,搜索引…

    2025年5月6日
    2300

联系我们

在线咨询: QQ交谈

邮件:3413323304@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
网站+域名可转让!