最新公告
  • 欢迎您光临叮咚源码网,建议Ctrl+D收藏本站!立即加入我们
  • 宝塔面板Nginx 屏蔽搜索引擎蜘蛛抓取访问网站的方法

    一些不做SEO的网站,不想蜘蛛来爬取我们的网站,而且大量的蜘蛛爬取记录也会占用服务器资源,严重的可能导致服务器CPU飙升到100%

    这时候我们就有必要屏蔽掉蜘蛛抓取我们的网站。

    使用”robots.txt”规范

    在网站根目录新建空白文件,命名为”robots.txt”,将下面内容保存即可,更多蜘蛛标识可以参考继续添加。

    User-agent: Baiduspider
    Disallow:
    User-agent: YisouSpider
    Disallow:
    User-agent: 360Spider
    Disallow:
    User-agent: Sosospider
    Disallow:
    User-agent: sogou spider
    Disallow:
    User-agent: YodaoBot
    Disallow:
    User-agent: Googlebot
    Disallow:
    User-agent: bingbot
    Disallow:
    User-agent: *
    Disallow: /
    

    但是有些爬虫是不按规则出牌的,我们必须要能自己控制,就加上下面的方法

    修改 Nginx 配置文件

    宝塔面板为例,找到网站修改,点击配置文件

        #禁止Scrapy等工具的抓取
        if ($http_user_agent ~ (Scrapy|Curl|HttpClient)) {
          return 403;
        }
        #禁止指定UA及UA为空的访问
        if ($http_user_agent ~ "SemrushBot|qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Feedfetcher-Google|Yahoo! Slurp|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot|ia_archiver|Tomato Bot|YandexBot|Bytespider|FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|Ezooms|^$" ) {
    		return 403;
        }
        #禁止非GET|HEAD|POST方式的抓取
        if ($request_method !~ ^(GET|HEAD|POST)$) {
          return 403;
        } 
    

    注意:~为模糊匹配,~*为模糊匹配不区分大小写

    宝塔面板Nginx 屏蔽搜索引擎蜘蛛抓取访问网站的方法-叮咚源码网

    一般这样设置后,识别到蜘蛛访问就会返回403代码了

    1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
    2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
    3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
    4. 本站提供的非原创源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
    5. 如有链接无法下载、失效或广告,请联系管理员处理!
    6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
    叮咚源码网 » 宝塔面板Nginx 屏蔽搜索引擎蜘蛛抓取访问网站的方法

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    关于售后和技术支持
    本站原创源码购买时间超过7天的,不提供任何售后和技术指导,非本站原创源码、其他任何源码均不含任何技术支持和指导修改服务,整理的源码太多,脑子记不住那么多东西,实在没法指导你这个东西在哪儿改,哪个东西怎么用!
    升级SVIP尊享更多特权立即升级