百度新版Baiduspider移动ua升级

百度发布公告:Baiduspider针对移动抓取user agent(以下简称ua)进行了升级,与PC端的抓取ua做到版本统一,均称为Baiduspider/2.0。移动ua和pc ua详情如下:

新版移动ua:

Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;)

AppleWebKit/534.46 (.html"https://www.motuuu.com/news/795.html" target="_blank">移动页),通过设置robots的agent封禁达到只让移动Baiduspider抓取的目的,但由于 PC和移动Baiduspider的agent都是Baiduspider,所以这种方法不可取。

之前通过“+http://www.baidu.com/search/spider.html"网站" href="https://www.motuuu.com/news/tags/wangzhan.html" target="_blank" class="keywordlink">网站需要修改识别方式,新的正确的识别Baiduspider移动ua的方法有:

1. 通过关键词“Android”或者“Mobile”来进行识别,判断为移动访问或者抓取。

2. 通过关键词“Baiduspider/2.0”,判断为百度爬虫。

相关阅读:

百度官方:spider抓取过程中的策略

百度:巧用robots避免蜘蛛黑洞

百度:搜索引擎抓取系统概述

百度确认:蜘蛛会抓取纯文本链接的URL