網(wǎng)站推廣公司為你全面及解析“百度蜘蛛”
作為資深的站長,不可能不認(rèn)識百度蜘蛛,新晉的SEO小白也肯定對它不陌生,但你真的了解百度蜘蛛嗎?讓我們一起來看看吧;
Baiduspider也叫百度蜘蛛,是百度搜索引擎的一個自動程序,它的作用是訪問互聯(lián)網(wǎng)上的網(wǎng)頁,建立索引數(shù)據(jù)庫,使用戶能在百度搜索引擎中搜索到網(wǎng)站相關(guān)內(nèi)容。 那么又該如何識別當(dāng)前抓取的是正確的百度蜘蛛呢?
作為開發(fā)者可以通過以下兩個方式來判斷:
1、雙向DNS解析認(rèn)證
第1步:DNS反查IP
開發(fā)者通過對日志中訪問服務(wù)器的IP地址運行反向DNS查找,判斷某只spider是否來自百度搜索引擎,Baiduspider的hostname以*.baidu.com或*.baidu.jp 的格式命名,其他格式即為冒充。
不同類型的平臺驗證方法也不同,如Linux / Windows / OS三種平臺下的驗證方法分別如下:
(1)在Linux平臺下,可以使用host ip命令反解ip來判斷是否來自Baiduspider的抓取。
(2)在Windows平臺下,可以使用nslookup ip命令反解ip來 判斷是否來自Baiduspider的抓取 。
(3)在Mac OS平臺下,可以使用dig 命令反解ip來 判斷是否來自Baiduspider的抓取。
第2步:對域名運行正向DNS查找
對第1步中通過命令檢索到的域名運行正向DNS查找,驗證該域名與您日志中訪問服務(wù)器的原始IP地址是否一致,IP地址一致可確認(rèn)spider來自百度搜索引擎,IP地址不一致即為冒充。
2、查看UA信息
如果UA信息不對,可以直接判斷為非百度搜索的蜘蛛。目前UA分為移動、PC、和小程序三個應(yīng)用場景,這三個渠道UA分別如下:
移動UA
Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko)Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
或者
Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)
PC UA
Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)
或者
Mozilla/5.0 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
小程序UA
Mozilla/5.0 (iPhone;CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko)Version/9.0 Mobile/13B143 Safari/601.1 (compatible; Baiduspider-render/2.0;Smartapp; +http://www.baidu.com/search/spider.html)
這個時候也會有一些站長要問了百度蜘蛛會一直抓我的網(wǎng)站嗎?
答案是一般會的,若網(wǎng)站持續(xù)生產(chǎn)新資源、更新內(nèi)容等,蜘蛛會持續(xù)抓取的。需要提醒的是,若網(wǎng)站需要百度蜘蛛抓取一定不要做任何封禁哦。
此外,您也可以檢查網(wǎng)站訪問日志,及時判斷正確的百度蜘蛛,以防止有人惡意冒充百度蜘蛛來頻繁抓取您的網(wǎng)站。
百度蜘蛛來抓取的次數(shù)多了,也就意味著被收錄的概率更高,可能有些站長又要擔(dān)心了,百度蜘蛛頻繁光顧網(wǎng)站,導(dǎo)致網(wǎng)站服務(wù)器壓力大,怎么辦?
若發(fā)現(xiàn)百度蜘蛛頻繁抓取,可能是因為以下2個原因。
(1)網(wǎng)站存在新生產(chǎn)資源、更新內(nèi)容待抓取更新;
(2) 可能存在惡意冒充百度蜘蛛,可以通過上文Q2“如何識別正常百度蜘蛛”的方法排查問題;
若百度蜘蛛抓取頻次過高,造成網(wǎng)站服務(wù)異常,可以通過百度搜索資源平臺-【抓取頻次】工具調(diào)整頻次。