百度蜘蛛抓取體驗,,聽上去是一個新名詞,,其實它和用戶體驗一樣,很早就出現(xiàn)在SEO行業(yè)里面了。百度蜘蛛抓取體驗,,可能是潛伏在資深SEOER腦海里的一個詞。
什么是百度蜘蛛抓取體驗?zāi)??良好的代碼結(jié)構(gòu),,良好的URL結(jié)構(gòu)。相信很多站長都有采集經(jīng)驗,,很多CMS都帶有采集功能,。
百度蜘蛛抓取體驗和你寫采集規(guī)則是一樣的,一個網(wǎng)站有良好的代碼結(jié)構(gòu),,良好的URL結(jié)構(gòu),,你可以輕易寫出采集規(guī)則,順利完成這個網(wǎng)站內(nèi)容采集工作,。
URL,,一個網(wǎng)站的URL如果很復雜,經(jīng)過幾次302或301跳轉(zhuǎn)后才能到達目的頁面,。這樣的URL,,如果你要用CMS寫采集規(guī)則,是不是增加了采集規(guī)則的難度,。有些URL甚至通過JS跳轉(zhuǎn),,才能到達內(nèi)容頁面,這些URL鏈接,,請問該如何寫采集規(guī)則,。
代碼結(jié)構(gòu),一個網(wǎng)站的列表頁面和內(nèi)容頁面,,代碼非常復雜,。有可能是word編輯的內(nèi)容,,直接復制到網(wǎng)站后臺編輯器,直接發(fā)布,。一個列表頁面,,可能是JS,iframe嵌入頁面,,這樣的代碼結(jié)構(gòu),,該如何寫采集規(guī)則?你可能就直接放棄采集這個網(wǎng)站,。百度蜘蛛也一樣,,可能計劃來1萬次抓取的,由于分析效率太低,,它可能只能來3000次,。
如果SEOER有編程經(jīng)驗,通過對代碼復雜的分析,,針對網(wǎng)站寫出采集規(guī)則是沒問題的,。那么,百度蜘蛛呢,?百度蜘蛛該如何來抓取這些內(nèi)容,,百度蜘蛛可不會針對某個網(wǎng)站寫采集規(guī)則。
前幾天Loghao一個蜘蛛分析案例,,他網(wǎng)站的百度蜘蛛狀態(tài)碼40%都是302,?筆者仔細看了他網(wǎng)站的鏈接結(jié)構(gòu),都是/xxxx結(jié)尾的,,訪問后鏈接后面自動加了/,,變?yōu)?xxxx/。百度蜘蛛訪問/xxxx后通過302跳轉(zhuǎn),,到了/xxxx/,。請問,這樣的跳轉(zhuǎn)訪問,,百度蜘蛛抓取體驗是怎么樣的,?答案很明確,造成了蜘蛛多訪問一次,,如果這個網(wǎng)站有100萬頁面,,蜘蛛就會多訪問100萬次,才能抓取到目標內(nèi)容,。
所以,,一個良好的URL規(guī)則,和代碼規(guī)則,,可以很大程度提高百度抓取體驗,,提高收錄幾率,。