從10月底至今,很多站長遇到了站點收錄變慢、收錄量變少甚至是完全不收錄的問題。百度站長平臺官方反饋,得到的回復(fù)幾乎都是一樣的結(jié)果,讓人感到十分“無力“。
大家應(yīng)該對百度官方這條回復(fù)已經(jīng)爛熟于心了:
“您好,反饋頁面已被抓取成功,預(yù)計需要一周的時間收錄,請耐心等待,感謝您對百度的關(guān)注和支持!”
對于收錄這件事情,也一直很關(guān)注,同時也有不少站長希望我們能聊一聊百度不收錄的話題。
坦白的說,關(guān)于目前百度收錄問題,在咨詢官方人員后,也沒有得到明確的回復(fù),并不能給予站長朋友們實踐性的解決方案。不過我們還是對目前的收錄問題,做了一些簡單的數(shù)據(jù)分析和觀察,借此跟大家一起分享。
本次整理的數(shù)據(jù)來源需要強調(diào)和明確的是:
網(wǎng)站收錄量數(shù)據(jù)(最近60天)是基于百度site命令查詢得到,獲取的收錄數(shù)據(jù)與真實數(shù)據(jù)存在一定的誤差(百度官方提示只做參考)。
使用site命令同時添加了inurl命令過濾了部分?jǐn)?shù)據(jù),盡可能保障獲取的收錄數(shù)據(jù)值是查詢?nèi)掌诋?dāng)日產(chǎn)生的新頁面,而不是舊頁面的快照頁面數(shù)據(jù)。
查詢的相關(guān)站點數(shù)據(jù)主要針對原先收錄表現(xiàn)比較好的子域名或者目錄,并不一定是整站收錄數(shù)據(jù)。
由于是使用site命令查詢站點的歷史數(shù)據(jù),因此查詢到的站點對應(yīng)日期收錄數(shù)據(jù),并非頁面產(chǎn)生日期的當(dāng)天收錄數(shù)據(jù)。
查詢站點并沒有涵蓋門戶站點、紙媒報媒旗下站點,主要是考慮此類大站點和百度往往有深度合作,加上權(quán)威性更強、數(shù)據(jù)量更新大,更不容易受到影響,即使受百度調(diào)整影響,也能及時恢復(fù),因此沒有納入。
我們基于以上數(shù)據(jù)查詢的方法和查詢時間,獲取了站點收錄數(shù)據(jù),僅供趨勢分析參考、管中窺豹,并不能代表相關(guān)站點的百度實際收錄情況。
下文以的子站點運營領(lǐng)域為例,我們篩選了一些知名的科技資訊媒體、素材資源類站點做數(shù)據(jù)觀察。
一、科技資訊類站點收錄觀察
根據(jù)所選的一些知名科技媒體(cnbeta、IT之家、Donews、Techweb、快科技、36氪、威鋒網(wǎng)、鞭牛士等)數(shù)據(jù)可以看出,這些站點的歷史收錄量波動幅度都比較大。
如上圖所示,多數(shù)站點的最近15天的歷史收錄量并沒有特別多,相對站點的日更新量來說,都整體偏低。
當(dāng)然,也有些媒體站點收錄量并沒收太大的影響,雖然有所下降,但整體來說影響不大。以cnBeta為例(下圖),最近30天日均歷史收錄量基本穩(wěn)定在150到200之間。(注:周末更新量較低,其收錄量相應(yīng)減少,但也穩(wěn)定在60到100之間)。
我們繼續(xù)觀察這些站點最近60天日均歷史的收錄情況,明顯看出大部分的站點收錄情況有一些共同的特征:
1、從10月25日到11月22日期間,多家站點的當(dāng)日歷史收錄量降到一個很低的水平,每天僅收錄幾條。雖然存在百度SITE命令在查詢舊數(shù)據(jù)可能不精準(zhǔn)的情況,但是不可否認(rèn)的是,多數(shù)站長明確感知到這期間收錄存在明顯的減少。
11月期間,子站點產(chǎn)生的新頁面收錄量也是大幅度減少。即使目前通過SITE命令查詢歷史結(jié)果也顯示這期間產(chǎn)生的頁面依然沒有被收錄。
2、從11月23日開始,大部分站點的日均歷史收錄量都明顯增加,但仍未恢復(fù)到正常狀態(tài)。這期間,許多站長感受最深的一點就是,收錄量有限,收錄時間比以往要慢,有明顯滯后的情況存在,往往有1至2周的收錄延遲。
3、從12月21日開始,一些科技資訊類站點的日均歷史收錄量明顯的上漲,漲幅較大。
我們以驅(qū)動中國最近60天的日均歷史收錄情況為例,該站點從11月22日至12月17日期間,收錄情況得到了改善,開始出現(xiàn)增長,從原先數(shù)十條收錄量上升至30條左右。而到了12月23日,收錄量70多條,漲了近一倍。
同樣的,可以看到TechWeb、donews等站點收錄量也是從12月21日開始攀升,23日則達(dá)到最近幾天的峰值。其中Donews從原先的幾十條上漲到300多條,TechWeb也是從十多條增長至近200條。
不過,也有一些站點的收錄情況依舊沒有改善,始終保持在較低的水平。
二、設(shè)計資源站點收錄觀察
我們也觀察了多家設(shè)計素材資源類站點(千網(wǎng)、我圖網(wǎng)、紅動中國、昵圖網(wǎng)、懶人圖庫等),同樣發(fā)現(xiàn)大部分最近60天日均歷史收錄情況與科技資訊類站點有很大的相似性。
1、10月25日到11月22日期間,日均歷史收錄量都大幅度減少。
2、從12月21日開始,一些資源類站點的歷史收錄量明顯的上漲,漲幅較大。漲幅情況從下圖就可以看出來,這里就不再作仔細(xì)分析了。
三、觀察總結(jié)
11月份期間的歷史收錄數(shù)據(jù)反饋出,很多中小網(wǎng)站的收錄數(shù)據(jù)出現(xiàn)明顯異常、減少或者不收錄,原創(chuàng)度以及更新度比較高的站點也未能避免。
11月份至今,許多原本收錄很好的網(wǎng)站,網(wǎng)站的收錄時間也出現(xiàn)了明顯的滯后情況,新產(chǎn)生的頁面,往往需要1-2周才會被收錄。
11月底開始,大部分站點的歷史收錄量開始增加,期間百度可能存在調(diào)整。
12月21號之后,許多站點的收錄量開始暴漲,接近正常水平,很有可能是百度的新一輪調(diào)整改善了收錄情況。
這里做個補充:收錄異常期間,通過對部分網(wǎng)站的蜘蛛分析發(fā)現(xiàn),百度蜘蛛對最新頁面的爬取大幅度減少,但是歷史頁面爬取頻率并沒有出現(xiàn)明顯的下降。
雖然此前百度就明確表示,將在年末嚴(yán)加打擊快排站點、聚合頁、垃圾內(nèi)容,不過我們的觀察并不能直接得出近期的收錄異常與此有直接的相關(guān)性。
好消息是,從目前的收錄查詢數(shù)據(jù)來看,百度肯定也在積極的調(diào)整和改善。
2021年將至,隨著新一波的改善,有人已經(jīng)站在了山頂,有人還在山底徘徊,只能抱團取暖,2020年末的冬天,我們不曾“孤獨”!
投票模塊插入