從10月底至今,很多站長遇到了站點收錄變慢、收錄量變少甚至是完全不收錄的問題。百度站長平臺官方反饋,得到的回復幾乎都是一樣的結果,讓人感到十分“無力“。
大家應該對百度官方這條回復已經爛熟于心了:
“您好,反饋頁面已被抓取成功,預計需要一周的時間收錄,請耐心等待,感謝您對百度的關注和支持!”
對于收錄這件事情,也一直很關注,同時也有不少站長希望我們能聊一聊百度不收錄的話題。
坦白的說,關于目前百度收錄問題,在咨詢官方人員后,也沒有得到明確的回復,并不能給予站長朋友們實踐性的解決方案。不過我們還是對目前的收錄問題,做了一些簡單的數據分析和觀察,借此跟大家一起分享。
本次整理的數據來源需要強調和明確的是:
網站收錄量數據(最近60天)是基于百度site命令查詢得到,獲取的收錄數據與真實數據存在一定的誤差(百度官方提示只做參考)。
使用site命令同時添加了inurl命令過濾了部分數據,盡可能保障獲取的收錄數據值是查詢日期當日產生的新頁面,而不是舊頁面的快照頁面數據。
查詢的相關站點數據主要針對原先收錄表現比較好的子域名或者目錄,并不一定是整站收錄數據。
由于是使用site命令查詢站點的歷史數據,因此查詢到的站點對應日期收錄數據,并非頁面產生日期的當天收錄數據。
查詢站點并沒有涵蓋門戶站點、紙媒報媒旗下站點,主要是考慮此類大站點和百度往往有深度合作,加上權威性更強、數據量更新大,更不容易受到影響,即使受百度調整影響,也能及時恢復,因此沒有納入。
我們基于以上數據查詢的方法和查詢時間,獲取了站點收錄數據,僅供趨勢分析參考、管中窺豹,并不能代表相關站點的百度實際收錄情況。
下文以的子站點運營領域為例,我們篩選了一些知名的科技資訊媒體、素材資源類站點做數據觀察。
一、科技資訊類站點收錄觀察
根據所選的一些知名科技媒體(cnbeta、IT之家、Donews、Techweb、快科技、36氪、威鋒網、鞭牛士等)數據可以看出,這些站點的歷史收錄量波動幅度都比較大。
如上圖所示,多數站點的最近15天的歷史收錄量并沒有特別多,相對站點的日更新量來說,都整體偏低。
當然,也有些媒體站點收錄量并沒收太大的影響,雖然有所下降,但整體來說影響不大。以cnBeta為例(下圖),最近30天日均歷史收錄量基本穩定在150到200之間。(注:周末更新量較低,其收錄量相應減少,但也穩定在60到100之間)。
我們繼續觀察這些站點最近60天日均歷史的收錄情況,明顯看出大部分的站點收錄情況有一些共同的特征:
1、從10月25日到11月22日期間,多家站點的當日歷史收錄量降到一個很低的水平,每天僅收錄幾條。雖然存在百度SITE命令在查詢舊數據可能不精準的情況,但是不可否認的是,多數站長明確感知到這期間收錄存在明顯的減少。
11月期間,子站點產生的新頁面收錄量也是大幅度減少。即使目前通過SITE命令查詢歷史結果也顯示這期間產生的頁面依然沒有被收錄。
2、從11月23日開始,大部分站點的日均歷史收錄量都明顯增加,但仍未恢復到正常狀態。這期間,許多站長感受最深的一點就是,收錄量有限,收錄時間比以往要慢,有明顯滯后的情況存在,往往有1至2周的收錄延遲。
3、從12月21日開始,一些科技資訊類站點的日均歷史收錄量明顯的上漲,漲幅較大。
我們以驅動中國最近60天的日均歷史收錄情況為例,該站點從11月22日至12月17日期間,收錄情況得到了改善,開始出現增長,從原先數十條收錄量上升至30條左右。而到了12月23日,收錄量70多條,漲了近一倍。
同樣的,可以看到TechWeb、donews等站點收錄量也是從12月21日開始攀升,23日則達到最近幾天的峰值。其中Donews從原先的幾十條上漲到300多條,TechWeb也是從十多條增長至近200條。
不過,也有一些站點的收錄情況依舊沒有改善,始終保持在較低的水平。
二、設計資源站點收錄觀察
我們也觀察了多家設計素材資源類站點(千網、我圖網、紅動中國、昵圖網、懶人圖庫等),同樣發現大部分最近60天日均歷史收錄情況與科技資訊類站點有很大的相似性。
1、10月25日到11月22日期間,日均歷史收錄量都大幅度減少。
2、從12月21日開始,一些資源類站點的歷史收錄量明顯的上漲,漲幅較大。漲幅情況從下圖就可以看出來,這里就不再作仔細分析了。
三、觀察總結
11月份期間的歷史收錄數據反饋出,很多中小網站的收錄數據出現明顯異常、減少或者不收錄,原創度以及更新度比較高的站點也未能避免。
11月份至今,許多原本收錄很好的網站,網站的收錄時間也出現了明顯的滯后情況,新產生的頁面,往往需要1-2周才會被收錄。
11月底開始,大部分站點的歷史收錄量開始增加,期間百度可能存在調整。
12月21號之后,許多站點的收錄量開始暴漲,接近正常水平,很有可能是百度的新一輪調整改善了收錄情況。
這里做個補充:收錄異常期間,通過對部分網站的蜘蛛分析發現,百度蜘蛛對最新頁面的爬取大幅度減少,但是歷史頁面爬取頻率并沒有出現明顯的下降。
雖然此前百度就明確表示,將在年末嚴加打擊快排站點、聚合頁、垃圾內容,不過我們的觀察并不能直接得出近期的收錄異常與此有直接的相關性。
好消息是,從目前的收錄查詢數據來看,百度肯定也在積極的調整和改善。
2021年將至,隨著新一波的改善,有人已經站在了山頂,有人還在山底徘徊,只能抱團取暖,2020年末的冬天,我們不曾“孤獨”!
投票模塊插入