百度 SEO優化:慎防討好了百度,反而得失了 Google
中國大陸 SEO 主要是百度搜尋引擎。一般適用於 Google 優化的手段亦適用於 BaiDu 百度 SEO 優化。但一些百度優化方法會對 Google 排名產生負面影響。兩者差異在於如何判斷網站網頁內容相關性、反向接連質量、權威性、網站結構、搜尋用戶意圖和用戶體驗。百度也強調排名是依據網頁對搜尋者的用戶體驗 User Experience。但是一個搜尋排名片段 Snippet 的用戶體驗是非常難準確量度。用戶體驗主要有以下幾個參考數據:
- Click Through Rate (CTR) 點擊率和 Expected Click Through Rate (ECTR) 預期點擊率:在搜尋排名結果曝光次數和點擊次數的比例。一般是排名愈前,點擊率愈高。
- Dwell Time 停留時間:指用戶點擊搜尋排名結果頁面點擊片段登陸後,然後按退回之間的停留時間,這是搜尋引擎可以量度。
- Time on Page 停留時間:指用戶瀏覽登陸後某頁面時間,是 Google Analytics (GA) 所顯示的數據,和 Dwell Time 是不同。Time on Page 是通過執行 Javascript 追蹤代碼計算出來。但如果無安裝 GA, 就只能依靠瀏覽器量度。Chrome 是 Google 的產品,要拿到 Chrome 收集的數據不難。而 Chrome 的市場佔有率已經起過 60%。
Google 曾經 (2010年) 表示排名不依賴 GA 數據。幾年後可能是另一種做法。但利用 Chrome 更精準計算用戶對網頁的體驗是很有可能。
百度 SEO 爭取第一頁排名需時更長
百度無一個自己可以控制同時佔有大市埸份額的瀏覽器,只能單靠 bounce 後的 Dwell Time, 無法更準確量度用戶體驗。很多搜尋用戶未必會按退回,只能假設例如一分鐘無退回 Bounce 時 Dwell Time 應以一分鐘計算。對於低搜尋量的長尾關鍵字,就需要更長時間才能收集足夠統計數據判斷用戶體驗。推論百度爭取第一頁排名需要比 Google 長幾倍的時間。
安裝百度的追蹤統計或許是有幫助,問題是國外網站加入百度 JavaScript 代碼接連國內伺服器常常令載入時間變得很慢,加載時間變慢對 Google 排名帶來負面影響。所以一般在市場上針對百度 SEO 優化的建議是將網頁伺服器放在國內,但這種做法對國外公司其實是不大可行:例如你要付合國內的內容審查,甚至背上刑事責任。
建立反向結連 Link Building 應以國內網站為目標
百度其實不是一個國際化的公司。由於百度只專注國內市場,中文網站。索引以國內中文網站為主。所以在站長工具提交網站是必需。所順理成章反向連結的建立亦應以國內網站 (或已經提交百庋站長工具的網站) 為目標,否則百度未必會察覺該反向連結。就算發現,需時更長。而國外的反向結連的權重亦應比國內的低。
不同搜尋意圖下 Dwell Time 有不同的演釋
Dwell Time 短不一定代表用戶體驗不好。例如:你查詢 “香港面積” Google 的結果第一多是 wiki, 你只須幾秒鐘就能消化答案,用戶體驗不能說不好,但 Dwell Time 只有幾秒。所以要更準確量度用戶體驗就要理解搜尋者意圖,Google 傳統的做法是 QDD 漁翁撒網, Google 新的做法是引入人工智能 AI, 透過 Deep Learning 分析搜尋用戶的意圖 (亦即所謂 Rainbrain 算法),當了解意圖後 Dwell Time 的長短在不同的意圖下有不同的演釋,有時短不一定不好。
兼且百度似乎不大關心用戶的搜尋意圖,常常在熱門搜尋結果頁面加入一大堆和用戶搜尋意圖不相關的內容,例如百度人物、百度地點、百度帖吧、百度文章等等。考慮自身的商業利益多於搜尋用戶利益,並且另優質內容更難曝光在第一頁。
解讀用戶意圖和用戶體驗
從前面所述結果然變顯示自己百度百科等等嘅資料、變相將搜尋結果頁面空間減少,所以多樣性亦都減少了,沒有了像 Google Query Deserves Diversity 操作,滿足搜尋用戶的意圖機會減少了。你會看到百度的搜尋結果裏面是穿插廣告,用戶要很小心先可以判斷一條條目是屬於廣告定係還是自然搜尋結果。顯然對百度來看,廣告收入重於搜尋同用戶感受。其他搜尋引擎都不會這樣造。從簡單例子就可以看到百度所謂優化用戶體驗有多認真。
百度 SEO優化排名仍非常依賴關鍵字匹配來判斷網頁內容相關性
百度亦吹噓以自然語言處理 Natural Language Processing (NLP) 處理搜尋查詢,但搜尋 “香港面積” 或 “香港最近發生甚麽大事”,和 Google 比較,高下立見。
而我的觀察是 Google 的搜尋排名中愈來愈多出現一些沒有直接關鍵字的片段,意味 Rankbrain 愈來愈多介入。Yoast SEO 插件一般建議 Google SEO優化時關鍵字密度不大於 2.5%,否則可能引起 Google Panda 介入。當百度分析意圖,分析文本語義技術不成熟時,百度唯有仍偏向依賴關鍵字匹配。百度要求的關鍵字密度更高,有些說法是 5% 以上。
關鍵字相關性 Vs 話題相關性
百度非常依賴關鍵字出現和匹配來判斷網頁內容相關性 Relevance,域名中出現的該關鍵詞甚至更好。而 Google 越來越多地使用語義分析 Semantic Analysis 來判斷與內容的話題相關性。今天 (2018) Google 的業務重心是放在人工智能 AI。從今年 Google IO Conference 的內容可見一斑。其中眾多服務 (Photo, Assistant, Voice Search) 都是以 AI 作為中心技術。搜尋引擎當然亦是其中之一。
Google 搜尋引擎會利用語意分析 (包括對短語的共同引用 Co-citation Phrases, Phrase Linkages 等等) 準確了解搜尋用戶的搜尋意圖而非單純依賴關鍵字是否匹配。這需要大量投入包括硬件 (甚至乎要設計自己獨特語義分析 CPU) 和軟件。在可見將來百度應該不做,百度會保持依賴低層次關鍵字匹配評估與內容的相關性。
互聯網上有關百度 SEO 資料非常貧乏,相反 Google 搜尋引擎優化資料來自幾方面:
- 從 Google 相關已經獲批的專利文件釋出的資訊。
- 從幾家具規模的 SEO 分析工具開發商 (如:Moz, SEMrush, Ahref) 通過長期追蹤、收錄和分析大量 (英語為主) 網站反向連結、內容和排名從而推算 Google 的算法。
- 從大量從事 SEO 工作的人互相分享的實戰經驗。
百度自己的《百度搜索引擎優化指南 V2.0》只有簡單幾頁,並且是2014年前釋出。互聯網上關於百度SEO 方法的文章有時互相矛盾,更多是基於個人經驗,很小有完整的理論支撐,有也是借用 Google 的理論而未有在百度通過驗證。就算是同一排名因素,百度和 Google 給予的權重不一樣。某訊號 (如上面談及的關鍵字密度) 可能在Google 是太強令搜尋引擎減分,但在百度可能反而是太弱。所以慎防討好了百度,反而得失了 Google。如果我只有繁體版本內容,我會選擇不理百度又或者只為當為百度做的 SEO 變動不影響 Google 時才加入。
有興趣了解更多,可以考慮我們 SEO優化服務。