(ChinaZ.com)1月5日 消息:隨著 Bard & Perplexity 等基于 LLM 的搜索引擎的崛起,機器人直接輸出答案,這讓內容創建者通過SEO來改進他們的網站,已經逐漸變得越來越難。為了幫助內容創作者更好地理解他們的內容在生成引擎中的表現,并提供了優化這些內容以提高其在生成引擎中可見性和有效性的策略,普林斯頓大學和艾倫科技研究所提出了GEO的概念:生成引擎優化。
項目地址:https://top.aibase.com/tool/geo
論文:https://arxiv.org/pdf/2311.09735.pdf
代碼:https://github.com/GEO-optim/GEO
GEO提出了一個專門針對生成引擎的印象度量標準。這些度量標準包括內容可見性、信息準確性、用戶參與度和內容影響力。內容可見性衡量內容在生成引擎回答中出現的頻率和顯著性,信息準確性評估生成引擎提供的信息與原始內容的一致性,用戶參與度測量用戶與生成引擎提供的內容的互動程度,內容影響力評估內容在生成引擎回答中的權威性和影響力。
GEO的原理包括多模態理解、內容綜合性和語義理解。多模態理解指的是生成引擎不僅處理文本信息,還可能結合視覺和空間布局等其他模態的信息。內容綜合性是指生成引擎傾向于提供更加綜合和完整的回答,而不僅僅是簡單的鏈接。語義理解則是生成引擎使用先進的語言模型,能夠深入理解內容的語義。
為了優化內容在生成引擎中的表現,GEO提出了一些策略。首先是結構化內容,通過優化網站和內容的結構,使其更容易被生成引擎解析和引用。其次是關鍵信息突出,確保重要信息容易被找到和理解,以便生成引擎可以有效地提取和使用這些信息。還有增強語義相關性,使用關鍵詞和短語來提高內容的語義相關性,使其更符合目標受眾的搜索意圖。另外,利用GEO提供的度量標準來評估和優化內容在生成引擎中的表現,持續監測和調整內容在生成引擎中的表現,并適應生成引擎的變化。
為了評估和比較不同優化方法的效果,GEO引入了一個名為GEO-BENCH的多樣化基準測試。該基準測試包含10,000個查詢,覆蓋了多個領域、難度級別和類別。這個基準測試由多個來源的數據集組成,包括MS Macro、ORCAS-1、Natural Questions等,這些數據集代表了不同類型的用戶查詢和搜索場景。GEO-BENCH包括訓練集、驗證集和測試集,使得內容創作者和研究人員能夠在標準化的環境中訓練和測試他們的優化策略。此外,GEO-BENCH還提供了一個公共排行榜,定期更新以展示最新的測試結果,促進不同方法之間的競爭和進步。
通過實施GEO提出的策略和參與GEO-BENCH基準測試,內容創作者能夠提高他們的網站和內容在生成引擎中的可見性和有效性,更好地滿足用戶的搜索需求。