日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

導讀

 

搜索系統中容易存在頭部效應,中長尾的優質商品較難獲得充分的展示機會,如何破除系統的馬太效應,提升展示結果的豐富性與多樣性,助力中長尾商品成長是電商平臺搜索系統的一個重要課題。其中,搜索 EE 系統在保持排序結果基本穩定的基礎上,通過將優質中長尾商品穿插至排序結果中將優質商品動態展示給用戶,提升用戶體驗與搜索結果豐富性,是破除馬太效應的一大助力。

本文將從搜索 EE 近期的全量迭代出發,展現其鏈路演進的整體脈絡,包含:EE 自適應動態探測模型 ——EE 場景建模方式升級 —— 打分與穿插兩階段一致性升級 —— 探測與自然流量全局聯動優化四個階段,梳理對搜索 EE 的思考與下一步迭代方向。

全文目錄:

1. EE 自適應動態探測模型

2. EE 場景建模方式升級

3. 打分與穿插兩階段一致性升級

4. 感知上下文的品牌店鋪維度探測

5. 總結與展望

一、EE 自適應動態探測模型

傳統 EE 模型從商品曝光置信度、打分置信度等角度出發,決策 EE 商品的展示位置以及穿插位置,較少從用戶瀏覽意圖與探索意愿的差異化角度,來考量探測力度。其可能導致用戶在寬泛瀏覽與挑選商品時,缺少豐富的商品選擇,在決策購買時反而穿插了探索商品的誤判情景,影響用戶的搜索體驗,不能充分發揮搜索 EE 系統的探索和利用 (Explore & Exploit) 兩大能力。

針對以上探測錯配情況,可嘗試在 EE 模型中顯式建模用戶的 “逛”、“買” 探索偏好,進一步結合偏好,自適應調整搜索 EE 的利用與探索力度。對于偏 “逛” 用戶增強 EE 探索力度,提供更豐富的探索展示;對于購買意愿明顯的用戶,提供更直接的購買選擇。通過對用戶探索偏好的顯式建模,能夠在提升用戶的轉化效率的同時提升搜索結果豐富性。

1. 自適應探索模型優化

相較于原有 EE 模型,自適應探索對 EE 模型的自適應探索能力進行了升級,主要體現在如下三點:(1)對用戶探索偏好進行差異化建模:"逛" "買" 用戶提供動態差異化探測力度,在轉化效率和搜索豐富性中取得平衡。(2)以用戶瀏覽深度為子任務建模到 EE 模型中:以瀏覽深度作為用戶意愿的重要指標,并建模到 EE 模型中,顯式增強模型對用戶瀏覽意愿的感知。(3)提升模型對探索性特征利用性:對探索偏好的顯式建模,提升探索性特征在模型中的學習權重,在 EE 過程中對探索特征進行充分利用。

2. 方案實踐

為了增強 EE 模型的自適應探索能力,針對原有 EE 模型進行如下升級:

(1)探索偏好網絡 Explore.NET

在保持原有的 EE 模型主網絡 Exploit-Net 基礎上,添加了探索偏好網絡 Explore-Net (圖中左下綠色部分),提升模型對用戶探索意圖的差異化建模。

①輸入特征優化

考慮到用戶的探索意圖只與個人特性、搜索詞相關,因此 Explore-Net 的輸入特征僅使用用戶側、Query 側中相關特征。

為進一步度量特征與探索偏好的關聯性,統計不同瀏覽深度下各特征的分布差異,剔除了未與瀏覽深度明顯相關特征,如搜索詞長度等,精簡特征空間提升預估精度。

②模型顯性建模

EE 原模型的輸入中包含探索性特征,但在進行搜索排序任務中易被其他特征掩蓋導致利用率不強,在探索偏好建模中顯式構建了探索偏好網絡 Explore-Net,對用戶探索意圖進行獨立建模構建,增強探索性特征的重要性。

優化后的 EE 模型具有 Exploit-Net 與 Explore-Net 雙塔結構,Exploit-Net 對商品進行精準化打分,對候選商品進行充分利用;Explore-Net 對用戶探索意愿進行建模,根據用戶偏好動態調整探索力度,共同構成商品探索與利用的完整機制。

(2)用戶瀏覽深度回歸任務構建

在原有的訓練過程基礎上,添加了用戶瀏覽深度回歸任務 (圖中左上紅色部分),提升模型對用戶瀏覽意愿的感知性,增強 EE 模型的自適應探索能力。

①輔助任務選擇

瀏覽深度作為用戶瀏覽意愿的直觀體現,表現了用戶的探索意愿,因此使用瀏覽深度預估任務作為模型訓練的輔助任務,對用戶偏好進行顯式建模。

在輔助任務類型的考量上,綜合考慮了將瀏覽深度劃分不同區間進行預測的分類任務,以及對瀏覽深度的回歸任務。在實驗中分類任務體現出較為明顯的頭尾傾向性,輸出值分布不均勻,實踐中最終選用了回歸任務作為輔助任務。

②回歸任務設計

在樣本數據分析中,發現用戶的瀏覽深度差異化極大。為了平衡瀏覽深度的差異,保障模型輸出值的均勻性與差異性,對瀏覽深度標簽進行了 log 平滑放縮,并選用 RMSE-loss 作為輔助任務的損失函數對瀏覽深度任務進行構建。

在模型訓練中頭尾樣本相對較少,對過淺和過深的兩類樣本預測準確性偏低。為平衡樣本間差異,在損失函數的樣本權重設計中,對由淺到深相應樣本,其權重為先減小后增大的 “凹形” 權重,平衡頭尾和腰部樣本的準確性。

(3)Explore-Net 與主網絡的二次融合

Explore-Net 和 Exploit-Net 進行了融合 (圖中中上紅色部分),增強模型整體對探索性特征的利用,提升 EE 隱層 embedding 豐富性,對探索偏好較強的用戶提升了不確定性打分,提升探索商品的范圍和豐富度。

①特征融合

由于在用戶瀏覽深度回歸任務上對用戶的探索偏好進行了顯式建模,Explore-Net 的輸出 embedding 對探索性特征進行了高維抽取,能夠對用戶偏好進行自適應建模。

為讓探索偏好特征更好地參與到整體任務訓練中,平衡打分的精準性與差異化,將 Explore-Net 的深層表征與 Exploit-Net 的深層表征進行拼接融合,提升 EE 模型隱層 embedding 的豐富性和表征能力,提升模型打分能力。

②不確定性預估融合

用戶的探索偏好與商品的不確定性預估有直接的相關關聯。對于探索意圖較強的用戶,提升商品打分的不確定性,助力更豐富的商品穿插到搜索結果中,反之亦如此。因此在不確定性預估模塊中,設計在探索表征層面進行融合。

在不確定性預估(SVGP)模塊中,將瀏覽深度回歸網絡輸出值與方差預估部分進行了二次融合,對于探索偏好較強的用戶,顯式強化了商品不確定性打分,提升探索力度。

3. 升級效果

(1)探索利用效果分析

①EE 模型打分結果分析:

在相同的預測集上,統計了平均打分探測力度隨瀏覽深度變化情況

結論:相比原模型,自適應探索模型的平均探測力度,隨瀏覽深度增大而逐漸增大,體現出 session 維度的顯著差異化。

②EE 實驗位下穿插商品位置分析:

在各實驗位下,統計平均插入位置與瀏覽深度的變化情況。

結論:Test 桶結果,隨著瀏覽深度增大,商品的平均插入位置相比原模型有所前移,探索力度增強。

核心結論:通過以上對探索利用的效果分析,自適應探索模型符合設計預期,在瀏覽深度較低的 session 下插入商品較少,探索力度較弱;在瀏覽深度較深的 session 下,EE 模型的探索意愿更強,模型探索力度更大,穿插商品位置有所前移。

(2)線上效果

保持搜索效率持平的情況下,EE 核心指標提升明顯并全量上線,流動性、探索成功率提升近 0.5%。

商品建模方式思考:

差異化建模用戶探索意圖后,EE 模塊實現了對不同用戶自適應調整探索并取得了一定收益。用戶側建模方式優化后,對商品側建模方式進行升級改造,將是進一步提升 EE 探測模型的合理切入點。

二、EE 場景建模方式升級

原主網絡建模方式為點擊率單任務,點擊作為轉化的前置行為,建模點擊行為實現對潛力中長尾的探索助力。同時在實踐中,通過樣本 label 進行動態權重調整,隱式建模轉化屬性,兼顧轉化效率。

僅建模點擊對高轉化屬性商品并不友好,同時是對標題黨行為的潛在鼓勵,和 EE 模塊優化整體生態環境、打造搜索長期價值的初衷有所偏差。因此升級思路不再局限于僅關注曝光后獲得點擊這一前置鏈路行為,而是對整體轉化鏈路進行建模,關注商品的多維度屬性。

1.EE 場景建模方式優化

在原有基礎上引入轉化行為的顯式建模任務,將主網絡結構從點擊單任務升級為點擊轉化多任務,以多任務方式增強不同行為的建模質量,實現對商品的更全面、更準確建模。

2. 方案實踐

在 EE 自適應探索機制基礎上,EE 場景建模方式升級對原有模型進行了如下優化與升級:

(1)SVGP 模塊交互方案設計

原模型中主網絡和輔助模塊在 SVGP 模塊中交互,新版方案中輔助任務是否需要與 SVGP 模塊進行交互?即隨機高斯過程是否需要同樣作用于建模轉化任務,是方案設計首要考慮的問題。

具體實驗中,發現 SVGP 會導致收斂后 AUC 指標在千分位級別降低,即其在引入不確定性功能的同時,會輕微降低模型效果。考慮到目前 SVGP 模塊已帶來所需的探索能力,難以通過多 SVGP 堆疊方式帶來收益。因此升級方案選擇將輔助任務構建成純凈任務,其僅建模商品屬性而不構建對應的 SVGP 模塊。

(2)多任務網絡框架實現

EE 探測線上耗時較低,建模方式升級后需延續這一目標。雖然主流多任務結構 MMOE 性能更為優越,但線上耗時將有增加風險,因此選擇更輕量級的 share bottom 方式,在基本不增加線上耗時的情況下完成多任務建模。升級方案把多任務被設計為雙任務模型,使用低層網絡進行表征抽取,在高層維度使用兩個 tower 分別建模主任務和輔助任務。

①任務組合選取

選擇雙任務為 ctr 任務 + ctcvr 任務,考慮到點擊樣本比訂單樣本更豐富, ctr 正樣本更多,對于需要大量引導點的 SVGP 模塊更為友好。同時點擊相對購買行為的不確定性更高,在點擊預測上引入不確定性打分更為合理,因此將 ctr 作為主任務、ctcvr 為輔助任務進行配置。

②模型結構迭代

前述迭代過程中模型結構如圖中間所示,低層網絡編碼輸入信息后使用兩個淺層 tower 分別學習不同任務, 該結構潛在缺點為一方面可能導致低層網絡梯度被某個任務主導(例如 ctr 任務),另一方面上層 tower 過淺可能導致任務學習不夠充分。

進一步探索僅共享特征、增加任務 tower 深度的網絡結構。在多任務分數融合方式相同的情況下,新結構線上表現更佳,因此最終結構如上圖最右所示,使用較深的 tower head 建模各自任務,彼此間僅共享特征。

③融合方式迭代

上述模型在離線指標上取得了不錯的收益且線上表現更優,但遇到了大盤效率和 EE 相關指標無法同時提升的問題。分析梳理現有方案實驗后,認為目前多任務融合方式相對樸素、存在改善提升空間。

選取帶權相加、直接相乘和冪次指數相乘三種方式。由于缺乏合適的理論量化分析工具,因此選擇從實驗結果出發選取最優融合方式和融合系數,為此開發了離線融合尋參模塊,將 predict 時各 head 打分結果保存后,通過網格搜索方式選取最優參數。

通過在多組數據上遍歷尋優確定不同融合方式的最優系數,并基于此開展線上實驗選取表現最優方式,最終我們選取帶權相加方式,在 EE 指標提升的同時保持大盤效率指標持平。

3. 升級效果

(1)模型建模升級效果分析

①EE 模型打分區分度分析:

在相同的預測集上,統計了離線打分分布情況

結論:分布由橙色線條(原版)變為藍色線條(升級后版本),整體更加平緩,保證不同商品彼此更具備區分度。

②EE 探測次數分析:

統計線上打分分布情況,對線上探測情況進行分析

結論:橫軸為曝光數量大于等于 N,縱軸為 distinct sku 數量,下圖表明模型升級后在僅探索一次的 dst sku 數量上有所下降,減少偏隨機的一次性探測,但在多次探索商品上有所提升,表明 test 更傾向于探索中腰部商品。

(2)線上效果

搜索效率持平情況下,流動性指標、探索成功率提升顯著并全量上線。

鏈路一致性思考:

完成 EE 打分模型優化后,能夠一定程度實現探索力度隨用戶探索意愿的動態調整。但從整體 EE 鏈路上看 (候選集生成 → EE 打分 → 動態展示),EE 動態穿插決策與打分階段相互獨立,其結果由一個 xgb 回歸模型決定,兩個階段的聯動關系和一致性程度弱。如何跟隨用戶瀏覽意愿,將 EE 打分→ 動態展示 兩個環節能夠同步、一致性地調整,是進一步的優化方向。

三、打分與穿插端到端一致性升級

打分與穿插展示兩個階段一致性未能對齊,可能導致激進的模型打分無法匹配上豐富的穿插展示,無法同步放大 EE 的探測效果。此外,兩個階段分別由兩個模型獨立控制,也增加了維護和迭代成本。

面對此一致性問題,升級了端到端打分與穿插方案。EE 模型中建模的用戶瀏覽意圖,不僅影響 EE 探測的力度大小,也同時決定動態穿插展示的策略強弱。兩階段的決策過程端到端實現,將流量進行更合理分配,寬泛意圖的用戶能夠達到探測更激進、穿插更多的共振。

1. 端到端動態穿插機制優化點

端到端動態穿插機制在原有自適應探索基礎上,升級點主要體現在如下三點:

(1)瀏覽深度預估精準度升級:在 EE 探索偏好建模網絡 Explore-net 基礎上,提升瀏覽深度預測精準度。

(2)EE 流量精準化分配:根據 session 瀏覽深度分布,動態分配各深度下穿插商品量,提升 EE 穿插商品占比調控可操作性。

(3)模型打分與動態穿插數量端到端一致性增強:采用 EE 主模型的瀏覽深度,映射得到當前 session 下穿插商品數量,端到端解決 EE 穿插商品數量與 EE 商品打分兩個任務,提升兩階段一致性。

2. 方案實踐

在 EE 自適應探索機制基礎上,端到端動態穿插機制對原有動態穿插機制進行了如下優化與升級:

(1)動態穿插機制端到端建模

①瀏覽深度預估任務優化

瀏覽深度代表了用戶在 session 下的瀏覽意愿,是 EE 流量進行合理分配的基礎性指標。在不同瀏覽深度的 session 下,匹配適合數量的 EE 商品能在保障效率的前提下提升搜索結果豐富性。

進一步優化了自適應探索模型中 Explore-Net 對瀏覽深度預估子任務的準確性,對其輸出的瀏覽深度預估值進行評估,其準度明顯高于原有 xgb 模型,可以對原有 xgb 模型進行替換。

②端到端建模瀏覽深度與模型打分

自適應探索實驗中使用 Explore-Net 對模型打分進行差異化探索,其中的瀏覽深度預估任務可以沿用到穿插商品數量任務中,使模型具有端到端建模兩個子任務的能力。

(2)合理設計瀏覽深度與穿插商品數量映射

在準確預估瀏覽深度的情況下,通過將瀏覽深度預估值映射到穿插數量中,保障穿插數量與模型打分一致性,在更深的 session 下有更多的商品穿插數量和更強的探測力度。

3. 升級效果

(1)動態穿插效果分析

①瀏覽深度預測準度分析:

對比兩模型的瀏覽深度預估準確性,使用均方根對數誤差 (Root Mean Squared Logarithmic Error, RMSLE) 指標進行衡量

結論:在同樣的驗證集下,Explore-net 模型的預估精度明顯優于原模型。

②探索打分、動態穿插一致性效果分析:

檢查各瀏覽深度下 base 與 test 兩個機制下各瀏覽深度下預設的插入商品曲線和穿插商品數量分布圖。

結論:

  • 比較藍色 (test) 與黃色 (base) 兩根實線,在較淺的 session 下,新舊機制穿插商品數量基本持平;在較深的 session 下,新機制相較于舊機制插入商品數量更多,體現了探索較強時新的穿插機制會探索更多商品。
  • 通過藍色實線與虛線,黃色實線與虛線兩組曲線對比,新穿插機制下預期插入數量曲線與實際插入數量曲線更貼合,說明穿插數量設定更為合理,新的穿插機制與商品打分一致性更強。

(2)線上效果

搜索效率持平情況下,EE 核心指標有一定提升并全量上線。

流量整體聯動優化思考:

在對 EE 流量進行整體優化后,商品探索力度與 EE 流量分配能夠隨用戶瀏覽意愿進行自適應調整,但從全局商品展示結果中看,EE 探測流量與自然流量相互獨立,兩者之間并未建立充分的聯動與結合。

將視角逐漸放寬到整個排序鏈路,如何做好 EE 流量與自然流量的聯動,發揮 EE 在搜索排序鏈路后置位的優勢充分補充與優化自然流量是下一個關心的問題。

四、感知上下文的品牌店鋪維度探測

在搜索鏈路中,EE 處于相對后置的位置,然而原 EE 系統未充分利用這一感知優勢,對前序排序結果感知能力較弱。在一些強勢品牌、店鋪主導的關鍵詞下,存在頭部品牌、店鋪扎堆現象,優質新品、中長尾商品無法露出,馬太效應明顯。

對此問題,嘗試跳出僅考慮商品維度探測的局限,從更高的品牌、店鋪維度視角,對排序結果進行全局性聯動優化,建立感知上下文的多維度探測能力。其設計旨在增強對上下文排序結果的感知能力,并在自然流量中對商品分布進行聯動優化,系統性緩解排序鏈路的馬太效應。

1. 感知上下文的多維度探測機制優化點

感知上下文的多維度探測機制在原有 EE 探測能力基礎上,進行了如下三個方面的優化:

(1)新增 EE 探測系統對上下文感知能力:對 EE 前的排序上下文結果進行充分的感知,對自然流量下原有搜索排序結果進行自適應的穿插優化。

(2)實現 EE 探測維度的擴展:除了現有支持的商品粒度探測,從更宏觀的品牌、店鋪等維度視角對排序生態進行優化。

(3)EE 流量與自然流量聯動全局性優化:緩解部分詞下頭部品牌和店鋪扎堆現象,提升排序多樣性,避免對頭部品牌、店鋪商品進行更多探測、加劇馬太效應。

2. 方案實踐

本次升級在原有的搜索 EE 穿插機制下進行了如下能力的增強與優化:

(1)新增上下文感知能力

在原有搜索 EE 穿插機制基礎上,新增加上下文感知能力,對搜索詞屬性和上下文排序結果的商品分布進行計算,指導后續的穿插過程

①感知 query 詞屬性

為保障搜索排序結果合理性,避免產生體驗性問題,感知上下文能力將判斷 query 詞是否是品牌詞 (如:華為) 或型號詞 (如:iphone),決定是否開啟品牌維度探測;判斷 query 詞是否是精準店鋪詞,決定是否開啟店鋪維度探測。

②排序結果商品分布

新增上下文排序結果感知能力,通過統計上鏈路搜索結果排名前 k 的商品中的品牌和店鋪的分布情況,判斷是否存在品牌或店鋪的集中現象,進而決定是否開啟多維度探測能力。

(2)優化原有穿插機制

在感知能力作為多維度探測啟動開關基礎上,優化了原有的穿插機制,通過 EE 展示效果與自然流量結果聯動提升搜索結果豐富性與多樣性,對搜索結果進行直接高效的影響。

①由感知能力模塊判斷用戶搜索意圖和商品分布,決定是否進行多維度探測

對用戶搜索意圖直接的搜索詞動態開啟多維度探測功能,如 query 為品牌詞或型號詞則不應進行品牌維度探測,如 query 為店鋪詞則不進行店鋪維度探測,避免影響搜索結果的準確性。考量搜索結果的前 k 個商品的品牌 / 店鋪分布,判斷是否存在頭部品牌 / 店鋪扎堆的問題,當同一品牌 / 店鋪下商品占比超過 p% 后,不再插入該類型 EE 商品。

②穿插結果優化

如不再插入該類型 EE 商品,在候選商品中剔除該類型,其余商品按照 EE 打分結果插入到排序結果中,不影響 EE 穿插過程與穿插數量,保障 EE 穿插位置和展現效果合理性。

3. 升級效果

(1)多維度探測效果分析

①EE 穿插曝光占比分析:

在 EE 穿插過程中,由于部分 EE 模型打分較高的頭部品牌 / 店鋪的商品在 EE 候選商品中被剔除,剩余商品模型打分稍低導致穿插位置發生后移或無法穿插進排序結果中,為了避免 EE 穿插曝光占比降低,提升了各瀏覽深度下 EE 穿插商品的配額。實驗期間 EE 曝光占比 base 與 test 基本持平。

②多維度探測體驗分析:

下面對比了多款熱詞下 EE 穿插商品情況。

結論:在多組 query 詞下,test 機制相較于 base 機制在穿插的過程中減少了頭部品牌 / 店鋪的插入,增強了展示結果的豐富性,緩解馬太效應;同時注意到 test 機制由于部分頭部品牌 / 店鋪商品被濾除,穿插位置相對有所后移,在排序靠后的位置受配額影響多插入 1-2 個商品,整體曝光量與 base 基本一致,與分析一的結論一致。

(2)線上效果

在保持搜索效率持平的情況下,多樣性指標大幅提升并全量上線。

五、總結與展望

本文重點闡述了在搜索 EE 機制迭代過程中的思考與演進歷程,搜索 EE 作為優化搜索生態與緩解搜索馬太效應的重要工具,在演進過程中也圍繞搜索結果豐富性和體驗性進行了系統性優化。

在優化思路上,不斷尋找 EE 系統的瓶頸問題,在自適應探索機制和建模方式升級提供差異化商品探索力度;將商品打分與穿插商品個數進行聯動,端到端優化 EE 流量分配問題;之后將視野擴展到全局流量,通過多維度探索機制聯動自然流量,使 EE 流量作為自然流量的互相補充。整體思路體現出從商品間探索打分優化 ——EE 流量個性化分配 —— 與自然流量全局優化的迭代進程。

搜索 EE 后續還將面臨更多的問題和挑戰,后續會繼續沿用這樣的迭代思路在更多方面進行探索與深入:

  • 擴展 EE 模型的訓練樣本空間,優化現有任務建模方案。
  • 搜索 EE 向更廣鏈路輻射,打造全鏈路 EE 探索能力。
  • EE 覆蓋更廣商品建模,打造更完善的中長尾商品泛化表征。

今天的分享就到這里,謝謝大家。

 

作者:京東零售 才子嘉,趙恒
來源:京東云開發者社區 轉載請注明來源

分享到:
標簽:京東
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定