日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:52011
  • 待審:79
  • 小程序:12
  • 文章:1184964
  • 會(huì)員:801

AI大模型(LLM)掀起的生成式革命,正重塑各行各業(yè),連我們每天刷到的推薦系統(tǒng)也不例外。

傳統(tǒng)推薦系統(tǒng)像一條多環(huán)節(jié)的“流水線”(級(jí)聯(lián)架構(gòu)),容易導(dǎo)致算力浪費(fèi)、目標(biāo)沖突,制約了發(fā)展。要突破瓶頸,關(guān)鍵在于用LLM技術(shù)進(jìn)行“一體化”重構(gòu),實(shí)現(xiàn)效果提升和成本降低。

快手技術(shù)團(tuán)隊(duì)最新提出的 「OneRec」 系統(tǒng),正是這一思路的突破。它首次用端到端的生成式AI架構(gòu),徹底改造了推薦系統(tǒng)的全流程,在效果和成本上實(shí)現(xiàn)了“既要又要”:

● 效果猛增: 有效計(jì)算量提升10倍!讓強(qiáng)化學(xué)習(xí)技術(shù)在推薦場景真正“活”了起來,推薦更精準(zhǔn)。

● 成本銳減: 通過架構(gòu)革新,訓(xùn)練和推理的算力利用率(MFU) 分別飆升至 23.7% 和 28.8%,運(yùn)營成本(OPEX)僅為傳統(tǒng)方案的10.6%!

目前,該系統(tǒng)已在快手 App / 快手極速版雙端服務(wù)所有用戶,承接約 25% 的QPS(每秒請求數(shù)量),帶動(dòng) App 停留時(shí)長提升 0.54%/1.24%,關(guān)鍵指標(biāo) 7 日用戶生命周期(LT7)顯著增長,為推薦系統(tǒng)從傳統(tǒng) Pipeline 邁向端到端生成式架構(gòu)提供了首個(gè)工業(yè)級(jí)可行方案。

完整技術(shù)報(bào)告鏈接:https://arxiv.org/abs/2506.13695

(圖: OneRec 系統(tǒng)概覽)

OneRec 基礎(chǔ)模型剖析

OneRec 采用端到端生成式架構(gòu),首創(chuàng)協(xié)同感知多模態(tài)分詞器:通過融合視頻標(biāo)題、圖像等多維信息與用戶行為,利用 RQ-Kmeans 分層生成語義 ID。其 Encoder-Decoder 框架將推薦轉(zhuǎn)化為序列生成任務(wù):

● Encoder 整合用戶終身/短期行為序列實(shí)現(xiàn)多尺度建模;

● MoE 增強(qiáng)的 Decoder 通過 Next Token Prediction 精準(zhǔn)生成推薦結(jié)果。

● 實(shí)驗(yàn)驗(yàn)證其遵循 Scaling Law——參數(shù)量增至 2.633B 時(shí)訓(xùn)練損失顯著下降,結(jié)合特征/碼本/推理級(jí)優(yōu)化,實(shí)現(xiàn)效果與算力的協(xié)同突破。

強(qiáng)化學(xué)習(xí)(RL)偏好對(duì)齊

OneRec 突破傳統(tǒng)推薦依賴歷史曝光的局限,創(chuàng)新引入強(qiáng)化學(xué)習(xí)偏好對(duì)齊機(jī)制。通過融合 偏好獎(jiǎng)勵(lì)(用戶偏好)、格式獎(jiǎng)勵(lì)(有效輸出) 及 業(yè)務(wù)獎(jiǎng)勵(lì)(工業(yè)需求) 構(gòu)建綜合獎(jiǎng)勵(lì)系統(tǒng),并利用 個(gè)性化P-Score 作為強(qiáng)化信號(hào)。采用改進(jìn)的 ECPO算法(嚴(yán)格截?cái)嘭?fù)優(yōu)勢梯度)提升訓(xùn)練穩(wěn)定性,在快手場景中實(shí)現(xiàn) 不損失曝光量前提下顯著提升用戶時(shí)長,達(dá)成工業(yè)級(jí)效果突破。

性能優(yōu)化

在性能優(yōu)化上,OneRec突破傳統(tǒng)推薦MFU個(gè)位數(shù)魔咒:通過架構(gòu)重構(gòu)+算子壓縮92%至 1,200 個(gè),訓(xùn)練/推理MFU提升至23.7%/28.6%,算力效能達(dá)主流AI模型水平,實(shí)現(xiàn)3-5倍躍升。首次讓推薦系統(tǒng)達(dá)到與主流 AI 模型比肩的算力效能水平。

此外,快手技術(shù)團(tuán)隊(duì)還針對(duì) OneRec 特性在訓(xùn)練和推理框架層面進(jìn)行了深度定制優(yōu)化。訓(xùn)練側(cè)采用請求分組特征復(fù)用與變長Flash Attention提升計(jì)算密度,自研SKAI系統(tǒng)實(shí)現(xiàn)Embedding全流程GPU訓(xùn)練,徹底消除CPU同步瓶頸;推理側(cè)首創(chuàng)計(jì)算復(fù)用架構(gòu)——Encoder單次前向+Beam間KV共享+Decoder層KV Cache,支撐512大Beam Size生成需求,并基于Float16混合精度與MoE/Attention算子深度融合提升吞吐。最終訓(xùn)練/推理MFU達(dá)23.7%/28.8%(較傳統(tǒng)模型提升3-5倍),運(yùn)營成本降至傳統(tǒng)方案10.6%,實(shí)現(xiàn)近90%成本節(jié)約。

Online實(shí)驗(yàn)效果

該模型經(jīng)過一周 5% 流量 AB 測試,在點(diǎn)贊、關(guān)注、評(píng)論等所有交互指標(biāo)上均獲正向收益(如下圖)。系統(tǒng)現(xiàn)已全量覆蓋短視頻推薦主場景,承擔(dān)約 25% QPS。除了短視頻推薦的消費(fèi)場景之外,OneRec 在快手本地生活服務(wù)場景同樣表現(xiàn)驚艷:AB 對(duì)比實(shí)驗(yàn)表明該方案推動(dòng) GMV 暴漲 21.01%、訂單量提升 17.89%、購買用戶數(shù)增長 18.58%,其中新客獲取效率更實(shí)現(xiàn) 23.02% 的顯著提升。目前,該業(yè)務(wù)線已實(shí)現(xiàn) 100% 流量全量切換。

圖片

生成式 AI 方興未艾,正引發(fā)各領(lǐng)域根本性技術(shù)變革與降本增效。OneRec 不僅論證了推薦系統(tǒng)與 LLM 技術(shù)棧深度融合的必要性,更重構(gòu)了互聯(lián)網(wǎng)核心基礎(chǔ)設(shè)施的技術(shù) DNA。隨著其新范式的到來,推薦系統(tǒng)將加速迎來「端到端生成式覺醒」時(shí)刻。

分享到:
標(biāo)簽:掀翻 吞噬 端到 難題 模型
用戶無頭像

網(wǎng)友整理

注冊時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 52011

    網(wǎng)站

  • 12

    小程序

  • 1184964

    文章

  • 801

    會(huì)員

趕快注冊賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評(píng)定2018-06-03

通用課目體育訓(xùn)練成績評(píng)定