日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:52010
  • 待審:74
  • 小程序:12
  • 文章:1158077
  • 會(huì)員:789

在ChatGPT問(wèn)世后的第二年,人工智能領(lǐng)域正經(jīng)歷一場(chǎng)新的變革。OpenAI及其國(guó)內(nèi)同行正試圖超越現(xiàn)有的技術(shù)框架,探索大模型發(fā)展的新路徑。

隨著Scaling Law的局限性逐漸顯現(xiàn),今年9月,OpenAI推出了全新系列模型o1,重新定義了“會(huì)思考的大模型”。OpenAI的CEO奧特曼對(duì)此信心滿滿,認(rèn)為AI的發(fā)展不僅沒(méi)有放緩,反而預(yù)示著未來(lái)幾年內(nèi)的重大突破。

受到o1發(fā)布的啟發(fā),國(guó)內(nèi)大模型廠商迅速行動(dòng),紛紛效仿并推出了各自的o1類深度思考模型。短短兩個(gè)多月內(nèi),kimi的k0 math、Deepseek的DeepSeek-R1-Lite以及昆侖萬(wàn)維的“天工大模型4.0”o1版相繼問(wèn)世,這些模型都著重強(qiáng)調(diào)了大模型的邏輯思考能力。

在沒(méi)有OpenAI公開(kāi)o1具體技術(shù)細(xì)節(jié)的情況下,國(guó)內(nèi)企業(yè)展現(xiàn)出了驚人的研發(fā)速度和技術(shù)實(shí)力。11月16日,月之暗面發(fā)布了k0 math,通過(guò)強(qiáng)化學(xué)習(xí)和思維鏈推理技術(shù),顯著提升了數(shù)學(xué)推理能力。四天后,Deepseek推出了DeepSeek-R1-Lite,毫無(wú)保留地展示了模型的完整思考過(guò)程,其思維鏈長(zhǎng)度可達(dá)數(shù)萬(wàn)字,并在多項(xiàng)測(cè)試中超越了o1-Preview。

昆侖萬(wàn)維也不甘落后,于11月27日發(fā)布了天工大模型4.0 o1版,成為國(guó)內(nèi)首款實(shí)現(xiàn)中文邏輯推理的模型。該模型提供了三種版本,包括開(kāi)源的Skywork O1 Open、優(yōu)化中文支持能力的Skywork O1 Lite,以及完整展示模型思考過(guò)程的Skywork O1 Preview。

這些國(guó)產(chǎn)“o1”大模型不僅在數(shù)學(xué)和代碼能力上逼近甚至超過(guò)了o1,還學(xué)會(huì)了“慢思考”。通過(guò)引入思維鏈(CoT),大模型能夠?qū)?fù)雜問(wèn)題拆解為多個(gè)小問(wèn)題,模擬人類的逐步推理過(guò)程。這種能力使得大模型在解決一些往常無(wú)法回答的問(wèn)題時(shí),也能給出正確答案。

例如,Deepseek R1在面對(duì)“Responsibility中有幾個(gè)字母i?”的問(wèn)題時(shí),能夠拆解單詞并逐一比較字母,最終給出正確答案。昆侖萬(wàn)維的大模型在面對(duì)陷阱問(wèn)題時(shí),也能通過(guò)思維鏈模式自行避開(kāi)問(wèn)題,找到準(zhǔn)確的翻譯結(jié)果。

然而,慢思考模型也面臨著挑戰(zhàn)。雖然它們?cè)谝恍┨囟▽W(xué)科上的表現(xiàn)大幅提升,但大量耗費(fèi)tokens的方式卻未必能換來(lái)用戶需要的回報(bào)。在某些情況下,增加思維鏈的長(zhǎng)度可以提高效率,但并不意味著在所有情況下都是最優(yōu)解。因此,大模型需要學(xué)會(huì)對(duì)問(wèn)題難度進(jìn)行判別,從而決定是否采用深度思考模式。

從特定場(chǎng)景下的強(qiáng)化學(xué)習(xí)應(yīng)用轉(zhuǎn)向通用模型,在訓(xùn)練算力和成本的平衡上還存在一定難度。目前,國(guó)產(chǎn)慢思考大模型的開(kāi)發(fā)主要基于規(guī)模較小的基座模型,如Skywork O1 Open基于Llama 3.1 8B的開(kāi)源模型。這意味著在訓(xùn)練RL階段,所需的算力可能并不比預(yù)訓(xùn)練少。

盡管如此,大廠們?nèi)詫1視為下一個(gè)必備項(xiàng)。在OpenAI和智譜給出的“通往AGI五階段”的定義中,o1的出現(xiàn)標(biāo)志著大模型能力突破到了L2階段,開(kāi)始真正擁有邏輯思維能力。國(guó)內(nèi)廠商在同步跟進(jìn)o1類產(chǎn)品的同時(shí),已經(jīng)開(kāi)始思考如何將o1的能力與現(xiàn)有AI應(yīng)用方向結(jié)合。

在數(shù)據(jù)枯竭的情況下,o1為Scaling Law提供了新的支撐。更多大模型公司的加入,將聯(lián)手探索出更大的可能性。同時(shí),思維鏈的能力已經(jīng)幫助提升了AI技術(shù)的使用效果。例如,智譜的“會(huì)反思的AI搜索”結(jié)合了思維鏈能力,能夠給出更加精準(zhǔn)的答案。

當(dāng)大模型開(kāi)始學(xué)會(huì)“自我思考”,通往L3(Agent)的大門(mén)也正在被推開(kāi)。然而,如何平衡大模型的推理進(jìn)化和用戶對(duì)效率的需求,仍然是國(guó)內(nèi)大模型廠商需要解決的問(wèn)題。

分享到:
標(biāo)簽:后浪推前浪 彎道 超車 崛起 模型
用戶無(wú)頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 52010

    網(wǎng)站

  • 12

    小程序

  • 1158077

    文章

  • 789

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫(kù),初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定