【ITBEAR科技資訊】5月21日消息,隨著大模型的興起,各行業(yè)的工作效率得到了顯著提升。然而,高昂的使用成本一直是大模型規(guī)?;瘧玫闹饕系K。在這樣的背景下,阿里云采取了果斷行動。今日,阿里云宣布對其通義千問GPT-4級別的主力模型Qwen-Long進行了大幅降價,API輸入價格從原先的0.02元/千tokens驟降至0.0005元/千tokens,降幅高達97%。
這一價格調(diào)整意味著,現(xiàn)在只需花費1塊錢,用戶就能購買到相當于200萬tokens的文字量,這大約等同于5本《新華字典》的內(nèi)容。Qwen-Long模型還支持最高達1千萬tokens的長文本輸入,而降價后的使用成本僅為GPT-4的1/400。
據(jù)ITBEAR科技資訊了解,Qwen-Long是通義千問推出的一款長文本增強版模型,其在性能上與GPT-4相媲美,且支持的上下文長度最高可達1千萬tokens。除了輸入價格的大幅下調(diào),Qwen-Long的輸出價格也降低了90%,至0.002元/千tokens。與此相比,其他國內(nèi)外知名大模型如GPT-4、Gemini1.5 Pro、Claude 3 Sonnet以及Ernie-4.0的每千tokens輸入價格都遠高于Qwen-Long。
阿里云此次降價涵蓋了9款商業(yè)化及開源系列模型。其中,不久前發(fā)布的旗艦款大模型Qwen-Max的API輸入價格也降至了0.04元/千tokens,降幅達到了67%。Qwen-Max在業(yè)界表現(xiàn)卓越,在權(quán)威基準OpenCompass上的性能與GPT-4-Turbo相當,并在大模型競技場Chatbot Arena中成功躋身全球前15名。
隨著大模型性能的逐步提升,AI應用的創(chuàng)新正迎來密集的探索期。然而,推理成本過高仍然是制約大模型規(guī)模化應用的關(guān)鍵因素。阿里云智能集團資深副總裁、公共云事業(yè)部總裁劉偉光在武漢AI智領(lǐng)者峰會上表示:“作為中國領(lǐng)先的云計算公司,阿里云此次大幅降低大模型推理價格,旨在加速AI應用的爆發(fā)。我們預計未來大模型API的調(diào)用量將實現(xiàn)成千上萬倍的增長。”
劉偉光還指出,公共云+API將成為企業(yè)使用大模型的主流方式,這主要得益于公共云的技術(shù)紅利和規(guī)模效應所帶來的巨大成本和性能優(yōu)勢。阿里云通過不斷優(yōu)化模型自身和AI基礎(chǔ)設(shè)施,致力于追求極致的推理成本和性能。此外,云上調(diào)用多模型更為方便,并能提供企業(yè)級的數(shù)據(jù)安全保障。同時,云廠商的開放性使得開發(fā)者能夠輕松獲取豐富的模型和工具鏈資源。