【ITBEAR科技資訊】8月3日消息,AI模型社區(qū)魔搭ModelScope日前發(fā)布了兩款開源模型,即Qwen-7B和Qwen-7B-Chat,這兩款模型由阿里云證實為通義千問的70億參數(shù)通用模型和對話模型。與此同時,阿里云也確認(rèn)這兩款模型均可免費使用,并支持商業(yè)應(yīng)用。通過多個權(quán)威測評,Qwen-7B模型的表現(xiàn)遠(yuǎn)超國內(nèi)外同等尺寸模型,成為當(dāng)前業(yè)界最強的中英文7B開源模型。
據(jù)ITBEAR科技資訊了解,Qwen-7B是一種支持中英文等多種語言的基座模型,其訓(xùn)練數(shù)據(jù)集超過2萬億個token,上下文窗口長度達(dá)到8k。而Qwen-7B-Chat則是基于Qwen-7B的中英文對話模型,已經(jīng)實現(xiàn)了與人類認(rèn)知的對齊。這兩款模型的開源代碼支持量化,使用戶能夠在消費級顯卡上部署和運行模型。
這一舉措使得用戶無需從頭開始訓(xùn)練模型,而是可以下載預(yù)訓(xùn)練好的模型并進(jìn)行微調(diào),從而快速構(gòu)建高質(zhì)量的模型。阿里云表示,開源大模型將有助于簡化模型訓(xùn)練和部署過程,為用戶提供更便捷的服務(wù)。
對于Qwen-7B的推出,阿里云早在今年4月便推出了自研大模型通義千問,引發(fā)市場強烈需求。此次推出小型化版本的開源模型,有望降低模型使用門檻,使大量中小企業(yè)和AI開發(fā)者更早地接觸和使用通義千問。阿里云也因此成為國內(nèi)首個加入大模型開源行列的大型科技企業(yè)。
用戶可以直接從魔搭社區(qū)下載這兩款模型,也可以通過阿里云靈積平臺訪問和調(diào)用它們。阿里云為用戶提供了包括模型訓(xùn)練、推理、部署和精調(diào)等在內(nèi)的全方位服務(wù),讓用戶可以更輕松地應(yīng)用這些先進(jìn)的AI模型。