在日前舉行的2023阿里云棲大會上,阿里云正式發(fā)布千億級參數(shù)大模型通義千問2.0,而在此之前,包括百度、騰訊、商湯、科大訊飛等的大模型,也紛紛宣布進行更新,國內(nèi)的大模型呈現(xiàn)出加速迭代的態(tài)勢。
作為如今最前沿的AI技術(shù),大模型已經(jīng)被業(yè)界普遍認為將是引領(lǐng)未來創(chuàng)新發(fā)展的基礎(chǔ)和動力,而今通過更新迭代所出現(xiàn)的更為全能的大模型,又將為數(shù)字化的發(fā)展帶來怎樣的改變?
●南方日報記者 葉丹
國產(chǎn)大模型“從有到優(yōu)”
在正式發(fā)布不到200天后,阿里云的大模型通義千問正式升級為2.0。據(jù)介紹,通義千問2.0在復(fù)雜指令理解、文學創(chuàng)作、通用數(shù)學、知識記憶、幻覺抵御等能力上均有顯著提升。阿里云方面表示,目前通義千問的綜合性能已經(jīng)超過GPT-3.5,加速追趕GPT-4。
在相對國外的大模型產(chǎn)品更新速度上,通義千問已經(jīng)體現(xiàn)出了“中國速度”,但是在國產(chǎn)大模型領(lǐng)域,“中國速度”還在不斷地刷新:在正式曝光兩個月后,騰訊混元大模型就迎來了全新升級,據(jù)騰訊方面介紹,升級后的騰訊混元中文能力整體超過GPT-3.5,代碼能力大幅提升20%;在2023百度世界大會上,百度文心大模型4.0正式發(fā)布,據(jù)百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏介紹,文心大模型4.0在理解、生成、邏輯和記憶能力上都有顯著提升,綜合能力“與GPT-4相比毫不遜色”。此外據(jù)南方日報記者了解到,包括商湯“商量SenseChat2.0”、科大訊飛“訊飛星火”認知大模型V3.0、探跡科技探跡SalesGPT等國產(chǎn)大模型,也紛紛升級登場,一時間國產(chǎn)大模型開始進入了“從有到優(yōu)”的發(fā)展階段。
中國科學技術(shù)研究所發(fā)布的相關(guān)數(shù)據(jù)顯示,截至今年5月,國產(chǎn)大模型發(fā)布數(shù)量已經(jīng)超過了79個,眾多大模型產(chǎn)品一擁而至,并不排除不少大模型只是“蹭風口”的出現(xiàn),而真正在大模型賽道上領(lǐng)跑,更考驗的是大模型的迭代能力。在業(yè)內(nèi)人士看來,隨著頭部的國產(chǎn)大模型的加速更新,將與大多數(shù)大模型的能力拉開距離,最終起到“優(yōu)勝劣汰”的效果。
“其實到今天,全社會更多關(guān)注的還是大模型發(fā)布,大家不太注意的一點是:這背后是整個云系統(tǒng)的升級,是技術(shù)體系的競爭。”阿里云CTO周靖人在接受采訪時表示,不管未來通用大模型的格局是否集中,明確的趨勢是推理(即使用大模型時的計算過程)對計算的需求會越來越大,遠大于訓(xùn)練,而這也意味著只有足夠技術(shù)積累的平臺,才能夠持續(xù)地投入大模型的更新迭代中。
國產(chǎn)大模型駛向應(yīng)用“深水區(qū)”
在編碼軟件的對話窗口輸入“幫我用Python/ target=_blank class=infotextkey>Python寫一個飛機游戲”,短短幾秒,名為“通義靈碼”的AI助手就自動生成了100多行代碼,點擊運行后一個充滿兒時回憶的“飛機大戰(zhàn)”游戲就成功跑起來了。在本次云棲大會上,阿里云對外展示的可自動編寫代碼的AI助手通義靈碼吸引了眾多的目光。
據(jù)南方日報記者了解到,“通義靈碼”是一款基于阿里云通義代碼大模型打造的智能編碼助手,基于海量優(yōu)秀開源代碼數(shù)據(jù)集和編程教科書訓(xùn)練,可根據(jù)當前代碼文件及跨文件的上下文,自動生成行級/函數(shù)級代碼、單元測試、代碼注釋等,此外還具備代碼解釋、智能研發(fā)問答、異常報錯排查等能力,并針對阿里云SDK/OpenAPI使用場景調(diào)優(yōu),為開發(fā)者帶來高效、流暢的編碼體驗。
在不少人印象中,大模型還是普通網(wǎng)民可以用文字進行對話的一個“閑聊”工具,但是隨著大模型的不斷發(fā)展,如今已經(jīng)開始駛向TO B端的“深水區(qū)”了。此前探跡科技創(chuàng)始人兼CEO黎展就表示,大模型的出現(xiàn),讓所有行業(yè)都快速進入數(shù)據(jù)價值深挖階段。據(jù)黎展介紹,作為業(yè)內(nèi)首個銷售大模型SaaS產(chǎn)品“探跡SalesGPT”,就運用了AI大模型針對企業(yè)線索挖掘、商機觸達、營銷、客戶管理等To B企業(yè)銷售場景進行功能價值挖掘,以一種更加高效、智能和簡單的方式來實現(xiàn)智能銷售。而中國科學技術(shù)研究所的報告就指出,在通用大模型以外,垂直大模型和行業(yè)大模型將是大模型應(yīng)用落地的重要形式,基于通用大模型進行微調(diào),通過訓(xùn)練專業(yè)數(shù)據(jù),向各行各業(yè)等多個場景提供更加精準、高效的解決方案。
在業(yè)內(nèi)人士看來,從與用戶“瞎聊”得到訓(xùn)練的同時也讓大眾“嘗鮮”,再到如今進入各個行業(yè)進行落地應(yīng)用,國產(chǎn)大模型已經(jīng)進入了全新的發(fā)展階段。
“大模型只有真正應(yīng)用于解決實際問題,才能發(fā)揮其真正的價值。”在李彥宏看來,未來各行各業(yè)基于AI應(yīng)用不斷涌現(xiàn),將推動數(shù)字技術(shù)與實體經(jīng)濟深度融合,推動新型工業(yè)化才是文心大模型的目標。據(jù)悉,百度文心大模型已經(jīng)在助力國圖館藏文化資源活化,升級國家跳水隊AI輔助訓(xùn)練系統(tǒng)等多領(lǐng)域?qū)嵺`。
“我還沒看到哪一個行業(yè)不會受這次AI變革的影響。”周靖人指出,AI本身還有很多工作,包括模型本身的進化,未來的多模態(tài)如何能把模型應(yīng)用起來是行業(yè)發(fā)展的關(guān)鍵。在他看來,“這也許是一生中少有的計算技術(shù)革命。”(南方日報)