在人工智能領域,一個曾經遙不可及的夢想正逐漸變為現實。階躍星辰創始人兼CEO姜大昕,在近期的一次生態開放日活動中分享了他對通用人工智能(AGI)的見解與公司的最新進展。
階躍星辰,這家成立于2023年的大模型公司,由微軟前全球副總裁姜大昕親自掛帥。公司自成立以來,便吸引了上海國資、騰訊、五源資本和啟明創投等多家知名投資機構的青睞,成為業內備受矚目的“六小龍”之一。
姜大昕在演講中透露,階躍星辰從成立之初便制定了實現AGI的宏偉藍圖,這一藍圖被劃分為模擬世界、探索世界和歸納世界三個階段。在模擬世界階段,公司致力于訓練模型模仿學習各種模態的表征,并逐步培養模型解決復雜問題的能力。
“為了實現這一目標,我們引入了強化學習的方法。”姜大昕指出,“強化學習能夠讓模型學會探索的過程,學會慢思考。正如AlphaGo和最近大火的DeepSeek所采用的訓練方法一樣。”然而,姜大昕強調,強化學習并非AI的終點,AI的下一個重要突破將是機器能夠自主學習,主動發現物理規律。
在談到DeepSeek時,姜大昕對其開源模型表示贊賞,認為這為整個AI社區做出了巨大貢獻。受此啟發,階躍星辰近期也發布了兩款開源的多模態大模型——一款是300億參數的文生視頻模型,另一款則是1300億參數的語音模型Step Audio。姜大昕表示,希望這兩款模型的開源能夠激發開發者的創造力,推動更多豐富多彩的應用誕生。
姜大昕還透露了階躍星辰正在研發的推理模型Open-Reasoner-Zero。據他介紹,該模型在效率上相比DeepSeek-R1-Zero有著顯著提升,可達25倍之多。更令人振奮的是,階躍星辰將開源該模型的實驗結果、代碼數據和論文,為AI社區貢獻更多智慧。
在視覺推理模型方面,姜大昕認為視覺和文本一樣,面對復雜問題時同樣需要慢思考和思維鏈的能力。他強調,如何將強化學習的方法引入視覺領域,實現慢思考,是當前AI領域的前沿問題。階躍星辰正在這一領域進行積極探索。
對于大模型的應用發展,姜大昕指出Agent已成為海內外公認的AI超級應用。Agent能夠自主幫助人類完成復雜的任務,具備自動和主動兩大特點。自動意味著在執行任務時盡可能減少或無需人類干預;而主動則意味著Agent能夠觀察用戶環境,主動發起或完成任務。
“為什么Agent會在眼下這個時間點突然變得火熱?”姜大昕解釋道,“這是因為Agent的爆發需要多模態和慢思考兩大能力,而這兩個能力在2024年都已得到實現。”他認為,多模態能力使Agent能夠充分理解和感知世界,更好地理解用戶任務;而強大的推理能力則能夠提升任務完成率和效率。
姜大昕還預測,未來每一臺終端設備都將配備一個Agent,其能力將從簡單任務、組合任務、復雜任務逐步升級到主動發起任務和最后的情感陪伴。這一愿景無疑為AI的未來發展開辟了無限可能。