在全球人工智能領域的浩瀚星空中,一顆來自中國杭州的新星——DeepSeek,正以驚人的速度劃破長空,引起了全球科技界的廣泛關注。這家成立不到兩年的初創企業,憑借其最新的推理模型R1,成功觸動了全球大模型界的敏感神經。
風險投資巨頭a16z的創始人安德森,將DeepSeek的R1模型比作人工智能領域的“斯普特尼克時刻”,這一比喻源自蘇聯在1957年成功發射人造衛星的歷史性事件。英偉達的高級研究科學家Jim Fan則指出,DeepSeek作為非美國公司,正在實踐OpenAI最初的使命。在華爾街,DeepSeek同樣引發了巨大震動,從股市波動到科技巨頭的財報電話會,分析師們紛紛探討DeepSeek帶來的深遠影響。據不完全統計,僅在一周內,DeepSeek就在至少九次財報電話會議上被提及。微軟CEO薩蒂亞·納德拉承認,DeepSeek確實帶來了創新,而meta創始人扎克伯格更是將這家中國公司視為新的強勁對手。
DeepSeek的崛起并非孤例,它代表著中國大模型玩家在全球舞臺上的一次集體亮相。自2024年以來,中國AI技術在硅谷多次受到矚目,被譽為“神秘的東方力量”。AI領域的權威專家吳恩達指出,中美在生成式AI領域的差距正在迅速縮小,中國在某些領域甚至已經展現出領先的趨勢。
中國AI技術的快速發展,得益于多個領域的創新突破。以多模態領域的文生視頻為例,去年2月,OpenAI發布了Sora,但真正推動AI視頻落地的卻是中國科技大廠快手的可靈產品??伸`在內測階段就吸引了大量海外用戶的關注,他們紛紛祈求獲得“中國賬號”。在語音方面,字節跳動的豆包產品以其驚人的擬人效果,實現了GPT-4所追求的語音助手效果。在解決大模型的“幻覺”問題上,中國公司同樣表現出色。百度等中國企業提出的RAG(檢索增強生成)技術,已成為提升大模型性能的共識。百度在發布文心一言時,就強調了RAG技術的特色,如今這一特色已成為行業追逐更優模型效果的共同目標。
通過對比文心一言和ChatGPT的實際表現,可以清晰地看到中國AI技術的顯著進步。以熱門春節檔電影為話題,分別向文心一言和ChatGPT提出兩個問題。在回答“做藕粉的過程中,出現了哪些讓哪吒感覺不適的操作?”和“在徐克的射雕電影中,黃蓉給歐陽鋒的九陰真經,是用什么語言寫的?”時,文心一言給出了詳細且正確的解答,而ChatGPT即使在聯網狀態下也未能提供正確或詳細的回答。這背后是百度針對RAG技術構建的一整套“理解-檢索-生成”協同優化技術的支撐。
從構建低成本模型到RAG技術、多模態、語音交互等領域的追趕超越,無論是DeepSeek這樣的創業公司,還是百度等科技大廠,都在全球大模型競逐中占據了重要位置。中國AI技術的快速發展,不僅體現在技術創新上,更體現在其獨特的創新理念上。這可以概括為三個關鍵詞:應用優先、形態豐富、務實優先。
百度創始人李彥宏曾強調,模型本身不產生直接價值,只有在模型之上開發各種應用,在各種場景中找到“PMF”(產品市場契合點),才能真正產生價值。這種“應用優先”的理念,隨著中國大模型玩家的洗牌和分化,逐漸成為共識。在廣闊的應用土壤中,中國AI更容易發現用戶實際需求,迅速迭代,找到創新的落腳點。中國AI的應用形態不斷豐富,能力不斷迭代,跨越了從“能用到好用”的鴻溝。在《2024全球AI產品付費用戶規模》榜單中,中國AI產品百度文庫以4000萬付費用戶規模位列全球第二,僅次于微軟Copilot,這充分展示了中國AI的真價值。
與海外大模型企業追求“暴力美學”不同,中國AI企業在有限資源下追求務實主義。DeepSeek就是其中的典型代表,它通過混合專家模型、多頭潛在注意力極致、多令牌預測、長鏈式推理等多種技術組合,實現了模型訓練的高效率和低API成本。李彥宏曾對比國內外AI生態,指出中國AI公司更注重邊做邊解決問題,更早接觸場景和應用,以解決實際問題為導向。
隨著中國AI的崛起,中美AI競逐的敘事正在發生變化。過去,人們常認為中國AI只跟隨、無創新,但現在,中國AI一面專注模型迭代,一面聚焦成本效率優化,親手打破了這一質疑。中國科技公司利用有限資源的極致高效利用,繞開“算力暴力美學”,實現彎道超車。同時,豐富的實體產業應用場景和高質量的數據,都利于中國AI公司更務實的探索,讓AI落地千行百業,實現真正的“平權”。DeepSeek的出圈,讓外界看到了中國AI的爆發能力,以及中國正在加速縮短與美國AI的差距。
在中美大模型競逐的新階段,中國AI的創新價值正在被世界重新評估。OpenAI推出o3-mini新模型,無疑加劇了競爭的激烈程度,但“DeepSeek風暴”只是中國AI崛起的開始。據透露,春節過后,百度或將推出文心模型的新版本,這將進一步展示中國AI的實力和潛力。