在2025年春節的喜慶氛圍中,人工智能領域迎來了一場震撼業界的變革。DeepSeek,這家成立于2023年的新興企業,以其卓越的技術實力和創新精神,在春節假期前后引發了一場關于高性能模型訓練與低成本實現的熱議。
早在今年1月20日,DeepSeek便正式開源了其R1推理模型。這款模型在數學、代碼、自然語言推理等關鍵任務上,展現出了與OpenAI-o1正式版相媲美的性能,而其開發成本僅為600萬美元,不足OpenAI-o1模型開發成本的1.2%。這一壯舉不僅彰顯了DeepSeek的技術實力,更為業界帶來了全新的低成本高性能模型訓練思路。
隨后,在2024年12月26日,DeepSeek再次宣布上線并同步開源了其DeepSeek-V3模型。這款模型以驚人的效率,僅使用2000個GPU芯片,在1/11的算力下訓練出了性能超越GPT-4o的大模型,訓練成本更是低至GPT-4o的5.6%。這一消息無疑為業界帶來了更大的震撼,多家中外算力芯片企業紛紛宣布適配DeepSeek模型,以期在激烈的市場競爭中占據有利地位。
龍芯中科率先宣布,搭載龍芯3號CPU的設備已成功運行DeepSeek R1 7B模型,實現了本地化部署。這一舉措不僅為用戶提供了更快、更強、更省的訓推體驗,還標志著DeepSeek模型在國產化硬件平臺上的成功應用。同時,龍芯還聯合太初元碁等產業伙伴,迅速完成了DeepSeek-R1系列模型的適配工作,并上線了多款大模型服務。
燧原科技也不甘落后,宣布完成了對DeepSeek全量模型的高效適配,并在多個智算中心完成了數萬卡的快速部署。華為則宣布DeepSeek系列模型已正式上線昇騰社區,支持一鍵獲取和開箱即用,進一步降低了用戶的使用門檻。
海光信息、天數智芯、摩爾線程等企業也相繼宣布完成了對DeepSeek模型的適配工作,并上線了相關服務。其中,海光信息成功完成了DeepSeek V3和R1模型與海光DCU的適配,并上線了DeepSeek-Janus-Pro多模態大模型。天數智芯則在短短一天內完成了與DeepSeek R1的適配工作,并上線了多款大模型服務。
英特爾和英偉達也加入了這一行列。英特爾宣布DeepSeek能夠在其產品上運行,并在AI PC上實現離線使用,強調了其本地部署能力。而英偉達則在其開發者網站上提供了DeepSeek-R1模型微服務預覽版,供開發人員測試和試驗。
隨著DeepSeek模型的廣泛應用和不斷迭代升級,業界對其前景充滿了期待。而這場由DeepSeek引發的技術變革,也必將為人工智能領域帶來更多的創新和突破。