近期,國產AI大模型DeepSeek在全球范圍內引發了廣泛關注,并隨之曝光了一位95后的AI領域“天才少女”——羅福莉。據悉,小米公司創始人雷軍親自出面,以千萬年薪的待遇,成功將這位關鍵開發者招致麾下,領導小米的AI大模型團隊。
這張雷軍視頻號上的圖片,記錄了這一重要時刻。羅福莉的背景和成就令人矚目,她本科就讀于北京師范大學計算機專業,碩士階段則在北京大學計算語言學專業深造。早在2019年,還在北大攻讀碩士學位的她就已在人工智能領域的頂級國際會議ACL上發表了8篇論文,其中2篇為第一作者,這一成就迅速讓她登上了知乎熱搜。
羅福莉本人在知乎上回應稱,這些論文是她近一年的研究成果,她付出了足夠的努力,當然其中也不乏運氣的成分。畢業后,她先后加入了阿里達摩院和幻方量化,從事人工智能研究和深度學習相關策略建模,期間主導開發了多語言預訓練模型VECO,并參與了MoE大模型DeepSeek-V2的研發。
羅福莉在個人公眾號上分享的照片,展現了她的專業風采。DeepSeek-V2發布后,她在知乎上發表了對該模型的看法,認為其中文水平在國內外閉源模型中處于第一梯隊,且性價比極高。
羅福莉的加入,是小米全面發力AI大模型戰略的一個重要環節。自2023年4月正式組建AI實驗室大模型團隊以來,小米一直在不斷挖掘AI相關的用戶場景,并發揮自身技術優勢,以開放的態度與合作伙伴開拓更多機會。今年11月,小米還成立了專門的AI平臺部,由小米的元老級技術大牛張鐸擔任負責人。
從小米招聘的官方頁面可以看到,僅北京地區大模型相關的崗位就多達59個,顯示出小米在AI領域的雄心壯志。除了招募人才,小米還在加大AI和算力的投入,計劃搭建GPU萬卡集群,規模遠超之前。這一計劃由雷軍親自領導,并已實施數月。
小米集團總裁盧偉冰透露,預計2024年小米的研發費用將達到240億元,2025年更是將攀升至300億元。從2022年至2026年的五年內,小米的研發投入將超過1000億元,主要聚焦于AI、OS、芯片三大底層技術的研發。目前,小米的AI團隊規模已達3000多人。
在二級市場上,小米加碼AI算力的舉措也推動了其股價的上漲。小米汽車宣布已提前完成全年所有目標,交付量超過13萬輛。12月27日,小米股價創下2022年以來的新高,盤中觸及34.95港元/股。雷軍在公開演講中曾表示,小米做大模型的思路與眾不同,選擇主力突破的是輕量化和本地部署,如何在燒錢的大模型業務中平衡成本,是雷軍考慮的核心問題。而羅福莉的加入,或許正是小米解決這一問題的關鍵。