近期,國產AI大模型DeepSeek在全球范圍內引發關注,隨之走入公眾視野的是一位95后的AI“天才少女”——羅福莉。據多方報道,小米創始人雷軍親自出手,以千萬年薪的待遇,成功招募這位DeepSeek開源大模型DeepSeek-V2的核心開發者之一,讓她領導小米的AI大模型團隊。
羅福莉,這位年輕的AI天才,本科就讀于北京師范大學計算機專業,后在北京大學深造計算語言學專業,取得了碩士學位。早在2019年,還在北大攻讀碩士學位的她,就在人工智能領域的頂級國際會議ACL上發表了8篇論文,其中包括2篇第一作者的文章,這一成就迅速讓她在學術界嶄露頭角,甚至登上了知乎熱搜。面對突如其來的關注,羅福莉在知乎上回應稱,這些成果是她近一年的努力所得,當然其中也不乏運氣的成分。
碩士畢業后,羅福莉的職業生涯同樣耀眼。她先是在阿里達摩院從事人工智能研究,主導開發了多語言預訓練模型VECO。之后,她轉戰幻方量化,從事深度學習相關策略建模和算法研究。再后來,她加入了DeepSeek,擔任深度學習研究員,參與了MoE大模型DeepSeek-V2的研發工作。今年5月,DeepSeek-V2發布后,羅福莉在知乎上發表了對該模型的看法,她認為DeepSeek-V2的中文水平在國內外閉源模型中處于第一梯隊,且其性價比極高。
羅福莉的加入,是小米全面發力AI大模型戰略的一個重要舉措。早在2023年4月,小米就成立了AI實驗室大模型團隊,致力于挖掘AI相關的用戶場景,并發揮自身技術優勢,與合作伙伴開拓更多機會。今年11月,小米又成立了專門的AI平臺部,由小米的元老級技術大牛張鐸負責。張鐸本碩畢業于清華大學計算機系,曾被雷軍譽為“小米的大神”,并送以“鐸神”的稱號。
小米在AI領域的投入不僅限于招募人才。近期,小米正在搭建GPU萬卡集群,規模遠超其大模型團隊成立時的約6500張GPU。這一計劃由雷軍親自領導,并已實施數月。小米集團總裁盧偉冰透露,預計2024年小米的研發費用將達到240億元,2025年更是將攀升至300億元。自2022年至2026年的五年內,小米的研發投入將超過1000億元,主要聚焦于AI、OS、芯片三大底層技術的研發。
在二級市場上,小米近期股價上漲的主要驅動因素之一是其加碼AI算力的戰略。小米汽車也宣布其SU7全年交付量已超過13萬輛,提前完成全年目標。2024年12月27日,小米股價創下2022年以來新高,盤中觸及34.95港元/股。雷軍在公開演講中曾表示,小米做大模型的思路與許多公司不同,選擇主力突破的是輕量化和本地部署。對于小米這樣在手機和造車領域都注重“性價比”的公司而言,如何在燒錢的大模型業務中平衡成本,無疑是雷軍考慮的核心問題。而羅福莉的加入,或許正是小米在AI領域邁出的重要一步。