近期,一位95后的AI“天才少女”羅福莉成為了科技界的焦點人物,其背后不僅是因為她在AI領域的卓越成就,更因小米創始人雷軍親自出手,以千萬年薪將其招入麾下,領導小米AI大模型團隊。
羅福莉的學術背景令人矚目。她本科畢業于北京師范大學計算機專業,隨后在北京大學攻讀計算語言學碩士學位。在讀碩士期間,她就在人工智能領域的頂級國際會議ACL上發表了8篇論文,其中2篇為一作,這一成就讓她在學術界聲名鵲起。羅福莉在知乎上回應這一成就時,謙遜地表示這是自己近一年的努力成果,同時也承認有運氣的成分。
畢業后,羅福莉的職業生涯同樣精彩紛呈。她先在阿里達摩院從事人工智能研究,負責預訓練語言模型相關的工作,并主導開發了多語言預訓練模型VECO。隨后,她加入幻方量化,從事深度學習相關策略建模和算法研究。最終,她跳槽到DeepSeek,擔任深度學習研究員,參與研發了MoE大模型DeepSeek-V2。
DeepSeek-V2的發布讓羅福莉再次受到關注。她在知乎上發表了對該模型的看法,認為其中文水平處于國內外閉源模型的第一梯隊,且性價比極高。這一觀點得到了業界的廣泛認可,也為她贏得了小米的青睞。
小米在AI領域的發力并非偶然。自2023年4月正式組建AI實驗室大模型團隊以來,小米就不斷挖掘AI相關的用戶場景,發揮自身技術優勢,并以開放的態度與合作伙伴開拓更多機會。今年11月,小米更是成立了專門的AI平臺部,由小米的元老級技術大牛張鐸負責。張鐸在清華計算機系本碩畢業,曾被雷軍公開稱贊為“小米的大神”,并送以“鐸神”的稱號。
除了招募人才,小米還在加大AI與算力的投入。近期,小米正在搭建GPU萬卡集群,規模較其大模型團隊成立時的約6500張GPU大幅增加。這一計劃由集團董事長雷軍親自領導,旨在提升小米在AI領域的競爭力。同時,小米集團總裁盧偉冰透露,預計2024年小米研發費用將達到240億元,2025年更是將攀升至300億元。自2022年至2026年的五年內,小米的研發投入將超過1000億元,主要聚焦于AI、OS、芯片三大底層技術的研發。
在二級市場上,加碼AI算力是小米近期上漲的主要驅動因素之一。小米汽車也宣布其SU7全年交付量已超過13萬輛,提前完成全年所有目標。這一消息進一步提振了小米的股價。2024年12月27日,小米股價創下2022年以來新高,盤中觸及34.95港元/股。
雷軍在公開演講時曾表示,小米做大模型的思路和很多公司不太一樣,選擇主力突破的是輕量化和本地部署。對于小米這樣在手機和造車上都講究“性價比”的公司而言,如何在燒錢的大模型業務中平衡成本,無疑是雷軍考慮的核心問題。而羅福莉擁有DeepSeek-V2的研發背景,或許正是雷軍看中她的原因。