在2025年的盛夏時節,全球科技界的目光聚焦于上海,這里正隆重舉辦世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)。本次大會以“智能時代,全球合作”為核心議題,匯聚了來自全球30多個國家和地區超過1200名頂尖嘉賓,其中包括圖靈獎與諾貝爾獎得主12人,中外院士80余位,以及多個國際知名實驗室的代表。
展會現場同樣熱鬧非凡,展覽面積首次躍升至7萬平方米,吸引了超過800家企業參展,展示了3000多項前沿科技成果。這些展品涵蓋了40多款大模型、50余款AI終端產品、60余款智能機器人,以及100多款“全球首發”或“中國首秀”的新品,令人目不暇接。
在WAIC大會期間,國內端邊大模型AI芯片領域的佼佼者后摩智能,隆重推出了其最新力作——后摩漫界M50 AI芯片。與此同時,該公司還發布了力擎系列M.2卡、力謀系列加速卡及計算盒子等硬件產品,構建起覆蓋移動終端與邊緣場景的全方位產品線。M50作為國內首顆面向端邊大模型的存算一體AI芯片,其性能表現尤為亮眼,擁有160TOPS(INT8)和100TFLOPS(bFP16)的物理算力,搭配最大48GB內存與153.6 GB/s的超高速帶寬,而典型功耗僅為10W,相當于手機快充功率,卻能輕松驅動PC、智能語音設備、機器人等智能移動終端,高效運行參數規模從1.5B到70B的本地大模型。
后摩智能CEO吳強在會后媒體交流會上透露,公司研發的端邊推理加速卡已成功適配從7B到70B的DeepSeek模型,芯片的上限潛力可達100B參數規模。同時,后摩智能正與中國移動攜手研發一體機產品。吳強認為,具身智能機器人領域正如十年前的智能駕駛一般,正處于發展的萌芽階段,這是一個潛力巨大的新興垂直市場,競爭格局尚未確定,各方仍有廣闊空間。一旦具身智能機器人技術成熟,其市場影響力或將遠超智能駕駛。
成立于2020年的后摩智能,專注于利用先進存儲器件技術打造存算一體大算力智駕芯片,致力于提供高效能、低成本的芯片及解決方案。公司創始人吳強畢業于美國普林斯頓大學,曾服務于AMD、Facebook及地平線公司,其團隊中碩博學歷占比超過70%。
存算一體(Computing in Memory)技術,通過在存儲器中嵌入計算能力,實現了二維和三維矩陣乘法/加法運算的新架構。相較于傳統的馮諾依曼架構,存算一體技術打破了“存儲墻”瓶頸,有效解決了算力與存儲速度不匹配的問題,成為后摩爾時代技術發展的新路徑。據預測,到2030年,中國存算一體芯片市場規模將突破1100億元大關。
自成立以來,后摩智能已順利完成四輪融資,吸引了包括紅杉資本中國基金、啟明創投、經緯創投、聯想創投、和玉資本、金浦投資等知名投資機構。在2024年7月,后摩智能更是宣布完成數億元人民幣的戰略融資,由中國移動旗下兩只基金聯合投資。
自鴻途H30發布兩年后,后摩智能決定全面轉型,聚焦端邊大模型AI算力領域。其研發的端邊AI芯片將廣泛應用于Pad、PC、智能語音設備、機器人等終端設備,以及一體機、計算盒子、工作站等智能邊緣設備,助力消費終端、智能辦公、智能工業等多個領域。
吳強坦誠,轉型之路充滿挑戰,因為存算一體與大模型之間存在諸多契合點。面對智能駕駛賽道日益激烈的競爭和逐漸穩定的格局,吳強意識到,為了體現存算一體的優勢,一代芯片算力過大,導致成本高昂,而當時市場更看重性價比。因此,后摩智能決定轉型,聚焦端邊大模型市場。在2024年初,后摩智能迅速調整第一代芯片,推出M30,并在中國移動的支持下,成功運行600億參數大模型,堅定了存算一體與大模型結合的信心。
關于新產品,吳強介紹,力謀LM5050加速卡與力謀LM5070加速卡分別集成了2顆和4顆M50芯片,為單機及超大模型推理提供強大的算力支持,最高可達640TOPS。同時,M50芯片的存算一體技術也在不斷演進,從SRAM-CIM到DRAM-PIM,不斷探索DRAM-PIM的產品化路徑。