隨著2024年的漸行漸遠,科技界與風險投資領域在這一年中將目光投向了人工智能,見證了一系列技術突破與應用的爆發(fā)。這一年,生成式人工智能(AI)大模型不僅延續(xù)了前幾年的技術積累,更是在多個領域實現(xiàn)了廣泛應用,從科研到商業(yè),從娛樂到醫(yī)療,AI的影響力無處不在。
OpenAI作為人工智能領域的領頭羊,在2024年繼續(xù)引領技術潮流。12月,OpenAI進行了為期12天的直播活動,并在最后一天發(fā)布了新一代推理模型系列o3。該模型在極具挑戰(zhàn)性的數(shù)學和邏輯問題基準測試ARC-AGI中取得了87.5%的分數(shù),超越了“人類水平”的85%閾值,同時在編程競賽Codeforces上獲得2727的高分,展現(xiàn)出了超越大部分人類程序員的實力。
除了o3,OpenAI在2024年還發(fā)布了具有里程碑意義的o1模型和Sora。o1模型首次實現(xiàn)了在回答用戶提問時形成類似人類思維方式的內部思維鏈CoT,顯著提升了模型在處理復雜問題時的準確性和邏輯性。而Sora則支持多種輸入方式,如文本、語音、圖片和視頻,能夠生成逼真的視頻內容,并配備了編輯功能,滿足了創(chuàng)作者的多樣化需求。
隨著Sora的推出,多模態(tài)大語言模型(MLLMs)在2024年迅速崛起。這些模型能夠融合多種模態(tài)的數(shù)據(jù),生成高度準確的視覺內容,并在三維空間世界中展現(xiàn)出色表現(xiàn)。例如,李飛飛創(chuàng)辦的World Labs用一張圖、一句話就能生成3D世界的AI系統(tǒng),降低了3D內容制作的成本,激發(fā)了更多的沉浸式體驗。
在算力方面,英偉達憑借其H100 GPU和新一代Blackwell架構在AI訓練和推理方面展現(xiàn)出卓越性能,鞏固了行業(yè)領導地位。同時,谷歌的TPU和亞馬遜的Inferentia等定制芯片也在加速普及,推動了算力效率的持續(xù)提升。
在應用層面,2024年可以說是AI大模型應用全面爆發(fā)的一年。從辦公效率工具到精準醫(yī)療,從智能金融到數(shù)字人直播,AI大模型為各行業(yè)賦予了新的生命力。例如,微軟的Copilot推動了辦公工具的全面發(fā)展,文章寫作、PPT制作、繪圖等功能為用戶節(jié)省了大量時間,并生成了新穎、有創(chuàng)意的成果。
AI搜索引擎作為獨特的應用領域,在融資方面取得了顯著進展。Perplexity AI在12月完成了5億美元的融資,估值達到90億美元;企業(yè)搜索初創(chuàng)公司Glean也在9月宣布完成超過2.6億美元的融資,估值翻倍至46億美元。這些進展表明,AI搜索引擎正在侵蝕傳統(tǒng)搜索引擎的市場空間,為用戶提供更便捷、更準確的搜索結果。
在硬件方面,2024年也被視為AI硬件的創(chuàng)新大年。蘋果和Google推出的AI手機成為行業(yè)標志性事件,將AI深度融入智能手機中。同時,端側AI(On-device AI或Edge AI)的發(fā)展也備受關注,它允許在本地設備上運行人工智能模型,實現(xiàn)實時響應和增強體驗。
中國AI出海應用在2024年取得了巨大發(fā)展。根據(jù)SensorTower的數(shù)據(jù),上半年美國AI應用市場中排名前十的應用中有三款來自中國企業(yè)。這些應用通常采用高性價比的服務策略,吸引了大量用戶,并在全球市場上占據(jù)了一席之地。
在競爭格局方面,2024年大模型領域不再是OpenAI的一枝獨秀。Claude和Gemini等挑戰(zhàn)者迅速崛起,與OpenAI展開了激烈的市場競爭。Claude憑借其高性能和靈活架構成為企業(yè)整合AI技術的首選方案之一,而Gemini則融合了多種先進的AI技術,具備更強的自我學習能力和生成能力。
盡管通用人工智能(AGI)的宏大愿景仍需時間來實現(xiàn),但2024年讓我們看到了人工智能從“前沿探索”逐步走向“實際落地”的巨大潛力。小模型的高效化、多模態(tài)模型的自然化、Agent架構的智能化,以及各行業(yè)的廣泛應用,都表明人工智能正深刻改變著社會經(jīng)濟格局。