近日,Nous Research公司震撼發布了一個名為Psyche的全新項目,該項目是一個基于Solana區塊鏈的去中心化人工智能訓練網絡。這一創新平臺旨在動員全球用戶利用閑置的計算資源,共同參與尖端AI模型的研發工作。通過采用DisTrO技術,Psyche成功大幅削減了帶寬需求,并啟動了一項前所未有的互聯網分布式訓練任務,目標是構建一個擁有40億參數的AI模型,并將所有數據、檢查點等完全對外開放。
Psyche網絡的核心在于其去中心化的理念,徹底顛覆了傳統AI訓練對集中式數據中心的依賴。該平臺通過Solana區塊鏈來協調全球范圍內的分布式GPU資源,使得任何人都能貢獻出閑置的計算能力,參與到模型的訓練中來。據悉,Psyche的首要任務是預訓練一個名為Consilience的模型,該模型采用多頭潛在注意力架構,并基于一個包含20萬億token的超大規模數據集進行訓練,這一數據集由FineWeb14T、FineWeb-24T和The Stack v21T等部分組成。此次訓練任務不僅是互聯網上有史以來規模最大的分布式AI訓練,同時也標志著去中心化AI開發領域的一個重要里程碑。
Nous Research強調,Consilience模型在設計時充分考慮了高效性和可訪問性。其40億參數的規模適中,既可以在高端的H/DGX服務器上完成訓練,也能在消費級的RTX3090 GPU上運行推理任務。該模型還支持長上下文處理,為高級推理和創意應用提供了堅實的基礎。這種規模的選擇巧妙地平衡了性能與普及化的目標,為中小型團隊和個人開發者提供了一個強大的工具。
Psyche網絡的成功在很大程度上得益于Nous Research自主研發的DisTrO技術。這項技術通過優化器創新,將GPU間的通信數據量壓縮了1000至10000倍,其原理類似于JPEG圖像的頻率域轉換壓縮。DisTrO允許每個節點獨立進行訓練,而無需在每一步都進行同步,從而顯著降低了網絡延遲和帶寬需求,使得全球各地的異構硬件能夠協同工作,共同參與到AI模型的訓練中。
在Psyche網絡中,Solana區塊鏈扮演著至關重要的角色。智能合約負責存儲訓練元數據、參與者列表以及隨機分配任務,確保了整個訓練過程的透明性、防篡改性和抗審查性。Solana的高吞吐量和低交易成本使其成為處理分布式訓練微交易的理想平臺,進一步增強了Psyche的全球可擴展性。
Psyche項目致力于通過全面開源來推動AI的普及化。所有訓練數據、檢查點和結果都將被公開分享,并托管在Hugging Face和GitHub等平臺上,供全球開發者免費訪問和使用。目前,Psyche的代碼已經開放,開發者可以通過Rust-based系統和P2P網絡參與到優化工作中來,或者基于開放文檔構建自定義的應用。
Nous Research還計劃進一步擴展Psyche的功能,包括支持模型微調和社區數據輸入等。這將使得小型團隊甚至個人能夠定制專屬的AI模型。例如,社區成員可以上傳領域特定的數據,訓練適用于教育、醫療或創意等領域的模型。這種社區驅動的模式有望激發全球范圍內的創新活力,并對OpenAI、DeepSeek等集中式AI巨頭形成有力挑戰。
Psyche的發布標志著去中心化AI進入了一個快速發展的新階段。與傳統的云端AI相比,Psyche的分布式架構不僅降低了訓練成本,還通過區塊鏈激勵機制將算力貢獻從“捐贈”轉變為“交易”,從而吸引了更廣泛的參與。此前,Psyche已經成功完成了一項150億參數模型的測試訓練,跨越了1.1萬步,驗證了其在全球網絡中的穩定性和可靠性。
在測試網啟動僅44分鐘后,Psyche項目便通過捐款籌集了價值50萬美元的GPU算力,這充分展示了社區對Psyche項目的高度熱情和積極參與。這一成功不僅為Nous Research帶來了極大的鼓舞,也為去中心化AI的發展注入了新的動力。
作為AI領域的權威觀察者,有觀點認為,Psyche的推出不僅是Nous Research的一個重要里程碑,同時也是去中心化AI發展的一個轉折點。其創新的DisTrO技術和Solana區塊鏈的結合,為全球開發者提供了一個前所未有的參與AI開發的機會,打破了技術和資源的壁壘。對于中國的AI社區而言,Psyche的開源框架有望為國產模型如Qwen3等提供更加高效的本地化微調方案。