國內科技創新企業聯匯科技近日宣布,其開源智能體核心模型OmDet-Turbo已成功入駐全球知名的Transformers開源庫。這一成就標志著OmDet-Turbo模型在算法創新與實際應用性能上獲得了國際認可。
自OmDet-Turbo模型在GitHub平臺發布以來,其憑借出色的算法優化和高效的目標檢測能力,迅速吸引了業界的目光,收獲了超過1500次的點贊關注。這一模型的加入,不僅豐富了Transformers庫的預訓練模型和工具集,更為全球數百萬開發者在自然語言處理及機器學習任務中提供了更多選擇。
Transformers庫由Hugging Face公司維護,是全球范圍內廣泛使用的開源項目之一。此次OmDet-Turbo模型能夠入駐其中,得益于其在實際應用中展現出的高效、穩定性能,以及在目標檢測領域的卓越表現。該模型通過引入高效融合頭(EFH)模塊,有效降低了特征編碼和多模態融合的計算復雜性,同時保持了高水平的泛化能力和檢測精度。
OmDet-Turbo模型不僅具備實時檢測的能力,還結合了開放詞表目標檢測(OVD)的先進技術。其獨特的EFH模塊利用高效的語言感知編碼器(ELA-Encoder)和解碼器(ELA-Decoder),替代了傳統的重型編碼器和ROIAlign模塊,實現了更為高效的視覺-語言融合。這一創新設計使得OmDet-Turbo在COCO和LVIS數據集上的零樣本檢測性能接近當前最先進的監督模型,同時在ODinW和OVDeval數據集上刷新了性能基準,分別取得了30.1和26.86的AP分數。
OmDet-Turbo在實際應用中的推理速度同樣令人矚目。該模型的基礎版本(OmDet-Turbo-Base)在A100 GPU上的推理速度可達到100.2 FPS,有效解決了OVD模型在實際應用中推理速度慢的難題。這一卓越性能使得OmDet-Turbo成為實時目標檢測任務中的佼佼者,為全球研究人員和開發者提供了更為強大和便捷的開放技術。