近日,全球知名IT市場研究與咨詢公司IDC發(fā)布了一項(xiàng)關(guān)于中國生成式AI應(yīng)用開發(fā)平臺市場的報(bào)告,該報(bào)告聚焦于企業(yè)統(tǒng)一AI開發(fā)平臺的雛形,并對市場上的大模型平臺進(jìn)行了深入探討。IDC定義的大模型平臺由模型開發(fā)平臺和應(yīng)用開發(fā)平臺兩部分組成,前者提供訓(xùn)練與調(diào)優(yōu)工具,后者則支持低代碼/無代碼應(yīng)用開發(fā)。
報(bào)告不僅對比分析了市場上的主流大模型平臺廠商,還為企業(yè)用戶提供了選擇平臺的關(guān)鍵技術(shù)指標(biāo)。在評估中,百度智能云脫穎而出,榮獲七項(xiàng)滿分,穩(wěn)居榜首,亞馬遜云AWS和阿里云緊隨其后,并列第二。
IDC指出,大模型平臺為應(yīng)用程序開發(fā)開辟了新的路徑。企業(yè)在選擇平臺時(shí),應(yīng)重點(diǎn)關(guān)注模型層和數(shù)據(jù)層的能力。模型層方面,如何讓模型更好地適配企業(yè)應(yīng)用場景是關(guān)鍵;數(shù)據(jù)層方面,則需做好RAG(檢索增強(qiáng)生成),以確保生成內(nèi)容的準(zhǔn)確性,消除幻覺。
百度智能云憑借其深厚的技術(shù)積累,在模型層和數(shù)據(jù)層均表現(xiàn)出色。其千帆大模型平臺提供從模型開發(fā)、模型服務(wù)到應(yīng)用開發(fā)的全流程服務(wù)。文心大模型日均調(diào)用量超過15億次,千帆平臺已幫助客戶精調(diào)3.3萬個(gè)模型,開發(fā)77萬個(gè)企業(yè)應(yīng)用。
模型精調(diào)對于大模型與產(chǎn)業(yè)的深度融合至關(guān)重要。大模型雖具有強(qiáng)大的泛化能力,但在特定行業(yè)及領(lǐng)域的應(yīng)用中,仍需通過精調(diào)來融入專業(yè)知識和數(shù)據(jù)特征,以滿足特定需求。百度智能云千帆平臺提供了完整的工具鏈,支持多種模型訓(xùn)練方法,并提供高質(zhì)量通用語料數(shù)據(jù)和模型精調(diào)樣板間,每天超過一半的調(diào)用量來自精調(diào)后的模型。
以醫(yī)療行業(yè)為例,杭州全診醫(yī)學(xué)基于千帆平臺和文心大模型打造的AI醫(yī)療助理應(yīng)用,能夠在醫(yī)療全階段服務(wù)醫(yī)生和患者。通過20萬份精標(biāo)病歷數(shù)據(jù)對模型進(jìn)行精調(diào),AI醫(yī)療助理的醫(yī)學(xué)用語更加準(zhǔn)確規(guī)范,病歷生成準(zhǔn)確度提升45%,醫(yī)生接診量提高20%。
RAG技術(shù)已成為企業(yè)解決大模型幻覺問題的有效手段。生成式AI已成為企業(yè)布局和投資的重點(diǎn),但通用大語言模型在實(shí)際應(yīng)用中常存在幻覺問題或回答不準(zhǔn)確的情況。為解決這一問題,企業(yè)采用RAG技術(shù),將生成式AI與企業(yè)內(nèi)部數(shù)據(jù)庫、知識庫結(jié)合,使生成內(nèi)容更加準(zhǔn)確合理。IDC發(fā)布的另一份報(bào)告顯示,在生成式AI開發(fā)過程中,41%的高管認(rèn)為構(gòu)建RAG架構(gòu)至關(guān)重要,81%的IT領(lǐng)導(dǎo)者認(rèn)為基于業(yè)務(wù)數(shù)據(jù)的生成式AI模型能為企業(yè)帶來顯著競爭優(yōu)勢。
在RAG和向量數(shù)據(jù)庫市場評估中,百度智能云的向量數(shù)據(jù)庫VectorDB在核心性能、功能全面性、大模型支持、戰(zhàn)略與生態(tài)合作、工程化落地五個(gè)領(lǐng)域保持領(lǐng)先,綜合排名并列第一。目前,VectorDB已在超過500家客戶中實(shí)際落地使用,支持多種常用算法和主流LLM、RAG框架,以及百度智能云千帆和開源Embedding模型。