在百度AI DAY的盛會(huì)上,文小言迎來(lái)了品牌的全面煥新與功能的重磅升級(jí)。此次升級(jí),文小言不僅引入了百度自研的文心大模型X1和4.5,還整合了滿血版DeepSeek-R1、可靈等第三方模型,實(shí)現(xiàn)了多模型的融合調(diào)度。
更文小言此番還推出了全新的語(yǔ)音大模型、圖片問答、AI生成圖片與視頻等一系列創(chuàng)新功能,為用戶帶來(lái)了更加豐富多樣的使用體驗(yàn)。用戶現(xiàn)在可以選擇“自動(dòng)模式”,一鍵調(diào)用最優(yōu)模型組合,無(wú)需再為不同任務(wù)頻繁切換模型。當(dāng)然,如果用戶有特定需求,依然可以選擇使用單一的DeepSeek或文心大模型。
百度AI產(chǎn)品創(chuàng)新業(yè)務(wù)負(fù)責(zé)人薛蘇表示,AI的未來(lái)已經(jīng)超越了單純的技術(shù)參數(shù)競(jìng)爭(zhēng),而是聚焦于如何通過多模型的協(xié)同工作,為用戶創(chuàng)造真正的價(jià)值。文小言致力于打造一個(gè)開放的生態(tài),整合頂尖的模型能力,從而推出更強(qiáng)大、更簡(jiǎn)潔的AI產(chǎn)品。
在實(shí)際測(cè)試中,文小言展現(xiàn)出了強(qiáng)大的功能。當(dāng)使用文心大模型X1來(lái)設(shè)計(jì)一款吉卜力風(fēng)格的帆布包時(shí),它能夠準(zhǔn)確解析風(fēng)格特點(diǎn),并連續(xù)調(diào)用AI繪圖工具,快速生成帆布包的正反面效果圖。而文心4.5的多模態(tài)分析能力,則能精準(zhǔn)識(shí)別出照片中的地理位置、背景建筑等城市特點(diǎn)。
文小言還支持在拍攝過程中直接用語(yǔ)音提問,能夠自動(dòng)拍攝并識(shí)別語(yǔ)音進(jìn)行回答。在圖片問答的基礎(chǔ)上,文小言還能基于原圖進(jìn)行一鍵二次創(chuàng)作,例如上傳一張水杯的照片,就能設(shè)計(jì)出同款的抱枕和鼠標(biāo)墊。不過,當(dāng)原圖元素過于復(fù)雜時(shí),仍可能出現(xiàn)文字拼寫錯(cuò)誤或主體不一致的問題。
文小言還整合了百度的拍照搜題功能,用戶只需在拍攝界面選擇“解題老師”,就能自動(dòng)調(diào)用百度教育長(zhǎng)期積累的資源,很多題目還配備了視頻版數(shù)字人講解。同時(shí),文小言還支持重慶、廣西、河南、廣東、山東等特色方言對(duì)話,并能切換多種音色,如蠟筆小新、孫悟空、熊大熊二等,既能處理復(fù)雜知識(shí)問答,也能在角色扮演中隨時(shí)中斷。
據(jù)百度語(yǔ)音首席架構(gòu)師賈磊透露,文小言此次推出的語(yǔ)音大模型是業(yè)界首個(gè)基于全新互相關(guān)注意力機(jī)制的端到端語(yǔ)音語(yǔ)言大模型,其調(diào)用成本比行業(yè)平均水平降低了50%-90%,推理響應(yīng)速度極快,將用戶等待時(shí)長(zhǎng)縮短至約1秒。雖然目前暫不支持圖生圖功能,但文小言已經(jīng)融合了文生圖、AI修圖、AI視頻生成以及“圖個(gè)冷知識(shí)”等科普解讀向的新功能。
在談及文小言的商業(yè)模式時(shí),薛蘇表示,過早進(jìn)行商業(yè)化探索或在用戶基礎(chǔ)不穩(wěn)定的情況下進(jìn)行商業(yè)化嘗試,可能會(huì)對(duì)產(chǎn)品造成損失。因此,目前文小言將全面擁抱免費(fèi)策略,并專注于提升用戶體驗(yàn),這是他們的首要任務(wù)。