字節跳動旗下的智能AI助手豆包近期迎來了文生圖功能的全新升級,這一改進使得用戶能夠輕松實現一鍵生成附帶指定文本的圖片。在生成圖片的提示詞中,用戶只需簡單輸入如“一張帶有‘新年快樂’的圖片”,系統即可迅速響應,生成一張包含用戶指定文字的圖片。目前,這一功能已在豆包APP內開啟測試,同時,即夢應用也在小范圍內進行了測試。
文生圖技術中,精準地在圖像中生成文字一直是一個技術難點,尤其是針對中文文字,亂碼現象時有發生。相較于英文字母,漢字的結構更為復雜,且字符數量遠超前者兩個數量級。豆包大模型團隊的相關負責人透露,豆包的文生圖模型通過整合LLM和DIT架構,顯著提升了其原生中文數據的學習能力。在此基礎上,團隊還進一步強化了漢字的生成能力,從而大幅提高了生成效果。
隨著這一功能的推出,眾多用戶開始嘗試利用它制作表情包、梗圖漫畫,甚至輔助生成海報,并在社交媒體上分享自己的創作。不過,目前該功能僅支持在生成圖片時添加文字,暫不支持從已有圖片中提取或生成文字。
在社交媒體上,已有即夢內測用戶發布了使用這一功能生成的圖片,引發了廣泛關注和討論。
豆包的負責人表示,盡管該功能剛剛推出,還在不斷完善和優化中,但在絕大多數情況下,豆包已經能夠準確生成用戶指定的文字。然而,仍有個別情況會出現錯字、漏字或小字亂碼等問題。他強調:“無論是文字、圖片還是音樂生成功能,豆包始終致力于降低創作門檻,幫助用戶更好地表達和創造。”
豆包網頁版及電腦版也將在不久的將來上線這一功能,為用戶提供更多樣化的創作平臺。