在近期于上海成功舉辦的2024中國生成式AI大會(上海站)上,一場關于AI音樂創新的精彩演講吸引了眾多目光。此次大會由智東西與智猩猩攜手主辦,匯聚了眾多行業精英與前沿技術探索者。在大會首日的主論壇環節,趣丸科技副總裁賈朔帶來了題為《AI音樂:技術平權下的創新實踐》的主題演講,深入探討了AI在音樂創作領域的突破性進展。
賈朔指出,2024年堪稱AIGC音樂的元年,這一年內,人工智能技術的飛速發展極大地降低了音樂創作的門檻,使得普通用戶也能輕松體驗到創作的樂趣,音樂創作領域終于迎來了“創作平權”的新時代。在此之前,文字、圖片、視頻等內容的創作平權問題已在移動互聯網時代得到了有效解決,但音樂創作卻一直是這一時代中的“漏網之魚”。
他進一步分析,音樂之所以成為最后一種被LLM浪潮覆蓋的模態,主要源于其獨特的性質:時間序列性、多層次結構、情感一致性和評估的主觀模糊性。這些特性使得音樂生成技術面臨諸多挑戰。然而,隨著Diffusion in Transformer(DiT)成為主流技術路線,國產AI音樂的歌聲自然度已經突破了人耳識別的閾值,效果與美國頭部模型不相上下。
賈朔還分享了AI與音樂交互形式的演變過程,從文生音樂到三鍵成曲,再到哼唱成曲,每一次創新都極大地豐富了用戶的創作體驗。今年7月,天譜樂全球首發多模態音樂生成模型,用戶只需上傳視頻或圖片,即可一鍵生成完整的音樂作品。這一功能不僅簡化了創作流程,還為用戶提供了更多元化的創作靈感。
在演講中,賈朔還首次預告了天譜樂即將推出的新功能——MidiRender。這一功能類似于文生圖領域的Control Net,用戶可以輸入自己的音樂構想,然后讓天譜樂AI根據這個原創音樂片段填充歌詞、完成編曲。這標志著AI音樂創作將進入一個更加可控、更加精準的新階段。
賈朔強調,盡管AI音樂技術已經取得了顯著進展,但技術的最終目的是服務于人,而不是取代人類的工作。他認為,AI大模型應該作為工具來輔助藝術家進行創作,而不是搶奪創作的主導權。翻開人類歷史,人類最擅長的兩件事是犯重復的錯誤和制造工具。每一次新工具的出現,都標志著人類能力的拓展和延伸。因此,AI音樂技術的出現不是為了取代人類作曲家,而是為了幫助他們創造更美麗的音樂作品。
賈朔還提到,在與音樂人的交流中,他發現人聲的自然度問題是阻礙AI音樂工具普及的關鍵因素之一。為了解決這一問題,天譜樂團隊進行了大量實驗和調整,最終取得了令人矚目的成果。在盲測中,天譜樂AI最新版本的中文人聲唱詞已經達到了新的天花板水平,歌聲自然度超越了人耳的識別閾值。
在演講的結尾部分,賈朔展示了MidiRender功能的演示視頻。視頻中,一段由人類作曲家創作的動機旋律經過天譜樂AI的擴展和編排,最終變成了一首完整的音樂作品。這一功能不僅展示了AI音樂技術的強大潛力,也再次強調了技術服務于人的理念。