:::

台北流行音樂中心 影音專區 文章專區 音樂興發現|AI時代的聲音地圖:盲點與啟示

音樂
2025.11.14 (五)

音樂興發現|AI時代的聲音地圖:盲點與啟示

字級:
作者:袁永興
AI時代的聲音地圖:盲點與啟示

        一篇名為〈Missing Melodies:AI音樂生成與被遺漏的世界旋律〉研究,作者檢視了超過百萬小時的AI訓練音樂資料,發現當今的AI作曲系統大多數只學會「同溫層內的聲音」:歐美流行、搖滾、爵士與古典。而那些「圈外的旋律」像是非洲鼓點、印度Raga、阿拉伯Maqam、南美民謠……在演算法的世界裡幾乎沒有位置。研究統計,超過86%的訓練音樂來自歐美資料庫,真正屬於圈外的地方音樂不到15%。這代表AI創作的「靈感世界」其實極度單一。當模型被反覆灌輸同一套和聲邏輯與節奏結構,整個音樂宇宙就會變成一個迴音室:旋律豐富卻都長得相似。

        2025年一篇延續擴展Missing Melodies的論文〈Music for All: Representational Bias and Cross-Cultural Adaptability of Music Generation Models(音樂為眾:探討音樂生成模型的代表性偏差與文化跨越能力)〉,由部分相同作者專門針對當前主流音樂生成模型在跨文化、非西方音樂風格上的適應性進行實證檢驗,他們指出在現有被採用的音樂訓練資料中,只有5.7 %來自「非西方」音樂風格、進一步做了parameter-efficient fine-tuning(參數高校微調,簡稱 PEFT)的實驗:以兩種低資源、非西方音樂傳統(印度的 Hindustani 古典音樂,以及中東的 Makam 音樂)對現有模型進行微調,看看模型是否能提升在這些風格上的生成表現。結果顯示,雖然有些改善(在某些範式下提升約4–8 %),但效果有限、且在西方風格上的性能有時會有所下降。這顯示偏差不僅是資料量問題,也涉及模型架構、表徵空間、風格遷移的難度等。該研究有助於補證Missing Melodies的主張:即使在「有心納入不同地域音樂」的情境下,模型仍可能難以適應地域文化差異,除非在架構與訓練策略上有針對性設計。

        如果把這個問題放回台灣,它其實並不遙遠。台灣的流行音樂雖然在華語圈舉足輕重,但在AI音樂的資料體系裡,幾乎被排除在圈外。目前市面上主流的AI音樂平台,從Suno、Udio、Tunee到Google的MusicLM,在訓練資料中幾乎沒有台語、客語或原住民族音樂。因此,即使你輸入「Hakka pop」或「Taiwanese indie rock」,AI生成的旋律多半是用歐美流行的骨架,套上亞洲語言的皮。它能模仿語音節奏,卻無法理解那是文化語感;即使能臨摹寫出台灣風的旋律線條,卻不懂台灣的音階與故事。這正是AI時代最細微也最殘酷的文化現實:我們的聲音可能不是被拒絕,而是被誤讀。

        AI如何定義「音樂標準」?AI音樂生成的世界,有著一套看不見的「圈內規則」。它決定哪些音階是「正確的」、哪些節奏是「可接受的」,哪些旋律被歸為「世界音樂」,哪些則被放進「資料異常」。這些規則不是由誰制定,而是由資料分布與平台習慣自然塑造出來的。演算法學習的越多,它越相信主流的樣本才是世界的全貌。於是,當AI根據統計機率在創作時,那些不被主流認識的音樂文化就會被自動過濾掉,不是技術偏差,而是一種文化靜音。在這樣的系統裡,越靠近中心的語言與市場越有被學習的機會;越在邊緣的聲音,越難被留下痕跡。對台灣而言,我們既非演算圈內的全球音樂主流,也非資源豐沛的「數據強國」,我們正好被卡在AI音樂世界的灰色地帶。

        圈外的創作成了AI誤解的「在地音樂」。越來越多台灣音樂人開始嘗試AI作曲。有人用它寫旋律、生成編曲樣本或音樂伴奏,也有人用AI做專輯封面或模擬歌聲。但當創作者希望AI生成台灣感時,好比輸入「台語搖滾」、給的是首美國搖滾音樂風格加台語拼音,AI並非惡意,它只是因為資料缺稀,無法模仿,只好回到統計演算上最熟悉的語法,這使得AI創作出來的音樂,看似多樣,實則更加單一。這種「偽多樣性」在全球串流平台上尤其明顯。當Spotify、Apple Music、YouTube的演算法再以這些生成作品作為推薦依據,圈外的音樂就被進一步壓縮。在數位的世界裡,沉默久了會被認定為不存在。

        但危機也是契機。當AI的偏見揭示出「誰掌握資料,誰就定義聲音」時,我們應該思考:要讓AI學會台灣的聲音,不能只讓它「生成」,而要讓它「學習」。首先建立本地音樂資料庫,以合法授權的方式蒐集並開放台語、客語、原民語等多語音樂資料,形成Taiwan Music Dataset,成為AI學習在地聲音的基石,對應「多語文化開放音樂資料庫」的理想,構築在地資料藍圖。其次與亞洲及國際研究單位合作,訓練能理解亞洲音階與節奏邏輯的模型。這不只是技術協作,更是一場以資料為語言的文化外交,讓AI知道音樂的世界不止西方。再者,重塑AI教育:從校園到創作者工作坊,都應教導如何「教AI學文化」,讓學生與音樂人學會設計資料,而非僅是使用工具。最後,建立文化演算法倫理:要求AI平台公開訓練資料來源,確保不侵權、並建立資料回饋機制,讓原創者受益。這也呼應目前歐盟AI法(EU AI Act)與IFPI、RIAA對生成音樂平台透明化的要求。研究顯示,未來AI音樂模型將走向多中心學習(multi-centric learning),每個文化都能成為AI的聲音節點。若台灣能及早布局,我們不僅守護傳統,更在為未來的AI音樂文明設計新的語法。當AI能真正聽懂客語的節奏、捕捉原民的多聲部和聲、理解台北地下樂團的音色哲學時,它將不再只是模仿的機器,而是文化的共創者,讓台灣的聲音,在未來的資料宇宙中,被理解、被記錄、被延續。被圈外的聲音,也能成為新的中心。

        在AI的世界裡,「圈內」與「圈外」不只是技術的分界,更像是文化權力的鏡子。誰被忽略、誰該發聲,台灣音樂即使站在邊緣卻依然能看得更清楚。未來的AI音樂若要真正多元,就必須重新定義誰能進入這個圈。而台灣也許正有機會用自己的方式,畫出一個新的圓。


立刻加入北流Line@        訂閱北流電子報

其他文章

返回列表