指定歌手和曲風,就生成新歌唱給你聽!「AI點唱機」是如何辦到的?

我們想讓你知道的是
儘管Jukebox生成的歌曲已經可以聽出一定的連貫性、產生和諧的和弦,甚至表現出不錯的間奏,但大部分的作品仍然達不到一首「完整」作品的水準,但仍是AI創作系統中的重要一步。
編譯:江彥成、黃思齊
只要指定歌手、歌詞和曲風,Open AI的深度神經網路模型Jukebox就可以唱給你聽!雖然它的作品還遠不及真人創作的質感,但Jukebox已經能生成與一般歌曲長度相近(約1~4分鐘)且風格一致的旋律。想聽Bruno Mars從藍調改唱搖滾?可以先用這個工具過個癮!
音樂生成的難題
AI作曲並不稀奇,例如Open AI在2019年發佈的MuseNet就已經可以用10種不同樂器生成古典、爵士、甚至混成Bon Jovi的曲風,然而這類模型無論是輸入與產出都是所謂的「符號音樂」(symbolic music)──記錄了音高、時間點、(敲擊按鍵的)力度(velocity)與演奏的樂器,但不能處理人聲、音色等細微的表達差異;並且隨著樂曲時間拉長,難以顧及完整的音樂架構,例如前奏到副歌的一致性。
為了克服上述的限制,Jukebox的訓練資料與生成的樂曲都是原聲音檔。研究人員先由網路上蒐羅了120萬首歌曲(其中60萬是英語)。不單單是音訊,還包含了歌詞、作者、演唱者、曲風、年代等資訊,並參考這些歌曲在播放清單上的關鍵字或是與歌曲一併出現的情緒等。
取樣與生成
另一方面,正如前面所說,比起生成資料量小、音訊簡單的MuseNet,Jukebox要生成一首一般CD音質的歌曲(4分鐘,16位元,44kHz ),需要超過一千萬時步(timestep)來處理。相較之下,文本生成器GPT-2僅需1,000時步(按:Time Step,函數需要運行的頻率);電玩Dot2中,打敗人類玩家的OpenAI Five僅需數萬時步。在這樣龐大的資料流中,模型需要能夠處理跨度很大的相關性,才能學習到歌曲的高階語意(high-level semantics),如主旋律、歌曲力度、強弱張力、曲式編排等。
針對這一點,OpenAI團隊採用分層編碼,將44kHz的原始音訊(訓練資料)分別壓縮為不同壓縮幅度的三個音軌(8x、32x及128x)。最高階音軌(壓縮率最大)掌握了歌曲的大範圍結構,負責捕捉樂曲的高級語意,但同時利用較低階的音軌保留了那些被忽略的細節。

當在生成新樂曲時,負責最高階音軌的轉化器由於能夠預測樂曲的曲風、演唱者等資訊,因此歌曲的宏觀特徵會先被定下來,而後由較低音軌的轉化器逐一補強微觀細節。

也因為如此,JukeBox的研發途中還有個有趣的小插曲。研究人員為了使高階音頻的轉化器能夠預測生成樂曲的曲風,當初採用無監督學習的方式加以訓練。模型很快就能自動將流派相近的歌手歸為一類,將120萬首歌分為11類(分別是BLUES、Country、Classical、JAZZ、HIP HOP、R&B、POP、REGAGE、ROCK、Soundtrack與SOUL)。將其視覺化畫成一張地圖,研究團隊很驚訝地發現:Jennifer Lopez比起同屬pop曲風的Maroon 5,音樂特徵更接近鄉村歌手Dolly Parton!

AI風行後,將迎來一場著作權災難?
儘管Jukebox生成的歌曲已經可以聽出一定的連貫性、產生和諧的和弦,甚至表現出不錯的間奏,但大部分的作品仍然達不到一首「完整」作品的水準。Jukebox還無法重現出副歌反覆段落的形式,也無法形成有邏輯的首尾結構。生成的樂曲聽起來像是喝醉酒後的即興創作,音樂結構鬆散且原創力不足,並且仍存在許多流行音樂的影子,與人類作曲家相比還遠遠不及。
其次,Jukebox的訓練十分複雜,生成一分鐘的歌曲大約需要9個小時,難以商轉成為手機APP這類應用工具。
最後,由於Jukebox的學習源於網路上的歌曲,歌聲也是以現有的歌手素材重新合成的,這使得Jukebox的作品每一步都踩在著作權的紅線上。除了成品容易與原曲有重複的小節,也難以取得聲音主人的授權(Jay-Z就對YouTube提出了下架合成音的版權要求);若AI作曲想要發展商業用途,最終可能會演變成一場著作權災難。
即使如此,相較於之前的音樂生成模型,Jukebox還是創造了亮眼的技術成果,可以自動生成不限曲風、高度擬真的人類歌聲,讓這項技術有潛力成為未來人類音樂家的重要工具。
參考資料
- “Jukebox“, OpenAI, 2020.
- B. Stephen, “OpenAI introduces Jukebox, a new AI model that generates genre-specific music“, The Verge, 2020.
- “MuseNet“, OpenAI, 2019.
延伸閱讀
本文由臺大科學教育發展中心授權刊登,原文發表於此
責任編輯:丁肇九
核稿編輯:翁世航
Tags:
簡單卻不簡單的美味,全靠製作的用心!晨光土司「糯米湯種工法」打造細緻柔軟的超質感土司,讓早餐開啟焙感朝氣的一天

我們想讓你知道的是
晨光土司使用特有「糯米湯種工法」,質地柔軟細緻、口感濕潤香甜,讓人每天都朝氣滿滿。究竟糯米湯種工法有什麼神奇之處呢?現在就來一探究竟。
每天早餐吃的土司看似簡單,卻是最能展現技術的烘焙品之一。以充滿質感的口感與香氣而深受好評的晨光土司,就是土司界中講究製作技術的代表作。
晨光土司使用特有「糯米湯種工法」,質地柔軟細緻、口感濕潤香甜,讓人每天都朝氣滿滿。究竟糯米湯種工法有什麼神奇之處呢?現在就來一探究竟。

晨光土司簡單的美味,來自講究用心的工法
晨光土司特有的「糯米湯種工法」,特別之處在製作湯種時額外添加糯米粉,當95°C高溫熱水沖入麵粉與糯米粉時,糯米粉裡的澱粉會瞬間糊化,將水分緊緊抓在澱粉分子裡,讓土司體富含水分,口感柔軟濕潤。
湯種與麵糰混合均勻後,再以0~7℃低溫熟成12小時,這段時間澱粉酶會把澱粉分解成麥芽糖,讓晨光土司吃起來香甜。

晨光土司不只講究在糯米湯種工法,更特別使用三段壓延工法處理麵團,讓土司質地更細緻綿密。烘烤則引進熱穿透能力絕佳的日本石板烤爐,烤出皮薄均勻的細緻質地;烤完接續進行分段式冷卻,讓土司維持絕佳的濕潤與柔軟度。

每一步用心的製作步驟,讓晨光土司擁有簡單卻不簡單的美味,也讓吃到晨光土司的人,能夠一早就朝氣滿滿。
多樣的晨光土司,讓每個人都能找到屬於自己的早晨食光
經典款的「晨光嚴選土司」,擁有簡單的美味,直接單吃土司,每一口都能品嚐到細緻濕潤的質地,加上小麥甘甜香味,不知不覺就能吃完一整片。想要以豐盛感為一天充滿朝氣?那就用晨光嚴選土司製作三明治,只要簡單加上幾片美生菜、起司,就能享受到食材的真滋味與土司融合的層次感。

晨光土司的三款調味土司,則讓每天的早晨精彩有變化。「晨光葡萄土司」加入粒粒飽滿多汁的日曬葡萄乾,為細緻柔軟的土司帶入水果香甜的口感層次,是吃過肯定會驚艷的美味。

有濃郁奶油香味的「晨光奶油土司」,使用特選奶油調和關鍵煉乳配方,還沒咬下就能聞到令人心動的奶油香,咀嚼時奶油香氣讓細緻香柔的土司體達到美味平衡,也非常適合搭配咖啡一起享用。

添加精選蜜漬香脆核桃、酸甜莓果的「晨光莓果核桃土司」,不只有堅果酥脆與莓果酸香,額外添加精心調配草莓泥於土司體中,讓核桃與莓果的風味更加融合每天早上來一片,開啟焙感朝氣的一天。

特有糯米湯種工法、多種講究製作技術,讓每一口晨光土司都是恰到好處的濕潤柔軟,令人回味再三。現在,就讓晨光土司成為每天必備的朝氣來源,創造充滿質感而有朝氣的美好生活。
▲廣編內容圖示僅供參考 產品以實物為主
