你知道初音未來是如何誕生的嗎?

【你知道初音未來是如何誕生的嗎?】“今年6月, 初音未來要來上海開演唱會啦!”這消息如同一枚深水炸彈, 引爆了無數粉絲的熱情, 盡管幾百元到一千多元的票價并不便宜, 但身邊的好多朋友都已經開啟“買買買”模式了 。 其實, 明星來魔都開唱沒什么好稀奇的, 畢竟連著名的雨神都已經來過好幾回了, 稀奇的是這位明星她不是真人, 而是一位虛擬偶像歌手——她的一切, 從形象、歌聲到舞蹈, 全部是通過計算機技術制作出來的, 簡直妥妥的黑科技 。 人們先創造了她動聽的聲音, 然后賦予了她可愛的形象, 現在又打破次元的壁壘, 將她活靈活現地帶到了舞臺上, 帶到了觀眾面前 。 如此神奇的一切究竟是怎樣發生的呢?讓我們從頭講起 。
動聽的聲音——歌聲合成之路
唱歌是歌手的本職工作, 即便你是虛擬的, 不會唱歌也干不了這一行 。 一首歌, 簡單來說就是由“音樂”和“人聲”兩部分組合而成的, 其中“音樂”是由樂器演奏出來的, 而“人聲”自然是由人唱出來的 。 不過, 初音未來不是真人, 她的聲音是人工合成出來的 。 那么, 聲音又是如何被創造出來的呢?
無論什么聲音, 它們都具備相同的本質——機械波 。 既然所有的聲音都是波, 那為什么聽起來完全不一樣呢?從物理學上看, 所有的聲波都是由多個簡諧振動的波疊加而成的, 而每個簡諧振動都只包含三個物理量:頻率、振幅和相位 。 換句話說, 無數個頻率、振幅和相位不同的簡諧波疊加起來, 就形成了我們所聽到的各種各樣的聲音 。
于是, 有些物理學得特別好的音樂家就開始動心思了, 既然聲音都是由這樣一些基本元素所組成的, 那么我能不能利用這一原理人工合成出聲音呢?這個主意聽起來很不錯, 因為早在19世紀, 人類就已經發明了電子揚聲器, 可以將波動的電信號轉化成機械振動來發出聲音, 而操縱電信號的頻率、振幅和相位非常容易, 于是, 能夠人工合成聲音的“電子合成器”也就應運而生了 。 早期的電子合成器, 是采用幾個電子振蕩器來產生變化的電流, 然后通過調制器對電信號波動的頻率、振幅和相位進行動態控制, 最后再將這些波疊加起來, 通過揚聲器變成聲音 。
這種從聲音本質入手的思路固然不錯, 不過人類的力量畢竟有限, 要知道, 我們所聽到的真實世界的聲音都是由非常多的簡諧波以非常復雜的形式疊加而成的, 而電子合成器只有寥寥幾個振蕩器, 所能夠產生的聲音實在是太簡單了, 聽起來完全不像任何一種真實的樂器, 更加不可能合成人聲了 。 于是, 音樂家們有了更高的追求, 他們夢想著有一天能夠人工合成出各種真實的聲音 。
既然聲音的本源對我們來說還是過于復雜了, 那不妨換一個思路試試 。 所有的聲音無論如何發出的, 最終都要進入耳朵被大腦所解析, 那么我們可以從人的聽感入手, 看看聲音是如何構成的 。 對于音樂和歌聲, 我們能感知到的大體上有三個要素:音高、響度和音色 。 音高, 就是這個音是Do、Re還是Mi;響度, 當然是這個聲音聽上去有多響;至于音色, 我們只能說它是一個集合概念, 代表一種聲音的基本特性, 比如說這聲音是鋼琴、小提琴, 或是鄧紫棋、古巨基 。 在這三個要素中, 音高和頻率相關, 響度和振幅相關, 這兩者都很容易控制, 就剩下最復雜的“音色”, 它包含的要素太多了, 怎么辦呢?
這時, 有人想到, 我們可以把真實樂器的聲音, 比如用鋼琴彈一個Do, 錄下來, 作為一個樣本存起來, 然后當我要發出Mi的聲音時, 把剛才的樣本拿出來, 用處理器給它升個調, 再放出來不就行了嗎?我們在卡拉OK里面唱不上去的時候可以把伴奏降幾個調, 就是這么玩的對吧!這種方法就是“采樣合成”, 只要有高質量、大規模的采樣、優秀的采樣合成算法和數字處理器, 音樂家就可以完全使用電子合成器來制作音樂, 效果相當棒 。 如今, 隨著計算機處理能力的提高, 個人電腦已經完全可以勝任聲音合成的工作, 因此電子合成器也由專用硬件逐步變成了軟件, 甚至iPhone上的一個App就可以媲美專業合成器的效果, 還真的有一些音樂家用幾臺iPhone和iPad組成樂隊來表演呢 。

猜你喜歡