専属ボーカリストがやってきた
- 2025/06/25 14:39
- カテゴリー:散財, マニアックなおはなし
中学生の娘がいわゆるボカロ曲にはまっており,その関係でこれまで遠巻きに見ているだけで積極的にかかわらなかった,ボーカロイドを真面目に勉強してみることにしました。
今年の3月頃に始め,ひととおり理解出来たことから,娘が欲しがっていた初音ミク(V4X)のスターターキットを購入し,私自身はいろいろな評価版を使って,最終的に購入するものを選ぶ事にしました。
ところがその後忙しく,まともな評価が出来ないまま評価期間が終了,結局初音ミクとは縁のない生活に戻ったのでした。
しかし,その評価版を使って途中まで作っていた楽曲が気になり,とにもかくにも最後まで完成させてしまおうと思い立ち,同時に購入する歌声合成ソフトを選定することにしました。
最終的に選んだのは,その歌声のあまりの自然さに度肝を抜かれたSynthesizerVでした。
正直な話,製品名があまりに普通過ぎる上にボーカルを連想できないものである上に,あまり耳にしないソフトであること,そして価格が安いこと,代理店がよくわからんところであることで,俎上に登ってはいませんでした。
しかし,実際にデモをきいてみると,これがまあすごいこと。
いわゆるベタ打ちで,もう人と区別出来ないほどの歌声をあっという間に生成します。いわゆるコブシであるとか,ビブラートの深さや時間的変化も自然で,正直ここまで歌える人間もそう多くはないと思いました。(私は無理です)
しかも,高温でケロケロとした不自然な声になることもなく,また低音で音質が激しく劣化することもなく,本当に上手いボーカリストを一人雇った感覚です。しかも,彼女への指示は感覚的なものでよく,専門的,具体的である必要はありません。当然自分で歌ってみる必要もありません。なんだかとっても偉いプロデューサー大先生様になった気分です。
きけば,AIを使って調声を自動で行うらしく,なるほどその歌い方が今どきのものだとわかります。これは1980年代の曲を打ち込んでみるとよく分かり,そのせいで曲全体がぐっとモダンに聞こえるようになります。
価格は3つのデータベース(声のデータ)から1つを選ぶ権利がついて15000円ほど。もう1本選ぶセットで2万円ちょっとで,この魔法のようなソフトが手に入ります。今どきサブスクリプションでないのがまたうれしいじゃないですか。
評価版を使ってその表現力と手軽さに衝撃を受けた私は,モチベーションが下がらないうちに2本選べるパックを購入,早速インストールをして,1曲仕上げることにしました。選んだ歌声データベースは,日本語音声の標準であるMai2です。
とはいえ,最初から欲張るとろくなことがありません。
もともと,初音ミクの評価では,20年ほど前に打ち込んだある曲のMIDIデータをDigitalPerformerに吸い込み,これをほぼ修正せずソフトシンセででっち上げます。
で,これにボーカルをのせるということを行ったのですが,メロディラインだけはボーカル用に打ち込み治す必要があって,リアルタイムで打ち込んだものに修正を重ねて,初音ミクに歌わせたのです。
しかし,PiaproEditorのあまりの作業性の悪さに心が折れてしまい,未完成に終わりました。今回のSynthesizerVでは,この作業を仕切り直すことにしたというわけです。
さて,そのSynthesizerVをさくっと紹介します。もともと中国のある青年が,たった一人で作り上げたと言われる歌声合成ソフトで,大企業の優秀な技術者がよってたかって作ったものとは違います。
事業化にあたって選んだ場所は日本。どういう事情かわかりませんが,どんな理由にせよ歌声合成なら日本だ,と言う心意気がうれしいじゃないですか。
中国生まれのソフトらしく,マイナーバージョンアップなのに「全面書き直し」とか,しれっとすごい機能が追加されたり,MacでいえばAppleSiliconに素早く対応したりと,その機動力の高さにワクワクが止まりません。未だにインテルコードのPiaproは恥を知るべきです。
方向性としては,細かい調声をせずとも自然な歌声になるという全自動ソフトです。手間もかかるし知識も技術も根気も必要な調声を自動化することは,歌声合成の敷居を下げるでしょうし,1分1秒が惜しいプロにとっても,作業時間を短縮することに繋がりますから,とてもありがたいのではないかと思います。
そしてAIによる「今どき」の歌い方を即座に反映してくれます。おそらくですが,このフレーズなら,この音符の動きなら,この歌詞なら,という組み合わせをもつデータベースをもち,これに従った調声を自動的に行ってくれます。だから1980年代の音楽が今どきの歌い方になるんですね。
ほら,ChatGPTでもそうですけど,こういう答えが欲しい時にはこういう聴き方をしなきゃ,というのがあるじゃないですか。プロンプトというのですが,SynthesizerVにおいても同じで,こういう歌い方をして欲しいなと思う時には,その歌い方をしてくれるようにデータを用意するのです。思い通りにならないときは手動で調声するわけですが,そういうことをすると返って不自然になるので,SynthesizerVを使うからには,出来るだけ自動で処理するのが正しい様に思います。
ソフトウェアとしての出来具合もよく,繰り返しますがAppleSiliconにネイティブ対応しているので,ホストとなるDAWもRosetta2の世話になる必要がありません。ちょっとでもCPUパワーが欲しいDAWにおいて,AppleSiliconで動くことは,非常に大きなメリットです。
データベースの容量もそれほど大きい訳ではありませんし,動作もそれほど重くはありません。安定して動いていますし,エディタの動作も軽いです。つまり,ソフトとして良く出来ているという事です。Piaproは(以下略)
さて,このSynthesizerVを動かすDAWは,DigitalPerformer11です。
もともとPerformerはVer4のころから愛用していた古参ユーザーですが,以前ここにも書いたように,私の使用歴はVer6.03で止まっています。その後打ち込みをする時間もなくなり,MIDIシーケンスソフトを使うことは激減,そのうちMacもOSXの時代になるにいたりPerformerも起動しなくなり,長く放置していました。
コロナ禍に入った2020年に,ふとDP10が半額で手に入ることを知って一念発起,晴れてPerformerに復帰したのはいいものの,まるで人工冬眠から目覚めた前世紀の旧人類のゴトク新しい環境に始めず,数回使っただけで挫折,AppleSilicon搭載マシンに乗り換えてからは,すっかり興味を失い,私の心の傷になったのでした。
2022年,DP11にアップグレードすることでめでたくAppleSiliconにも対応したのですが,それでもなかなか時間が取れず,結果として全く使いこなせない状態が続いていました。
なので,今回の目標はSynthesizerVを使ってみることと,DP11を使って1曲仕上げることにしました。MIDIシーケンサー以外の機能について全く無知な私は,つまりDigitalPerformerの超初心者です。自分なりのワークフローを作り,自分のやりたいことがひととおり出来るようになることを,まずは目標にしないといけません。
ある土曜日,朝10時頃から夕方16時頃までかかって,問題だった曲を1つ仕上げることができました。実は細かい修正は翌日の午前中まで散発的に続いたのですが,通しで聴く事の出来る状態になったことはめでたいことです。
やってみて分かった事ですが,SynthesizerVはすごいソフトでした。嫁さんにも聞いてもらったのですが,ぱっと聞いただけではもはや人がやってると言っても通ります。
発音がおかしいところも修正出来ますし,不自然な歌い方をする部分もデータの修正で自然な物になってくれます。私がやって欲しい歌い方よりももっと良い歌い方を提案してくれることもあって,まるで本物のボーカリストと対話しながら音楽を作っているような楽しさです。時間を気にすることもなく,他の関係者を拘束するこに気を遣うこともなく,リテイクに疲れて声が変わってしまうこともなく,もう自分のやりたい放題です。
DP11もかなり自分の道具になってきた気がします。何が出来るかわからない,そんな機能があるのかどうか不明だ,という絶望的な状況から,これをやるにはどうすればいいのか,と言う状況になってきただけでも随分進歩したなと思いますが,ここからが本当に面白い世界ですので,続けて行くことが大切かなと思います。
それにしても,DP10から付属するソフトシンセの出来がよく,とても無料でついてくるものだとは思えません。コンサートグランドピアノなどは表現力も豊かで,ついつい時間を忘れて演奏しています。ストリングスもよくまとまっていて使いやすく,リアルタイムで演奏しても適度にリアルで適度にウソっぽい感じが,ポピュラーにはうってつけです。
アコースティックギターもなかなかいいです。12弦ギターはとても綺麗で,楽器が少ないアンサンブルでは良く馴染みます。残念なのは変に左右に音が飛ぶので,出来ればモノラルでならして,浅いディレイとちょっと深めのリバーブをかけたいなあと思いました。
次のテーマは,もう1本選ぶ事の出来るSynthesizerVの歌声データベースを何にするか決めること,そして英語の歌詞を歌わせること,オケを今持っている機材にあわせて新たにゼロから作る事,ソフトシンセとハードシンセを両方使って作る事,です。
ここまで出来れば,あとはいつでも自分の頭の中に鳴っている音を具現化できます。オリジナルを作るのは,アイデアをスケッチできるようになってからのお楽しみです。