VocaListener(ぼかりす)で声帯とっかえひっかえ

VOCALOID“神調教”技術「ぼかりす」実用化へ、ヤマハと産総研が連携 - ITmedia NEWS
 この技術を目にした時、「調教」(あまり好きな言葉ではないけど)する側にとって、「DTMの楽しさをスポイルされる」という反発感があったり、「初音ミク」という歌い手を好きなリスナーにとって、「ミクらしさが損なわれる」と感じられたりする、というのはわかる気がします。
 ただ、自分は歌い手側なので、利用できそうな可能性があるこの技術に、単純に期待しています。利用というのは、「楽器みたいに喉を買い足して色々交換して歌ってみたい」という私の欲望に対して、です。


 「自分の喉からどうしても離れられない」というのが、歌のいいとこでも難しいとこでもありまして。大きく見れば楽器の人も同じだと思うんですけど(どんなに楽器を替えてもその人のプレイが出てしまうという面で)、歌はやはりそこらへんの密着度が若干高すぎるかなーと。
 だから、声帯をとっかえひっかえできたら楽しいじゃない。
 自分が乗っかるのは別にミクでなくても構わない。がくっぽいどの方が性別変わって楽しそう。今後VOCALOIDのバリエーションが増えるのもだんぜん歓迎。取り替えられる声帯が増えるってことだもんね。
 「よく調教されたミク」と、「ぼかりすで自分が歌わせたミク」とを聴かせて、あなたはどっちがよかった? なーんて対決したって面白いんじゃないかい。そんなわけで、従来の「調教」と敵対する技術ではないと、私は思っています。




 「ぼかりす」自体は、ほぼ1年前の2008/04/30に、↓のブログ記事を発端として話題になった技術ですね。以下、その時に自分がmixiで書いた日記を加筆・再構成して転載します(思うところは今も変わらないので)。
初音ミクみく 出た!科学の限界を超えた新技術「VocaListener」による神調教ミク!


 昼間にはてブとか見た限りでは、「調教の意味がなくなる」「データ取りに肉声の歌が必要なら、そのまま歌わせた方が早いじゃん。本末転倒」という意見も結構多くて、それは一面では正しいんだけど。
 自分は特にそう思わなかったな、単純に興味深いと思った。以下の2つの理由で。

  • 1つは、個々人の歌をパラメータとして自動的に、定量的に抽出できたら面白いなーということ(あくまでVOCALOIDのフォーマットで表現できる範囲で、という注釈つきだけど)。
    • そういう研究は、私が知らないだけで過去にもいっぱいされてるはずだけど、あくまでコンシューマ向け、誰もが使おうと思えば使えるフォーマットで定量化することに意義があると思う。それベースで何か面白いことやる人が出てくるんじゃないかな? と。
    • つまり、「○○っぽさ(歌のジャンル、歌手のキャラクター、人種・言語による発声の違い、etc...)」っていうエッセンスが可視化されて、より気軽に使えるようになるんじゃないのかなーって。
  • もう1つは、これの究極の未来形として、前に私が書いた「声帯だけとっかえて歌いたい」ネタがかなうんじゃないかと思って。自分で歌って、ボイスチェンジャーとかとは違う次元で、「違う声帯の声」に自分の歌を簡単に移植できたら面白いですよね。(私が興味あるのはこっち用途)


 そんな意味で、技術的にはすっごく面白いし興味深いんだけど、私の欲望に対してはまだ道のりは遠いな、という印象。センセーションを巻き起こしてるようなんだけど、正直酔った私の耳には、今までのよく調教された初音ミクとの大きな違いは感じないw
 それがデータ抽出のハードルか、VOCALOID側のハードルなのかはわかんないんだけど…。