合成音声の行き着く先は?

 YAMAHAがVOCALOIDの新しい形としてVOCALOID-flexなる技術を提供開始した。
 もっとも、一般にではなく、まだ法人にのみ提供という形だが、このVOCALOID-flexによって、ついにVOCALOIDは歌だけでなく“しゃべり”まで可能になってしまった。
 VOCALOIDは、人間の声の声質をデジタル化したライブラリから歌声を生成する技術だったが、歌声に限定していた最大の理由は、歌声には一定の法則があり、それに準じた形でフォルマントを割り当てる事で歌声のようにできたからであり、しゃべりとなると一定の法則が全くないばかりか、表現方法もかなり自由であり、なかなか制御するのが難しかった為である。
 しかし、VOCALOID-flexではそうした難しい部分ですらコントロールする事を可能にした。
 音韻(音素などの音の構成や長さ)や韻律(音の高さ、強さ)の編集を可能にし、これまでできなかった母音の無声化や脱落化が表現可能となった事にプラスして子音の長さや音の高さ・強さも細かく編集できるようにした。
 この結果、話し声における細かいニュアンスや、方言のアクセント・イントネーションもつけられるようになったようである。

 概念を図式化するとこんな感じ。
 まぁ、簡単に言えば変動要素をしっかりパラメータ化した事でより幅広い表現が可能になった、という事なのだが、そこまでして合成音声にこだわる必要があるのか? という疑問はここでしてはいけない。
 ちなみにこの技術、4月29日発売のPSP用ソフト“METAL GEAR SOLID PEACE WALKER”でキャラクターの音声制作ツールとして使われている。
 実際に聞いてみたい、という人は、まずメタルギアで聞いてみるといいかもしれない。
 しかし、こうなると声の仕事をしている人はますます苦しくなるような気がしないでもない。
 ただ、逆を言えば老齢化している有名声優のフォルマントをデータ化して、VOCALOID-flexで再現するというのはありかもしれない。
 来るべき高齢化社会を救う一技術となるのか、ちょっと興味のあるところである。

この記事が気に入ったら
いいね!しよう

Share
アバター画像

武上

18歳の時、人生の最大の選択ミスをしてしまい、いきついた場所として山梨県人となる。 その後、建設業に身を投じ、資格をいくつか取得するものの、結局自分の性格と合わない事を理由に上京。 上京後、世間で話題になりつつあったアニメ・ゲームを主体とする業界の人間となり、デジタルコンテンツ業界を含む数々の著名人と同じ土俵でマルチメディアな仕事をするに至る。 一見華やかなメディアの世界の、その闇の深さたるやハンパない事こそ世間に何となく知られてはいるが、業界人しか知らないその氷山の全体像を十分すぎるほど目の当たりにした後、家庭の事情で再び甲州へと帰還。 しかし、この帰還も人生の選択ミスだったかもしれないなぁ…と今では思うものの、時既に遅し。 今は地元の製造業を営む会社の総務・品質保証という地味ではあるものの堅実な職につき、いつか再びやってくるだろう夢の実現を信じて隠者的生活を送っている…ハズだったのだが、またしても周囲の事情で運命は波乱の様相を見せ始めた。 私の人生は一体どの方向を向いているというのだろうか? ちなみに筆者はPCとの付き合いはかなり長いと思っている。 古くはPC-8801 mk2 SR、X1 Turbo、X68000、FM-Towns、PC-9801シリーズ(互換機含む)、PowerMAC 9500等をリアルタイムで使い、その後は、Windows PCの自作機を中心に現在に続いている。 デジタルガジェットに関しては興味もある事から、その時代の時々において、いろいろ使ったり調べたりして、専門家ほどではないが知識は蓄えてきたと思っている。 そうした経験を元に、今の時代へ情報発信させてもらっている。少々くどい言い回しが多いかも知れないが、お付き合いいただけるとありがたい。 連絡先:takegami@angel-halo.com (@を小文字にしてください)

You may also like...

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


コメントは承認待ちです。表示されるまでしばらく時間がかかるかもしれません。

Desktop Version | Switch To Mobile Version