(function() {function signalGooglefcPresent() {if (!window.frames['googlefcPresent']) {if (document.body) {const iframe = document.createElement('iframe'); iframe.style = 'width: 0; height: 0; border: none; z-index: -1000; left: -1000px; top: -1000px;'; iframe.style.display = 'none'; iframe.name = 'googlefcPresent'; document.body.appendChild(iframe);} else {setTimeout(signalGooglefcPresent, 0);}}}signalGooglefcPresent();})();

VTuberとVT-4

VT-4だけでは難しい?

リアルタイムならハード

先日、ボコーダーとしてVT-4なる機器を記事に取り上げたが、正式にVT-4はボコーダーというわけではない。
どちらかというと、ボイスチェンジャーというのがVT-4の立ち位置で、その中の機能としてボコーダーがある、といった方がより性格なので、訂正の意味を込めて再度取り上げてみたい。
ボイスチェンジャーの機能をPC上で実現しようとすると、どうしても遅延する。
有名なソフトに「恋声」というソフトがあるが、これはもう確実に遅延していて、使ってみればわかるが普通に使うだけで0.4秒以上の遅延が発生する。
なので、実際に配信で使用するとなると、この遅延が原因で何をしゃべっているのかがわからなくなったりする。
なのでボイスチェンジャーは出来る限り即時変更可能なものがよいのだが、PCでボイスチェンジャーを実現しようとすれば、そこには確実に処理による遅延が発生する。
そこでプロはハードウェアであるVT-4を使用するわけである。
もともとVT-4は声を加工して再生する単機能機器とも言えるものなので、普通にPCとVT-4を繋いで使用すればそれだけでホイスチェンジャーとしては十分機能する。
だが、こうしたボイスチェンジ系ツールを使えばわかるが、結局はフォルマントとピッチによって声を変質させているにすぎない。ただ、その変質させる速度がハードウェアだと速いという事である。
だが、この速度が重要となればVT-4の意味は大きい。

性別変換ボイス

こうしたボイスチェンジャーには、男性ボイスを女性ボイスに、女性ボイスを男性ボイスに、という所にある種行き着く先がある。
マシンボイスにしたりするのは、そんなに難しい話ではないので、そういうのはもうVT-4を導入すればそれだけですぐに達成できるし、難易度などないに等しい。
が、性別を変更するボイスを得るというのは、実に難しい。
女性ボイスを男性ボイスにするのは、まだ比較的簡単だが、男性ボイスを女性ボイスにするのは結構問題が多く、世の中、これをやりたいが故にボイスチェンジ関係のソフトやハードを導入する人は多い。
だが、前述したようにボイスチェンジャーは基本的にピッチとフォルマントによって変質させるのが基本で、それ以上でもなく、それ以下でもないのである。他にもバランスやリバーブといった機能もボイスチェンジャーは備えているが、それらは性別を超えた声を作る上ではあまり重要ではない。
なので、何とかこのピッチとフォルマントの調整で声を変質させるしかないのだが、この問題を一番重要なものとして捉えなければならないのがVtuberと呼ばれる存在である。
…まぁ、中にはそんなのカンケーねぇ!ってな人もいるのかもしれないが。

バ美肉おじさん

この言葉、私は知らなかったんだが、VTuber関係では結構知れた呼び名らしい。簡単にいうと、中の人がおじさんの美少女VTuberの中の人の事を「バ美肉おじさん」と言うらしい。
この言葉の正式な呼び名は「バーチャル美少女受肉おじさん」で、要するにおじさんが美少女イラストのモデル(もしくは2Dデザイン)のVTuberに扮する事を意味するらしい。
当然、その際に問題となるのがボイスで、見た目はバーチャルでどうにでもなるが、声だけはなかなかそうはいかなくて、その解決の為にボイスチェンジャーを活用する。
だが、前述したようにピッチとフォルマントだけでは確実に性別を変えるような声にはなりにくく、いろいろな手法を取り入れて「バ美肉おじさん」は女性の声を手に入れるらしい。
そのいろいろな手法というものの中に、ハードウェアとソフトウェアの合わせ技を使うというものがあり、それによってより緻密に調整を行って性別変換するらしい。
ただ、その時に問題となるのが遅延という問題である。
ポイントは、ソフトウェアではその処理から0.4秒くらいの遅延が発生するというところで、0.4秒という時間が配信者に発声の混乱をもたらしているので、これをもっと遅くしてやれば配信者は自分の声と変質した声を完全に聞き分ける事が可能となり、結果として混乱しないという解決策が生まれたらしい。
その名も「マグロナシステム」というらしいが、具体的には、遅延時間を4秒ほど取るとリバーブなどのエフェクトがかかった時のような状態になるため、配信者の頭が混乱しないようである。ただ、見せかけで遅延をなくしているだけなので「歌ってみた」などの利用はできない。
いやはや、そこに行き着くまで試行錯誤するというところの執念には頭が下がる思いである。

結局必要

前述の「マグロナシステム」であっても、結局はVT-4は必要になる。
理由はハードとソフトの合わせ技だからで、より精度を上げるためには双方のピッチとフォルマントの調整をするしかないからである。
故にVTuberがこぞってVT-4を購入しようとしたのが昨年10月ごろの話。
その前からこの動きはあったのだが、前モデルのVT-3はその時には既に生産中止モデルになっていて、中古市場でも価格が高騰していた事もあり、導入できなかった人も多かったようだ。
VT-4が発売された直後も品薄状態が続き、しばらくはAmazonでの価格も高値だったようで、実の所今現在もその高値は継続している。Amazon経由ではない、ネットショッピング等でVT-4を探せば、比較的安い価格を見つける事ができるので、今購入するならそう言った所から購入する方が妥当だと思う。
配信をする場合で、こうした音声に拘りたい人であれば、VT-4は一つ持っておいて損はしないアイテムかもしれない。
別に「バ美肉おじさん」になれ、という事でなく、いろんな効果を生み出せるという意味で便利であり、ポン出しで効果音を鳴らすのと同様に使える技、といったところである。
また、自分が配信しているという事を隠匿したい人にも声バレしないという意味で良いかもしれない。

しかし、これで私としてもVT-4は一つ欲しいかな、と思う機材になってしまった。
またしても散財する事になるのか?(-_-;)

この記事が気に入ったら
いいね!しよう

Share
アバター画像

武上

18歳の時、人生の最大の選択ミスをしてしまい、いきついた場所として山梨県人となる。 その後、建設業に身を投じ、資格をいくつか取得するものの、結局自分の性格と合わない事を理由に上京。 上京後、世間で話題になりつつあったアニメ・ゲームを主体とする業界の人間となり、デジタルコンテンツ業界を含む数々の著名人と同じ土俵でマルチメディアな仕事をするに至る。 一見華やかなメディアの世界の、その闇の深さたるやハンパない事こそ世間に何となく知られてはいるが、業界人しか知らないその氷山の全体像を十分すぎるほど目の当たりにした後、家庭の事情で再び甲州へと帰還。 しかし、この帰還も人生の選択ミスだったかもしれないなぁ…と今では思うものの、時既に遅し。 今は地元の製造業を営む会社の総務・品質保証という地味ではあるものの堅実な職につき、いつか再びやってくるだろう夢の実現を信じて隠者的生活を送っている…ハズだったのだが、またしても周囲の事情で運命は波乱の様相を見せ始めた。 私の人生は一体どの方向を向いているというのだろうか? ちなみに筆者はPCとの付き合いはかなり長いと思っている。 古くはPC-8801 mk2 SR、X1 Turbo、X68000、FM-Towns、PC-9801シリーズ(互換機含む)、PowerMAC 9500等をリアルタイムで使い、その後は、Windows PCの自作機を中心に現在に続いている。 デジタルガジェットに関しては興味もある事から、その時代の時々において、いろいろ使ったり調べたりして、専門家ほどではないが知識は蓄えてきたと思っている。 そうした経験を元に、今の時代へ情報発信させてもらっている。少々くどい言い回しが多いかも知れないが、お付き合いいただけるとありがたい。 連絡先:takegami@angel-halo.com (@を小文字にしてください)

You may also like...

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


コメントは承認待ちです。表示されるまでしばらく時間がかかるかもしれません。

Desktop Version | Switch To Mobile Version