VTuberがもっと身近に?

1枚の画像からVTuberとして使える画像をAIで生成するという猛者が現れた。

恐るべき技術

2月4日、Twitterで妙なツイートを見つけた。
「一枚の画像でVTuberになれるシステム(v2)を作りました」と書かれたツイートが、私のタイムラインに拡散されてきたのである。
https://twitter.com/dragonmeteor/status/1357093243989626880
ツイートからその中身を見てみると、どうもGoogleでソフトウェアエンジニアとして働くプラムック・カンガーンさんが1枚のキャラクター画像から多彩な表情を作り上げることができるシステムを開発したとの事。
普通、VTuberとして2D画像を利用するような場合、動きのパーツをいくつか準備し、一定のルールに従ってパーツを連携させて使用するLive2D(とFaceRig)のようなソフトウェアが必要なわけだが、カンガーンさんが作ったシステムで同じような事がたった一枚の画像で可能になるというのである。
で、リンクされていた動画を見てみると…確かに動いている。
これはある意味スゴイ事ではなかろうか?
これをシェアウェアのような形で出せば、Live2Dを駆逐する事も可能かもしれない。
Live2D用画像を販売しているクリエイターにも大打撃を与えそうな感じである。

日本語サイト
https://pkhungurn.github.io/talking-head-anime-2/index-ja.html
(現在リンク切れ)

AIならではの問題

ただ、一件完璧なシステムのような本システムだが、まだ問題がないわけではない。
いつくかある問題で致命的なのは、GPU負荷がとても大きい事である。
これはパターンを生成する時にGPUの演算を必要とする為であるが、その処理が最適化されていないのだろう。まぁ、まだ実験的な状態なので、これは今後洗練させていけば負荷は下がってくるハズだ。
もう一つの問題は、キャラクターの肌色で人型と認識しているところがあるので、肌色でない画像で試すと、とんでもない結果が待っているという事。つまり、人型でないのもダメ、という事である。
VTuberのモデルになるキャラクターは人型とは限定されないので、人型でないと使えないというのは残念である。深層学習を繰り返す事で人型でないキャラクターでも可能になる日がくると良いが、それは結構大変な課題ではないかと思う。
他にもまだいくつか問題はあるのだろうが、システムとしてはかなり完成度も高く、今後の発展が期待されるのは間違いない。
わざわざパーツを作って動かしているLive2Dの事を考えると、本システムは実に画期的である。

VTuberならば…

て、このシステムを見てキャラクターをカメラ映像とリンクさせて動かす、という事に再び興味を持ち始めた。
ただ、ビジュアルという面で言えば私はLive2DなりFaceRigを使うしかないが、一番の問題はやはり声である。
声を変調させるソフトウェアもいろいろあるが、有名なのは「恋声」である。
一度使ったことがあるが、とにかく遅延が酷くて使いにくかった。
そこで以前、これに対応する為にRolandのVT-4を購入した。
そして実際に使ってみて、その奥深い世界に驚愕した。
欲しいとは思っていたのだVT-4は確かに遅延はなく、リアルタイムで利用する上では確実に使える機材だという事はわかっている。
問題は、ピッチとフォルマントの変更だけで望む声を作るのが難しいのである。
これは実際に試してみないとわからない。
だが、使っているだけでも楽しいのも事実なので、VTuberに興味のある人は、まずVT-4を試してみるというのも良いのではないかと思う、
その上で、ビジュアルとしてカンガーンさんのシステムが一般でも使えるような時代になれば、好きな画像で試してみればよいだろう。
おそらく、気合いさえあればカンガーンさんはそう遠くない内にいろいろな改良をしてくるのではないかと思う。
もしカンガーンさんのシステムが進まないのなら…その時はFaceRigもしくはその後継ソフトでやるのも手である。
少なくとも、VT-4を使った声の変更は新しい何かが見えてくるものだと思う。

で、私はというと…
いろいろ試したい気持ちはあるんだけどね(-_-;)

 

この記事が気に入ったら
いいね!しよう

Share
アバター画像

武上

18歳の時、人生の最大の選択ミスをしてしまい、いきついた場所として山梨県人となる。 その後、建設業に身を投じ、資格をいくつか取得するものの、結局自分の性格と合わない事を理由に上京。 上京後、世間で話題になりつつあったアニメ・ゲームを主体とする業界の人間となり、デジタルコンテンツ業界を含む数々の著名人と同じ土俵でマルチメディアな仕事をするに至る。 一見華やかなメディアの世界の、その闇の深さたるやハンパない事こそ世間に何となく知られてはいるが、業界人しか知らないその氷山の全体像を十分すぎるほど目の当たりにした後、家庭の事情で再び甲州へと帰還。 しかし、この帰還も人生の選択ミスだったかもしれないなぁ…と今では思うものの、時既に遅し。 今は地元の製造業を営む会社の総務・品質保証という地味ではあるものの堅実な職につき、いつか再びやってくるだろう夢の実現を信じて隠者的生活を送っている…ハズだったのだが、またしても周囲の事情で運命は波乱の様相を見せ始めた。 私の人生は一体どの方向を向いているというのだろうか? ちなみに筆者はPCとの付き合いはかなり長いと思っている。 古くはPC-8801 mk2 SR、X1 Turbo、X68000、FM-Towns、PC-9801シリーズ(互換機含む)、PowerMAC 9500等をリアルタイムで使い、その後は、Windows PCの自作機を中心に現在に続いている。 デジタルガジェットに関しては興味もある事から、その時代の時々において、いろいろ使ったり調べたりして、専門家ほどではないが知識は蓄えてきたと思っている。 そうした経験を元に、今の時代へ情報発信させてもらっている。少々くどい言い回しが多いかも知れないが、お付き合いいただけるとありがたい。 連絡先:takegami@angel-halo.com (@を小文字にしてください)

You may also like...

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


コメントは承認待ちです。表示されるまでしばらく時間がかかるかもしれません。

Desktop Version | Switch To Mobile Version