Tagged: AI生成

AI生成イラストがおもしろい

ま、面白いからといって、これで何かやろうとか考えていないのだが。

ローカル環境で数秒

当Blogでも以前にAI生成イラストをローカル環境で実施する事に挑戦した記事を書いたが、その時はプログラムが完走せずに試す事ができなかった。

だが、その後の調査で「Git」と呼ばれるStable Diffusionをクローン化するプログラムが足りない事が判明したので、そちらをネットで探してインストールしたところ、無事「Stable Diffusion UI」が完走、ローカル環境でプログラムが稼働する事を確認した。
実行さえできれば何とかなりそうな感じなのだが…「Stable Diffusion UI」は使用するモデルデータが必要になるのだが、これをネットでいろいろと配布しているサイトから集め、複数のモデルを準備したのだが、今回、改めてAnythingというモデルをインストールしてみた。
というのは、Anythingのバージョンが3から5へとアップデートされていたからだ。
Anythingは、そのバージョンによって初出が異なるという話があり、著作権の問題でいろいろ理解しておかねばならないところがあるのだが、どうも3系と5系は初出が同じという事のようなので、今回改めてAnything-v5.0を入れてみる事にした。
拡張子が最近主流の「.safetensors」となっているモデルデータだが、基本モデルデータを保存する場所は同じである。
で試しに出力してみたのだが…何か1枚あたりの画像生成時間がとんでもなく速いんだけど…。
時間にして2秒程度。
画像の大きさは512×512なので、そう大きいものではないし、プロンプトも比較的短めのものではあるのだが、それでも1枚2~3秒で出力できるというのは、ちょっと驚きだった。

なぜ速いのか?

いろいろ調べて見たら、この速さの秘密はモデルデータの拡張子が「.safetensors」に変わった、新しいタイプのものだかららしい。
もともとPythonのプログラムを実行する上でのセキュリティを考えた先に「.safetensors」というフォーマットに変わったらしいのだが、その処理速度も以前のものから比べて格段に速くなっているらしい。
「anything-v3.0」系のモデルも、現在は「.safetensors」のモデルデータに変わっているので、こちらに切替えた方がいいだろう。
私はAI生成イラストを行うには完全に後発の部類にはいるので、既に確立された手順の元で今まで蓄積されてきた恩恵をそのまま受ける形でAIイラストを生成する事になるが、後発の強みはこうした進化した形でそのシステムを導入できる事にある。
ま、それだけに仕組みや記述方式を今から入念に理解していく必要はあるし、今までの経緯を知らない事で、ちょっとした設定を知らないなんて事も多々ある。
早い時期に始めた方が良いのか、それとも後発組が良いのかは、その都度変わる話かもしれないが、私としては先人の知恵を拝借しながら、まずはその足跡を辿っていって見たいと思っている。

Continue reading…

AIを活用していく時代

ChatGPTの話題が出てからと言うもの、何かとAIが取り沙汰されている。

AIを使えないと

ChatGPTの登場によってなくなる仕事がある…という話をよく聞く。
確かにそのとおりで、テンプレ的な文書案作成などは、もうAIに任せてしまっても良い時代になり、そこに割く時間が大幅に短縮され、それにまつわる業務はとにかくChatGPTさえ使えればどんどんと省略、簡略されていく業務になりつつある。
だが、ここで根本的な問題が一つ出てくる。
それは、まずChatGPTをどのように使えば良いのか? という事をちゃんと理解しているかどうかで大きく変わるという事だ。
今、私はココで「ChatGPT」と記載しているが、これは即ち「AI」と置き換えるべきだろう。
ChatGPTは大規模言語モデルの一種であくまでも自然言語で扱えるテキスト生成AIでしかない。同じように大規模言語モデルを利用した画像生成AIなどもあるので、そうした幾多あるAIを活用していく、という事に注視しないと行けない時代になったと言える。
なので、こうしたAIをどのように扱うのかで、アウトプットされるものが大きく変わってくる。
つまり、AIを上手く使いこなす人が必要であり、使いこなさなければ業務を肩代わりさせる事ができない。
これからの時代は、そのAIを上手く扱える者が必要な時代になる、という事だと私は認識している。

新しいビジネス

AI画像を生成するという事で、いろいろと問題になっているのが、その著作権の在り方である。
これは、AI生成画像の著作物を販売する人が出てきた事でより深刻化した問題と言えるが、AIが学習に利用する元の画像には当然著作権が存在し、その著作物を取り込んだが故に、生成されたAI画像の出来映えで元となる著作に影響を与える事が多々ある為、問題になると考えられる。
この法的な問題は国によっても解釈が異なるので、完全な解決に至るにはまだまだ時間がかかる事になるが、実際の元画像を制作した人の言い分にも、またAIで画像を生成した人の言い分にも、一定の理解できる部分は存在する。なので、これは技術の発展とともに今後折り合いを付けていく必要のある問題になると私は思っているのだが、難航する事は簡単に予想できる。
私は元の画像を描ける人ではないので、あくまでも生成する側として話をすると、画像生成AIを思い通りに使いこなし、狙った画像を生成させるという事は想像以上に難しいという事である。
AIに思った通りの事をさせるという事がこれほどまでに難しいのかと思える程、難しい。この命令をプロンプトというが、プロンプトは構文となっていて、ポジティブプロンプトとネガティブプロンプトという、反映させるべきプロンプトと反映させないプロンプトを組み合わせて、狙った画像を生成させる(サービスによって異なるが)。
その文字数たるや思った以上に長文だったりもするので、なかなか思い通りにいかないのである。
で、そうなるとプロンプトのマーケットというビジネスが登場する。

現在は画像生成AIに特化したような取扱いで、それも複数のサービスのプロンプトを取り扱っている状況。予想できたビジネスではある。だが、プロンプトなら別に画像に特化しなくても、他でも活用方法はいくらでもある。
文書作成、3Dデータ、場合によってはプログラムなんかも、生成させるだけのプロンプトは需要があると考えられる。
ChatGPTが有名になった事で、新たなビジネスが生まれたわけだが、これも需要があるからである。

Continue reading…

Desktop Version | Switch To Mobile Version