(function() {function signalGooglefcPresent() {if (!window.frames['googlefcPresent']) {if (document.body) {const iframe = document.createElement('iframe'); iframe.style = 'width: 0; height: 0; border: none; z-index: -1000; left: -1000px; top: -1000px;'; iframe.style.display = 'none'; iframe.name = 'googlefcPresent'; document.body.appendChild(iframe);} else {setTimeout(signalGooglefcPresent, 0);}}}signalGooglefcPresent();})();

Tagged: AIアート

AI生成イラストがおもしろい

ま、面白いからといって、これで何かやろうとか考えていないのだが。

ローカル環境で数秒

当Blogでも以前にAI生成イラストをローカル環境で実施する事に挑戦した記事を書いたが、その時はプログラムが完走せずに試す事ができなかった。

だが、その後の調査で「Git」と呼ばれるStable Diffusionをクローン化するプログラムが足りない事が判明したので、そちらをネットで探してインストールしたところ、無事「Stable Diffusion UI」が完走、ローカル環境でプログラムが稼働する事を確認した。
実行さえできれば何とかなりそうな感じなのだが…「Stable Diffusion UI」は使用するモデルデータが必要になるのだが、これをネットでいろいろと配布しているサイトから集め、複数のモデルを準備したのだが、今回、改めてAnythingというモデルをインストールしてみた。
というのは、Anythingのバージョンが3から5へとアップデートされていたからだ。
Anythingは、そのバージョンによって初出が異なるという話があり、著作権の問題でいろいろ理解しておかねばならないところがあるのだが、どうも3系と5系は初出が同じという事のようなので、今回改めてAnything-v5.0を入れてみる事にした。
拡張子が最近主流の「.safetensors」となっているモデルデータだが、基本モデルデータを保存する場所は同じである。
で試しに出力してみたのだが…何か1枚あたりの画像生成時間がとんでもなく速いんだけど…。
時間にして2秒程度。
画像の大きさは512×512なので、そう大きいものではないし、プロンプトも比較的短めのものではあるのだが、それでも1枚2~3秒で出力できるというのは、ちょっと驚きだった。

なぜ速いのか?

いろいろ調べて見たら、この速さの秘密はモデルデータの拡張子が「.safetensors」に変わった、新しいタイプのものだかららしい。
もともとPythonのプログラムを実行する上でのセキュリティを考えた先に「.safetensors」というフォーマットに変わったらしいのだが、その処理速度も以前のものから比べて格段に速くなっているらしい。
「anything-v3.0」系のモデルも、現在は「.safetensors」のモデルデータに変わっているので、こちらに切替えた方がいいだろう。
私はAI生成イラストを行うには完全に後発の部類にはいるので、既に確立された手順の元で今まで蓄積されてきた恩恵をそのまま受ける形でAIイラストを生成する事になるが、後発の強みはこうした進化した形でそのシステムを導入できる事にある。
ま、それだけに仕組みや記述方式を今から入念に理解していく必要はあるし、今までの経緯を知らない事で、ちょっとした設定を知らないなんて事も多々ある。
早い時期に始めた方が良いのか、それとも後発組が良いのかは、その都度変わる話かもしれないが、私としては先人の知恵を拝借しながら、まずはその足跡を辿っていって見たいと思っている。

Continue reading…

生成AIイラストの今後

著作権問題は当然の如く存在する事は誰もがわかる事。

政府も検討

政府の知的剤年戦略本部が近くまとめる事となる「」知的財産推進計画2023」の原案が判明したようである。
昨今流行りのAIによる生成物によって生み出される文章や画像に著作権侵害の事例が考えられる事から、AIによる著作物の学習が侵害に当たるケースなど、いろんな論点整理を進めて必要な方策を検討するとされた。
例年であれば、この計画は知的財産全般の保護や活用などについて政府の施策の方向性を示す事になるのだが、今年は独立した項目として生成AIを取り上げて課題などを整理したようである。
この計画から出された課題が明記されたからといって法律として決まったというわけではないが、今後必要な方策を検討して行く中で規制が必要となれば法律も作られていく、という事である。
一番の問題は、生成AIによる文章や画像において、その学習元となる著作物を持つ人達がどう考えるか、という事ではないかと私は思うのだが、事はそれだけに収まらない、という事なのだろう。

学習元データだからといって

ただ、AI生成イラストに関しては、ちょっとした誤解がネット上にあるようである。
学習元となったイラストと酷似したAI生成イラストがあったとして、それが学習元となった画像そのものを改変したものか? というと実はそうでもないという事。
出力した結果として似てくるのは学習元だからある程度はあるのだが、AIは他のデータももちろん参照して画像を出力している。
たとえは学習元となったイラストだけでなく、実写の写真データもその中身に取り込んでイラスト細部の印影や印象などのデータとして出力するし、他のイラストデータも勿論生成する上で参照するデータとして扱っている。
だから学習元となったイラストと酷似していたとしても、そのイラストだけを参照してまねているという事ではない、というのが技術的な方向から見た意見である。
AIの発展とそれを妨げる法規制と著作権のバランスただ、法律はこの技術的なところは見ていない。
AI生成イラストがある著作物とそっくりだったとして、その著作物のオリジナルを利用していた事が証明されれば、そのは著作権侵害の可能性がある、という事であり、印象として似てくれば違反の可能性はあるわけである。
そうなると…AI生成イラストの場合、ほとんどの学習データに現状の著作物のオリジナルが使われている可能性は非常に高く、要素として含まれていないと考える事に無理がある。
ネットで出回ってしまっているのだから、それをAIの学習データとして取り込んでいないなんて可能性はまず皆無だろう。
この判断、諸兄はどう考えるだろうか?
私はこの考え方が絶対的だとするなら、生成AIから生み出されたものは、まずもって利用できない事になるように思えてならない。
あまりに似すぎているものは問題だろうが、印象として似ているものまで規制されるようであれば、利用する事はまず無理である。

Continue reading…

AIの未来と可能性

いろいろ問題があるような話は聞くが…

AIが常識を変える

ChatGPTでAIというものがより一層世間に深い印象を与えている中で、イラストの世界でもAIアートが物議を醸している。
AIが学んだサンプルデータを元に、いろいろな命令(プロンプト)に従ったイラストを生成し、その表現力がとんでもないものなってきている事で、そのサンプルデータに対する著作権がどうなるのか、などいろいろ倫理的な部分で今までに無いフォーマットを巡って論議されている。

いろいろな問題が未整理のままになっている

画像は「ビジネス+IT」より引用(https://www.sbbit.jp/article/cont1/76475)

そういえば…初音ミクの時も似たような問題があったな、と思うのだが、初音ミクの時はまだ声のサンプルが特定の声優(あえて声優というが別に声優である必要は無かった)に限定されていた事で、その生成される声そのものに著作がつけやすかった事が、大きな違いかもしれない。
だが、現在のAIアートでは、いろいろなサンプルデータを取り込んでいる結果、著作をどうするか、という議論はかなり泥沼のような状態になっているようだ。
そもそも、AIが生成するものに著作などあり得るのか? という意見も、真っ向から否定する事はできないし、かといって肯定する事もできない。
まだまだ議論の余地があり、判断は混沌としている。
イラストもそうだが、このAIが生成するものは、今後いろんなものに同じような論争を生んでいく。
実際、声に関してもそうだ。
サンプルとして得た音声データから、その本人と同じ声紋で言葉を紡ぐ事も今では可能になってしまっている。
つまり、音声認識のセキュリティは、もはや役には立たないと言える。
あらゆるものの常識が今、変わろうとしている。

AIアートを試してみる

このような常識が変わっていくであろうAIだが、先日はChatGPTを試してみた。

いろんな質問をしても、結構正確な回答をしてくるAIだと感じたが、実際にAIは回答を知っているのではなく、サンプルとしてデータから回答と思しきものを探り当て、会話という形に擬えて回答しているだけである。
実際、開発元であるOpenAIも、ChatGPTは時によってもっともらしく見えるが誤っている回答を作成する事を認めている。
これはサンプルデータがどれだけ正確かという事と、世界中を駆け巡るインターネット上での情報そのものにもフェイクが含まれているという事を意味する。
なので、AIアートに関してもテキストによる命令を与えたとしても、その命令そのものを多方面から見た時、かならずしも同じ者を意味しない事から、AIがはじき出す画は全く同じ系統のものが生成されるとは限らない。
このようなAIアートを手軽に試すため、英語でしか使えないが無料で無制限に利用する事ができるという、下記のサービスを試してみた。

上記サイトに行き、少ししたにスクロールさせていくと「Stable Diffusion Playground」というところがあり、その下にテキストボックスがある。
そのボックスの中にグレーで「Enter your prompt」と書かれているが、そこに、英文で条件を記載し、その右隣の「Generate image」をクリックすると、英文で書いた条件(これをプロンプトと言う)に沿って画が生成される。
ハッキリ言って、上手く生成された試しはない。おそらく自分が想像している画を出すことは相当に困難だと言えるし、そのためには自分がまずどんなプロンプトで指定しなければならないのかを試行錯誤で理解する必要がある。
曖昧なプロンプトではAIは実に多様な画を生成する。時に常識では考えられないよう結果を見せる時もある。
お試しなので、とりあえず自分が望んだイラストを作るのは諦めるが、いくらか試してみて判ったのは、相当条件を絞り込んで明確にしてやらないと、想像するのも難しい結果しか生み出さないという事である。
それでも、自由に画を生成できるという事において、AIの凄さを感じる事は十分できるだろう。

Continue reading…

Desktop Version | Switch To Mobile Version