Tagged: AI

AI生成イラストがおもしろい

ま、面白いからといって、これで何かやろうとか考えていないのだが。

ローカル環境で数秒

当Blogでも以前にAI生成イラストをローカル環境で実施する事に挑戦した記事を書いたが、その時はプログラムが完走せずに試す事ができなかった。

Angel Halo

AI生成イラストをローカルで

🕒️2023/06/02

Stable Diffusion web UIを使ってみたが…。オンラインだといろいろ課題が…ChatGPTというものが話題を集めてからというもの、何かとAIが騒がれるようになり、TwitterなどでAI生成されたイラストなどがツイートされるようになった。つまり、それだけAIを使用するという事が手軽になり、あらゆるところで利用されはじめたという事なわけだが、そのほとんどの使われ方は、オンラインでそのサービスを受けつつ、アウトプットされたものを活用するというものだった。私も実際ChatGPTのサイトにアカウントを登録し、無料の範囲で利用したりし...

だが、その後の調査で「Git」と呼ばれるStable Diffusionをクローン化するプログラムが足りない事が判明したので、そちらをネットで探してインストールしたところ、無事「Stable Diffusion UI」が完走、ローカル環境でプログラムが稼働する事を確認した。
「Stable Diffusion UI」は使用するモデルデータが必要になるのだが、これをネットでいろいろと配布しているサイトから集め、複数のモデルを準備したのだが、今回、改めてAnythingというモデルをインストールしてみた。
というのは、Anythingのバージョンが3から5へとアップデートされていたからだ。
Anythingは、そのバージョンによって初出が異なるという話があり、著作権の問題でいろいろ理解しておかねばならないところがあるのだが、どうも3系と5系は初出が同じという事のようなので、今回改めてAnything-v5.0を入れてみる事にした。
拡張子が最近主流の「.safetensors」となっているモデルデータだが、基本モデルデータを保存する場所は同じである。
で試しに出力してみたのだが…何か1枚あたりの画像生成時間がとんでもなく速いんだけど…。
時間にして2秒程度。
画像の大きさは512×512なので、そう大きいものではないし、プロンプトも比較的短めのものではあるのだが、それでも1枚2～3秒で出力できるというのは、ちょっと驚きだった。

なぜ速いのか？

いろいろ調べて見たら、この速さの秘密はモデルデータの拡張子が「.safetensors」に変わった、新しいタイプのものだかららしい。
もともとPythonのプログラムを実行する上でのセキュリティを考えた先に「.safetensors」というフォーマットに変わったらしいのだが、その処理速度も以前のものから比べて格段に速くなっているらしい。
「anything-v3.0」系のモデルも、現在は「.safetensors」のモデルデータに変わっているので、こちらに切替えた方がいいだろう。
私はAI生成イラストを行うには完全に後発の部類にはいるので、既に確立された手順の元で今まで蓄積されてきた恩恵をそのまま受ける形でAIイラストを生成する事になるが、後発の強みはこうした進化した形でそのシステムを導入できる事にある。
ま、それだけに仕組みや記述方式を今から入念に理解していく必要はあるし、今までの経緯を知らない事で、ちょっとした設定を知らないなんて事も多々ある。
早い時期に始めた方が良いのか、それとも後発組が良いのかは、その都度変わる話かもしれないが、私としては先人の知恵を拝借しながら、まずはその足跡を辿っていって見たいと思っている。

生成AIイラストの今後

著作権問題は当然の如く存在する事は誰もがわかる事。

政府も検討

政府の知的剤年戦略本部が近くまとめる事となる「」知的財産推進計画2023」の原案が判明したようである。
昨今流行りのAIによる生成物によって生み出される文章や画像に著作権侵害の事例が考えられる事から、AIによる著作物の学習が侵害に当たるケースなど、いろんな論点整理を進めて必要な方策を検討するとされた。
例年であれば、この計画は知的財産全般の保護や活用などについて政府の施策の方向性を示す事になるのだが、今年は独立した項目として生成AIを取り上げて課題などを整理したようである。
この計画から出された課題が明記されたからといって法律として決まったというわけではないが、今後必要な方策を検討して行く中で規制が必要となれば法律も作られていく、という事である。
一番の問題は、生成AIによる文章や画像において、その学習元となる著作物を持つ人達がどう考えるか、という事ではないかと私は思うのだが、事はそれだけに収まらない、という事なのだろう。

学習元データだからといって

ただ、AI生成イラストに関しては、ちょっとした誤解がネット上にあるようである。
学習元となったイラストと酷似したAI生成イラストがあったとして、それが学習元となった画像そのものを改変したものか？というと実はそうでもないという事。
出力した結果として似てくるのは学習元だからある程度はあるのだが、AIは他のデータももちろん参照して画像を出力している。
たとえは学習元となったイラストだけでなく、実写の写真データもその中身に取り込んでイラスト細部の印影や印象などのデータとして出力するし、他のイラストデータも勿論生成する上で参照するデータとして扱っている。
だから学習元となったイラストと酷似していたとしても、そのイラストだけを参照してまねているという事ではない、というのが技術的な方向から見た意見である。
ただ、法律はこの技術的なところは見ていない。
AI生成イラストがある著作物とそっくりだったとして、その著作物のオリジナルを利用していた事が証明されれば、そのは著作権侵害の可能性がある、という事であり、印象として似てくれば違反の可能性はあるわけである。
そうなると…AI生成イラストの場合、ほとんどの学習データに現状の著作物のオリジナルが使われている可能性は非常に高く、要素として含まれていないと考える事に無理がある。
ネットで出回ってしまっているのだから、それをAIの学習データとして取り込んでいないなんて可能性はまず皆無だろう。
この判断、諸兄はどう考えるだろうか？
私はこの考え方が絶対的だとするなら、生成AIから生み出されたものは、まずもって利用できない事になるように思えてならない。
あまりに似すぎているものは問題だろうが、印象として似ているものまで規制されるようであれば、利用する事はまず無理である。

Microsoft 365 Copilot

AIがついに人間の仕事を奪い始めた？

The Futre of Work with AI

Microsoftがプライベートイベント「The Futre of Work with AI」にて、AI機能を統合したオフィススイート「Microsoft 365 Copilot」を発表した。
統合されるAIは自然言語処理を使用しているChatGPTのようなAI技術で、Office製品にコパイロット、つまり副操縦士のようにAIが寄り添うOffice製品という位置付けになるようである。
実際に、Copilotに自然言語で要望や指示を出すと、AI処理を施してビジネス文書の作成を代行、サンプル文書というよりもずっと高度な文書を自動生成し、ユーザーを補佐するという。
もともと、Office製品はとても機能が豊富だが、おそらくOfficeを使用している人はOfficeの機能を半分も…いや、もっと厳密に言えばおそらく10％程度の機能しか利用していない。
Microsoft製品を巧みに利用するための資格が存在する…というぐらい高機能なアプリケーションがOffice製品だから、一般的に使用する程度であればたしかに全ての機能の10％程度でも十分な事ができるのかもしれない。
しかし、その機能を実装しているMicrosoftからしてみれば、もっと搭載した機能を利用してもらいたいというのが本音だろう。
そしてその機能を使用したからこそ、よりリッチな文書を草製する事ができるという事を知ってもらいたいと思っているに違いない。
この発表された「Microsoft 365 Copilot」はユーザーがアクセスできるデータを利用し、フル活用して文書を作成するという。
OSの開発元であるMicrosoftだからこそ…という事ではないかもしれないが、ユーザーがアクセスできるデータをフル活用するという事は、ユーザーが保管している写真画像データなども活用して文書を作るという事であり、完全にOfficeの枠を超えた文書を作成するツール、という感じである。

News Center Japan

Microsoft 365 Copilot を発表 – 仕事の副操縦士 - News Center Japan

https://news.microsoft.com/ja-jp/2023/03/17/230317-introducing-microsoft-365-copilot-your-copilot-for-work/

人間は、夢を見て、創造し、イノベーションを起こすように作られています。私たち一人ひとりが、偉大な小説を書く、科学的な発見をする、強力なコミュニティを築く、病人を看護するなど、生きがいを感じられる仕事を求めています。

あらゆる文書を自動生成

Office製品なので、その中にはWord、Excel、PowerPoint、Outlook、Teams等が主となるツールと言えるが、これらの文書の全てをAIを駆使して自動生成する。
Outlookなら、メール文書を自動生成する事になるが、支持としては大まかな内容をCopilotに伝えると、適宜メールを自動生成する。文面の長さも指定すればその長さで生成する。細かい言い回しなどは予め指定していたもので生成するようなので、メール作成の時間が大幅に短縮される。
PowerPointの場合、プレゼン資料などを作成すると思うが、これもページ数を指定し、内容の大まかな指示すると、ユーザーが持つ関連データや画像データを参照して、プレゼン資料を自動生成する。また、アニメーションの追加も当然指示するだけで自動で挿入される。なお、この自動生成される文書におけるスピーカーノートも、自動生成ができるようで、資料だけでなく、実際のシナリオもAIが作成するという具合になる。
PowerPointでここまでできるので、Wordに関してはほぼ何でもできると考えていい。自動的に文面の長さも調節できるし、まさに至れり尽くせりである。
Wordらしい機能としては、長文の文書の要約を自動作成してくれる機能がある。
Excelに関しては、予め作成したデータ群を情報をとして与えると、四半期毎のサマリーを作成したり、そこから得られたデータの分析結果から、成長シナリオの生成もできるとの事。複雑なグラフを作ったりする時、Excelのグラフ作成の技術が必要になったりするが、そういうのも自動でできるので、人間のやる事はそのデータを与える事だけ、という事になる。
Teamsの場合は、会議の議事録の自動生成に始まり、その生成された議事録の要約の作成、カレンダーの予定からのタスクの作成、ファイルにアクセスしチャットに関連データを貼り付けたりと、Copilotへの指示でまとめ資料の作成がほぼ完璧に近い形でできる。
さらに今後の予定されている会議に関連する資料を自動検索してExcelデータなどから抽出させたり、そのデータでPowerPoint資料を準備する、なんて事もできるようだ。

AIの未来と可能性

いろいろ問題があるような話は聞くが…

AIが常識を変える

ChatGPTでAIというものがより一層世間に深い印象を与えている中で、イラストの世界でもAIアートが物議を醸している。
AIが学んだサンプルデータを元に、いろいろな命令(プロンプト)に従ったイラストを生成し、その表現力がとんでもないものなってきている事で、そのサンプルデータに対する著作権がどうなるのか、などいろいろ倫理的な部分で今までに無いフォーマットを巡って論議されている。

画像は「ビジネス+IT」より引用(https://www.sbbit.jp/article/cont1/76475)

そういえば…初音ミクの時も似たような問題があったな、と思うのだが、初音ミクの時はまだ声のサンプルが特定の声優(あえて声優というが別に声優である必要は無かった)に限定されていた事で、その生成される声そのものに著作がつけやすかった事が、大きな違いかもしれない。
だが、現在のAIアートでは、いろいろなサンプルデータを取り込んでいる結果、著作をどうするか、という議論はかなり泥沼のような状態になっているようだ。
そもそも、AIが生成するものに著作などあり得るのか？という意見も、真っ向から否定する事はできないし、かといって肯定する事もできない。
まだまだ議論の余地があり、判断は混沌としている。
イラストもそうだが、このAIが生成するものは、今後いろんなものに同じような論争を生んでいく。
実際、声に関してもそうだ。
サンプルとして得た音声データから、その本人と同じ声紋で言葉を紡ぐ事も今では可能になってしまっている。
つまり、音声認識のセキュリティは、もはや役には立たないと言える。
あらゆるものの常識が今、変わろうとしている。

AIアートを試してみる

このような常識が変わっていくであろうAIだが、先日はChatGPTを試してみた。

Angel Halo

ChatGPTを使ってみた

🕒️2023/03/06

今更感もあるが、やってみないとわからない事でもある。AIの一つの到達点？ChatGPTが話題になったのは、昨年末ぐらいからだろうか。特に最近ではMicrosoftがBingに採用したりと話題に事欠かない事で知名度を爆上げしているが、テキストチャットで人間のような回答、しかもかなり適格な回答をするという事でも話題になっている。OpenAIという企業が公開しているAIで、昨年11月に公開した時には、プロトタイプとしていたものが、今年に入ってからは随分と精度も上がっているようで、それがあるからこそ、Microsoftなども採用を始めた、と...

いろんな質問をしても、結構正確な回答をしてくるAIだと感じたが、実際にAIは回答を知っているのではなく、サンプルとしてデータから回答と思しきものを探り当て、会話という形に擬えて回答しているだけである。
実際、開発元であるOpenAIも、ChatGPTは時によってもっともらしく見えるが誤っている回答を作成する事を認めている。
これはサンプルデータがどれだけ正確かという事と、世界中を駆け巡るインターネット上での情報そのものにもフェイクが含まれているという事を意味する。
なので、AIアートに関してもテキストによる命令を与えたとしても、その命令そのものを多方面から見た時、かならずしも同じ者を意味しない事から、AIがはじき出す画は全く同じ系統のものが生成されるとは限らない。
このようなAIアートを手軽に試すため、英語でしか使えないが無料で無制限に利用する事ができるという、下記のサービスを試してみた。

stablediffusionweb.com

Stable Diffusion Online

https://stablediffusionweb.com

Stable Diffusio Online Demo. FREE forever. Create beautiful art using stable diffusion ONLINE

上記サイトに行き、少ししたにスクロールさせていくと「Stable Diffusion Playground」というところがあり、その下にテキストボックスがある。
そのボックスの中にグレーで「Enter your prompt」と書かれているが、そこに、英文で条件を記載し、その右隣の「Generate image」をクリックすると、英文で書いた条件(これをプロンプトと言う)に沿って画が生成される。
ハッキリ言って、上手く生成された試しはない。おそらく自分が想像している画を出すことは相当に困難だと言えるし、そのためには自分がまずどんなプロンプトで指定しなければならないのかを試行錯誤で理解する必要がある。
曖昧なプロンプトではAIは実に多様な画を生成する。時に常識では考えられないよう結果を見せる時もある。
お試しなので、とりあえず自分が望んだイラストを作るのは諦めるが、いくらか試してみて判ったのは、相当条件を絞り込んで明確にしてやらないと、想像するのも難しい結果しか生み出さないという事である。
それでも、自由に画を生成できるという事において、AIの凄さを感じる事は十分できるだろう。

ChatGPTを使ってみた

今更感もあるが、やってみないとわからない事でもある。

AIの一つの到達点？

ChatGPTが話題になったのは、昨年末ぐらいからだろうか。
特に最近ではMicrosoftがBingに採用したりと話題に事欠かない事で知名度を爆上げしているが、テキストチャットで人間のような回答、しかもかなり適格な回答をするという事でも話題になっている。
OpenAIという企業が公開しているAIで、昨年11月に公開した時には、プロトタイプとしていたものが、今年に入ってからは随分と精度も上がっているようで、それがあるからこそ、Microsoftなども採用を始めた、という所ではないかと思う。
ただ、OpenAIそのものは、ChatGPTは時によってもっともらしく見えるが誤っている回答を作成する事を認めている。
なので、確実な答えを得るための手段というよりは、参考となる意見を聞くための手段という考え方でいる方が、今はまだ良いのではないかと言える。
で、世間でこれだけ話題になっていたら、試してみたくなるのも事実で、とりあえず私もOpenAIのサイトでアカウントを作成、使用してみることにした。

ChatGPT
https://chat.openai.com/

何を訊くか？

AIチャットボットといっても、基本的には人とチャットしているように質問すれば良いだけらしいので、こんな事を訊いてみた。

「Blogを長期に渡って書き続ける秘訣を教えてください」

当Blogも長年書き続けているが、続ければ続けるほど、ネタとの戦いだけでなく、モチベーションとの戦いになる。この問題に対して良い解決策があればぜひ教えてほしいものである。
で、得られた回答は以下のようなもの。

“Blogを長期にわたって書き続けるためには、以下の秘訣が役立つかもしれません。

1.目的を明確にする：まず、自分のブログの目的を明確にする必要があります。どのような読者を対象にし、どのようなトピックに焦点を当てるかを決定し、それに基づいてコンテンツを作成します。

2.一定の頻度で更新する：読者は、一定の頻度でコンテンツが更新されるブログを好む傾向があります。例えば、毎週または毎月定期的に更新するように設定することができます。

3.計画を立てる：ブログを書く前に、コンテンツのアイデアをまとめたリストを作成することが役立ちます。また、ブログのアウトラインを作成し、その後、それを埋めることができます。

4.読者とのコミュニケーションを重視する：読者がコメントやフィードバックを残せるように、ブログにコメント欄を設けることが重要です。また、SNSやメールなどを通じて読者とのコミュニケーションを促進することもできます。

5.情報の正確性を確認する：誤った情報を提供することは読者に不快感を与え、信頼を失う原因となります。ブログの情報は正確で信頼できるものでなければなりません。

6.SEOに配慮する：SEO（検索エンジン最適化）を考慮し、コンテンツを書くことが重要です。適切なキーワードを使用し、見出しやメタデータなどの要素を最適化することができます。

7.自分自身に厳しくある：自分自身に高い基準を設定し、クオリティの高いコンテンツを提供することが大切です。自分が満足できるレベルのコンテンツを作成することができるように、自分自身に厳しくあることが重要です。

これらの秘訣に従うことで、長期にわたってブログを書き続けることができるかもしれません。”

…まぁ、実に優等生な回答が出てきたものである(爆)
しかもご丁寧に「役立つかもしれません」とか「～てきるかもしれけません」と回答に保険を掛けてくる周到さ。
確かにネットによく書かれている秘訣を明確にしていると言える回答である。
これが普通に実践できれば何も困る事はないワケだが、ただ言っている事は実に明確であり正しい事を言っていると感じる。
他にもいろいろな質問をしてみないとわからない事はわからないが、得られた回答をスラッと出してくるあたり、優秀なAIチャットボットなのだろう事は疑いない。