(function() {function signalGooglefcPresent() {if (!window.frames['googlefcPresent']) {if (document.body) {const iframe = document.createElement('iframe'); iframe.style = 'width: 0; height: 0; border: none; z-index: -1000; left: -1000px; top: -1000px;'; iframe.style.display = 'none'; iframe.name = 'googlefcPresent'; document.body.appendChild(iframe);} else {setTimeout(signalGooglefcPresent, 0);}}}signalGooglefcPresent();})();

Tagged: ChatGPT

AI競争の激化

生成AIの進化が止まらない。

GPT-4o、発表

OpenAIが従来よりも処理が高速化され画像や音声認識にも優れた新モデル「GPT-4o」を発表した。
テキストと画像処理関しては既にChatGPTやAPIを通して利用可能になっており、音声とVideoに関しては今後数週間で実装する予定のようだ。
上手く扱える人とそうでない人とで差が付いた感じGPT-4oはテキスト、音声、画像といったあらゆる組合せを入力する事ができ、生成出力もテキスト、音声、画像で行う事ができる。従来のモデルと比較して、特に音声と画像の理解に優れているとの事。
特に音声入力に関しては応答時間はわずか232msで、平均でも320msと、人間の応答時間とほぼ同じレベルに達しているという。ちなみにGPT-3.5では平均2.8秒、GPT-4では5.4秒だった事を考えれば、相当な進化といえる。
おもしろいのは、笑い声や歌唱力、感情表現も出力できるという。これは以前のバージョンと大きく事なる部分であり、以前では音声を介したChatGPTとの会話は、音声をテキストに変換して処理し、出力されたテキストを音声に変換する、というプロセスを執るため、複数の話者がいたり、それによって音調がおかしかったり、ノイズが多く必要な情報を検知するのが難しかった。
GPT-4oでは、テキスト、音声、画像にわたって単一のモデルをエンドツーエンドでトレーニングし、全ての入力と出力をニューラルネットワークで行うようにしたという。この方法、まだ表面的に行っただけなので、今後どのように進化をするかはまだまだこれからだという。
英語以外の言語テキスト処理も大幅に改善されており、API利用価格はより高速でありながら50%安価に設定された。それに伴い、従来無償だったGPT-3.5などもできる事が拡大しているようだが、もちろんGPT-4oとの差別化は図られている。
全体的な底上げはされつつも、より進化したAIである事はまちがいないようである。

競争

OpenAIのChatGPTという言葉が広まるキッカケだったかもしれないが、その後、GAFAなども含めて生成AIの競争が激化している。
Amazonも独自の生成AIの立上げに向かい、AWSで展開を始めているし、GoogleもGeminiを稼働させた。MicrosoftもCopilotを稼働させ、一部はEdgeで利用できるようにし始めているが、正直、普通の一般人が利用するにはまだ価格的にどうなのか? と思う事がある。
特にMicrosoftのMicrosoft365で活用できるCopilotは、Microsoft365のプレミアム的な追加要素として料金も追加されるサービスだが、その追加料金が結構エグイ。ま、Officeソフトをプロフェッショナル的に利用する人であれば受容できる価格なのかもしれないが、自宅でとりあえずWordとExcelとPowerPointが使いたいぐらいに考えている人が導入するには結構ハードルが高い価格だ。
開発にも相当な資金が使われているだろうから、価格が高めになるのは解らなくもないが、今の価格では普及は一部に留まってしまう事は間違いないだろう。
GoogleのGeminiは無料で利用できるが、コイツにもGemini Advancedという上位版が存在する。いわゆる有償版である。月額2,900円とこちらも結構なお値段。
こういった、有償による生成AIは、まだ一般人が何となく使うというレベルではなく、ある程度理解している人が開発するくらいの感覚で利用するというイメージではないかと思う。
だが、そうした理解している人が世間から一歩も二歩もリードしていく状況にあるので、IT関連の知識に明るい人とそうでない人で、結構な差がついてくる時代になったのかな、という感じがする。
…ま、私は未だ理解している側ではないと思うが。
そして気になるのはAppleの動きである。
GAFAの中で唯一生成AIに遅れをとっているのがAppleである。
Appleは今までも新しいサービスにおいて一番乗りしてくるケースは少ないのだが、あまりにも参入してくるタイミングが遅いのである。
おそらく表面的には出てきていなくても、内部では開発を進めている事は間違いないだろうが、どのような形で表に出してくるのかが、今は一番きになるところである。

Continue reading…

AIを活用していく時代

ChatGPTの話題が出てからと言うもの、何かとAIが取り沙汰されている。

AIを使えないと

ChatGPTの登場によってなくなる仕事がある…という話をよく聞く。
確かにそのとおりで、テンプレ的な文書案作成などは、もうAIに任せてしまっても良い時代になり、そこに割く時間が大幅に短縮され、それにまつわる業務はとにかくChatGPTさえ使えればどんどんと省略、簡略されていく業務になりつつある。
だが、ここで根本的な問題が一つ出てくる。
それは、まずChatGPTをどのように使えば良いのか? という事をちゃんと理解しているかどうかで大きく変わるという事だ。
今、私はココで「ChatGPT」と記載しているが、これは即ち「AI」と置き換えるべきだろう。
ChatGPTは大規模言語モデルの一種であくまでも自然言語で扱えるテキスト生成AIでしかない。同じように大規模言語モデルを利用した画像生成AIなどもあるので、そうした幾多あるAIを活用していく、という事に注視しないと行けない時代になったと言える。
なので、こうしたAIをどのように扱うのかで、アウトプットされるものが大きく変わってくる。
つまり、AIを上手く使いこなす人が必要であり、使いこなさなければ業務を肩代わりさせる事ができない。
これからの時代は、そのAIを上手く扱える者が必要な時代になる、という事だと私は認識している。

新しいビジネス

AI画像を生成するという事で、いろいろと問題になっているのが、その著作権の在り方である。
これは、AI生成画像の著作物を販売する人が出てきた事でより深刻化した問題と言えるが、AIが学習に利用する元の画像には当然著作権が存在し、その著作物を取り込んだが故に、生成されたAI画像の出来映えで元となる著作に影響を与える事が多々ある為、問題になると考えられる。
この法的な問題は国によっても解釈が異なるので、完全な解決に至るにはまだまだ時間がかかる事になるが、実際の元画像を制作した人の言い分にも、またAIで画像を生成した人の言い分にも、一定の理解できる部分は存在する。なので、これは技術の発展とともに今後折り合いを付けていく必要のある問題になると私は思っているのだが、難航する事は簡単に予想できる。
私は元の画像を描ける人ではないので、あくまでも生成する側として話をすると、画像生成AIを思い通りに使いこなし、狙った画像を生成させるという事は想像以上に難しいという事である。
AIに思った通りの事をさせるという事がこれほどまでに難しいのかと思える程、難しい。この命令をプロンプトというが、プロンプトは構文となっていて、ポジティブプロンプトとネガティブプロンプトという、反映させるべきプロンプトと反映させないプロンプトを組み合わせて、狙った画像を生成させる(サービスによって異なるが)。
その文字数たるや思った以上に長文だったりもするので、なかなか思い通りにいかないのである。
で、そうなるとプロンプトのマーケットというビジネスが登場する。

現在は画像生成AIに特化したような取扱いで、それも複数のサービスのプロンプトを取り扱っている状況。予想できたビジネスではある。だが、プロンプトなら別に画像に特化しなくても、他でも活用方法はいくらでもある。
文書作成、3Dデータ、場合によってはプログラムなんかも、生成させるだけのプロンプトは需要があると考えられる。
ChatGPTが有名になった事で、新たなビジネスが生まれたわけだが、これも需要があるからである。

Continue reading…

AIによる今後の生活

ゲームチェンジャーになりそうだからこそ気になる。

未来を変えられるか?

正直、私は今の生活のあらゆる所に心配の種を持ち合わせている。
もちろん、こんな事は他の人でも同じかもしれないが、私は母の介護という問題に直面しているし、そもそも自身の家の資産がゼロ…というよりマイナス発進だった事もあって、今後の生活に不安要素しかない状況にある。
それでも何とか生きていられるのは、今の職場で今までの仕事のやり方でなんとか評価が得られている、もしくは評価はされていなくとも、納得はされているからだろうと考えられる。
だが、私のような事務職にとって脅威とされるものが今世間で話題になっている。
それがChatGPTをはじめとした自然言語モデルによるAI技術である。

恐ろしい時代になったものである

@ITより引用

Microsoftが「Microsoft365 Copilot」をサービスとして提唱した時点で、会社内部のデータ分析やそれに伴う評価などを行っている人の仕事は、ほぼAIに取って代わられる事は間違いない。
何しろ、自然言語モデルによるAIはアクセスリソースからデータを引き出すことができたなら、そのデータを使って、極自然にそのデータを評価、分析し、今後の予想までしてしまう。
しかも、その精度は時間が経過するにつれて高まっていき、もう既に人の能力を超えようかという所まで来ている。
圧倒的な知識量と速度は、人ではもう太刀打ちできないところにあり、唯一人が勝てるかもしれないところは、インスピレーションぐらいではないかと思える。いや、それさえももうハッキリとは判らないレベルにある。
では、もうどうしようもないのか? という事になるわけだが、実はそうでもないという事にちょっと気づき始めた。
問題は、その自然言語モデルによるAIをどのように利用、活用していくか、という一番最初の入口に関しては、人間の出ていく幕があるのである。

ハイテクでない環境の中で

現在、ChatGPTなどを利用して、新たな可能性を見出している分野の業務はわからないが、一地方の片田舎にある会社や工場では、そうした自然言語モデルによるAIの存在は認識されていても、それをどうやって取り込んで行けば良いかは判らない、というケースが多い。
残念ながら、私の勤め先でも同じで、便利になる事は判っていても、それをどう取り込んで、使って行けば良いのかに関しては、理解されているという事は全くない。
情報だけが先行していて、それを利用するという段階に持っていく為の知識やスキルが伴っていないのである。
これは、システムエンジニアと呼ばれる人が極端に少ないところで同じ現象が起きているのではないかと考えられる。
私自身、IT知識がそこそこ合ったとして、プログラミング知識がほぼないという事もあって、どう扱っていいのかが判っていないので、私でコレなのだから、私の勤め先では他はもっと判っていないと考えられる。
もし、私がChatGPTなどを取り込む事を可能にするプログラミングスキルを手に入れたなら、それは自らはとりあえず仕事を失う事はないのではないか? と言える。
もちろん、プログラミングがそんなに簡単に身につくとは思ってはいないが、最近はインタプリタ型のプログラムでも十分な実行速度があるので、超高級言語でプログラムしても、それが利用価値のあるものになってくれる。
であるなら、インタプリタ型で私でも挑戦できそうなプログラムの勉強を始めた方がよいのではないか?

Continue reading…

ChatGPTを使ってみた

今更感もあるが、やってみないとわからない事でもある。

AIの一つの到達点?

ChatGPTが話題になったのは、昨年末ぐらいからだろうか。
特に最近ではMicrosoftがBingに採用したりと話題に事欠かない事で知名度を爆上げしているが、テキストチャットで人間のような回答、しかもかなり適格な回答をするという事でも話題になっている。
OpenAIという企業が公開しているAIで、昨年11月に公開した時には、プロトタイプとしていたものが、今年に入ってからは随分と精度も上がっているようで、それがあるからこそ、Microsoftなども採用を始めた、という所ではないかと思う。
ただ、OpenAIそのものは、ChatGPTは時によってもっともらしく見えるが誤っている回答を作成する事を認めている。
なので、確実な答えを得るための手段というよりは、参考となる意見を聞くための手段という考え方でいる方が、今はまだ良いのではないかと言える。
で、世間でこれだけ話題になっていたら、試してみたくなるのも事実で、とりあえず私もOpenAIのサイトでアカウントを作成、使用してみることにした。

使ってみない事にはその凄さはわからない
ChatGPT

https://chat.openai.com/

何を訊くか?

AIチャットボットといっても、基本的には人とチャットしているように質問すれば良いだけらしいので、こんな事を訊いてみた。

「Blogを長期に渡って書き続ける秘訣を教えてください」

当Blogも長年書き続けているが、続ければ続けるほど、ネタとの戦いだけでなく、モチベーションとの戦いになる。この問題に対して良い解決策があればぜひ教えてほしいものである。
で、得られた回答は以下のようなもの。

“Blogを長期にわたって書き続けるためには、以下の秘訣が役立つかもしれません。

1.目的を明確にする:まず、自分のブログの目的を明確にする必要があります。どのような読者を対象にし、どのようなトピックに焦点を当てるかを決定し、それに基づいてコンテンツを作成します。

2.一定の頻度で更新する:読者は、一定の頻度でコンテンツが更新されるブログを好む傾向があります。例えば、毎週または毎月定期的に更新するように設定することができます。

3.計画を立てる:ブログを書く前に、コンテンツのアイデアをまとめたリストを作成することが役立ちます。また、ブログのアウトラインを作成し、その後、それを埋めることができます。

4.読者とのコミュニケーションを重視する:読者がコメントやフィードバックを残せるように、ブログにコメント欄を設けることが重要です。また、SNSやメールなどを通じて読者とのコミュニケーションを促進することもできます。

5.情報の正確性を確認する:誤った情報を提供することは読者に不快感を与え、信頼を失う原因となります。ブログの情報は正確で信頼できるものでなければなりません。

6.SEOに配慮する:SEO(検索エンジン最適化)を考慮し、コンテンツを書くことが重要です。適切なキーワードを使用し、見出しやメタデータなどの要素を最適化することができます。

7.自分自身に厳しくある:自分自身に高い基準を設定し、クオリティの高いコンテンツを提供することが大切です。自分が満足できるレベルのコンテンツを作成することができるように、自分自身に厳しくあることが重要です。

これらの秘訣に従うことで、長期にわたってブログを書き続けることができるかもしれません。”

…まぁ、実に優等生な回答が出てきたものである(爆)
しかもご丁寧に「役立つかもしれません」とか「~てきるかもしれけません」と回答に保険を掛けてくる周到さ。
確かにネットによく書かれている秘訣を明確にしていると言える回答である。
これが普通に実践できれば何も困る事はないワケだが、ただ言っている事は実に明確であり正しい事を言っていると感じる。
他にもいろいろな質問をしてみないとわからない事はわからないが、得られた回答をスラッと出してくるあたり、優秀なAIチャットボットなのだろう事は疑いない。

Continue reading…

Desktop Version | Switch To Mobile Version