Quantcast
Channel: いつも隣にITのお仕事
Viewing all articles
Browse latest Browse all 2077

ChatGPTの新・画像生成AIの落とし穴!?挫折と再挑戦のリアル体験記

$
0
0
ChatGPTの新・画像生成AIの落とし穴!?挫折と再挑戦のリアル体験記

みなさん、こんにちは! タカハシ(@ntakahashi0505)です。

ChatGPTの画像生成AIが新しくなり、性能が向上した一方で思わぬ落とし穴も。

愛用ツールがうまく動かなくなり大苦戦!

試行錯誤の末に見えてきた、新しいAIとの付き合い方とは?リアルな体験談をお届けします。

ということで、今回は「ChatGPTの新・画像生成AIの落とし穴!?挫折と再挑戦のリアル体験記」です。

では、行ってみましょう!

ChatGPTの画像生成AIがすごい!…はずだった?

いやはや、この2日間、僕はひたすら画像生成AIと格闘していました…。ちょっと疲れました(笑)。

皆さんもご存知の通り、最近のChatGPTの画像生成機能は目覚ましい進化を遂げています。

まるでジブリ作品のような雰囲気の画像を生成できたり、これまで苦手だった日本語の文字をかなり正確に画像内に描写できるようになったり。しばらくSNSなどで話題になってましたよね?

画像の修正をお願いするのも、以前よりずっとスムーズになったと感じていました。

ChatGPTの画像生成機能のアップデート「4o Image Generation」

もともと、ChatGPTで画像を生成する際には、「DALL-E 3」という画像生成AIが動いていました。

それが最近、ChatGPTの機能アップデートに伴い、画像生成機能が「4o Image Generation」として刷新されたんです。

この「4o Image Generation」、公式の説明によればDALL-E 3の技術を基盤にしているとのことですが、実際に使ってみた僕の感覚としては、生成される画像の雰囲気や挙動は、もはや全くの別物と言ってもいいかもしれません。

ただ…いいことばかりではなかったんです。僕にとっては、正直、ちょっと困った事態が発生してしまいました。

愛用GPTsに異変発生!僕のアイキャッチが…

僕は日頃から、「SEOアイキャッチメーカー」という自作のGPTs(ジーピーティーズ)を愛用しています。

GPTsというのは、ChatGPTの機能を自分好みにカスタマイズして、特定の目的に特化したAIを作れる機能のことですね。

この「SEOアイキャッチメーカー」は、ブログ記事の本文を渡すと、その内容をいい感じに読み取ってくれて、記事にぴったりなアイキャッチ画像、パーマリンク(URLの末尾)、そしてディスクリプション(記事の要約)を自動で作成してくれる、僕にとっては無くてはならない存在でした。

ところが、先日発表されたChatGPTの大型アップデート「GPT-4o」の登場により、状況が一変します。GPT-4oを使っている際の画像生成AIが、例の新しい「4o Image Generation」に変更されたのです。

本体のChatGPTに「4o Image Generation」が搭載された後も、しばらくはGPTsの内部で使われる画像生成AIはDALL-E 3のままだったのです。

しかし、その猶予期間(?)もいよいよ終わりを告げ、GPTs「SEOアイキャッチメーカー」にも、新しい「4o Image Generation」が搭載されてしまいました。

ある日、いつものようにブログ記事を作成し、さあ、アイキャッチ画像を作ってもらおう、とGPTsに依頼したところ…出てきた画像を見て、僕は思わず唖然としました。

「えっ…なにこれ…?」

いつも生成される、淡い色合いのポップなビジネスイラスト風画像とは似ても似つかない、まったくテイストの違う画像…たぶん、みなさんもちょこちょこ目にしていると思われる、いわゆる「フラットタッチのビジネス向けイラスト」。

のっぺりとした、シンプルな線で描かれたキャラクターが出てきてしまったんです。頼んでもいないのに、画像内に勝手に文字も載せてくるし…。

フラットタッチの呪縛との格闘:理想の画像を取り戻せ!

そこから、僕と新しい画像生成AIとの長い格闘が始まりました。

まず、気づいたのは、新しいAIは指示が少ないと、どうやら例の「フラットタッチ」なイラストに強く引き寄せられてしまう傾向がある、ということです。

まるで強力な引力を持っているかのように、ちょっと油断するとすぐにそっち系のイラストが出てきてしまうんです。困ったものです…。

そこで、僕は作戦を変えました。まずは、これまで「SEOアイキャッチメーカー」が生成してくれていた、僕好みの画像をAIに見せて、「こういう画像に近づけるには、どんな指示(プロンプト)を出せばいい?」と尋ねてみることにしたんです。いわば、逆引きプロンプト生成ですね。

AIはいくつかの提案をしてくれます。

それを元に画像を生成してみて、イメージと違ったら、その画像をアップロードしてさらに尋ねる。これを延々と繰り返しました。

具体的に、僕がAIとどんな「壁打ち」をしたかというと…

  • テイスト: 「イラスト調」はダメ。最近の日本のアニメや漫画のような、もう少しリアル寄りのタッチにしてほしい。
  • 線画: ペン入れの感じはどうするか?Gペンみたいな力強い線?それともミリペンみたいな繊細な線?
  • 塗り方: いわゆる「アニメ塗り」みたいなベタッとした塗りは禁止。水彩画のような、透明感のある塗り方でお願いしたい。
  • キャラクター: 登場人物は日本の20代から30代くらいのビジネスパーソン。少年漫画に出てくるような熱血キャラや、あまりにデフォルメされたキャラクターはNG。スーツ姿がいいかな。
  • シーン・ポーズ: これは記事の内容に合わせて、その都度いい感じに設定してほしい。

などなど、本当に細かい部分まで、ものすごい数の指示を試行錯誤しました。

長い時間をかけた粘り強い対話の結果、ようやく「うん、これならまあまあ、それっぽいかな」と思えるレベルの画像が生成できるようになってきました。長かったです…。

GPTsでの自動化を断念、プロジェクト機能という新たな活路

よし、これでGPTs「SEOアイキャッチメーカー」も復活できるぞ!と意気揚々と、調整したプロンプトをGPTsの設定に組み込んでみました。

しかし…なぜか、うまくいかないんです。

プレーンなChatGPTのチャット画面で、同じプロンプトを使って画像生成を試すと、ある程度狙い通りの画像が出てくるのに、GPTsを通して実行すると、どうしても例の「フラットタッチのイラスト」や、あるいはなぜか「熱血少年マンガ・アニメ調」みたいな方向に引っ張られてしまって、イマイチな結果になってしまうんです。

これ以上GPTsの設定に時間をかけるのは得策ではないかもしれない…。そう判断した僕は、いったん「SEOアイキャッチメーカー」でのアイキャッチ画像自動生成機能は断念することにしました。

それで、代替案として僕が目をつけたのが、ChatGPTの「プロジェクト」機能です。

プロジェクト機能は、特定のテーマに関する一連のチャット履歴をまとめて管理できる機能で、さらにそのプロジェクト全体に共通の指示(カスタムインストラクションのようなもの)を設定しておくことができます。

これなら、毎回同じような詳細な指示をプロンプトに含めなくても、プロジェクトにあらかじめ設定しておけば、新しい画像生成AIに対して、僕の好みを伝え続けられるのではないか、と考えたわけです。

ただ、このプロジェクト機能で試行錯誤する場合、ちょっとしたコツが必要そうです。試してみた感覚だと、既存のプロジェクトの設定を変更して使い回すよりも、毎回新しいプロジェクトを作成して、ゼロから始めた方が、意図した通りの結果になりやすい気がします。

どうも、プロジェクト内の過去のやり取りに、AIが影響を受けてしまうことがあるようなんです。「前のチャットでは、こういう指示でフラットタッチが出たな…」みたいな感じで、引きずられてしまうのかもしれませんね。

ひとまず、このプロジェクト機能を活用する方法で、いくつか気になる点は残るものの、実運用としては「まあ、よし」というラインまで持ってくることができました。

しばらくは、この方法でアイキャッチ画像の生成に対応していこうと思っています。

新しい画像生成AI、実はハードルが上がった…?

今回のChatGPTの画像生成AIのアップデートは、多くのユーザーにとっては素晴らしい進化なのでしょう。より多様な表現が可能になり、日本語への対応も強化されました。

しかし一方で、これまでのDALL-E 3は、ある意味で「いい加減」な指示でも、それなりにいい感じの画像を生成してくれる、ある種の「よしなにやってくれる感」がありました。指示が少なくても、AIが良い感じに情報を補完してくれていたんですね。

実際に、僕がこれまでGPTs「SEOアイキャッチメーカー」に入れていた、アイキャッチ画像に関する指示は、実はたったこの4つだけでした。

  • 画角は16:9で統一
  • 日本のビジネスパーソンをターゲットにしたデザイン
  • ポップなイラスト風がいいけど、色合いは淡め。
  • 記事タイトルを後で配置できるように、要素は少なめでシンプルな構成

たったこれだけの指示で、以前は十分だったんです。

ところが、新しい「4o Image Generation」では、指示が不足しているとかなりフラットなイラストや熱血アニメに引っ張られてしまう。

つまり、新しいAIを使いこなすには、これまで以上に指示を細かく、具体的に、そして大量にしなくてはいけないわけです、

これは、画像生成に慣れていない、僕のような「素人」からすると、むしろハードルが上がってしまったのではないか…? と感じています。

まとめ:変化を受け入れ、新たな可能性を探る旅は続く

というわけで、今回はChatGPTの新しい画像生成AI「4o Image Generation」に振り回された、僕のリアルな格闘記をお届けしました。

たいへんでしたけど、今回の試行錯誤で、少しだけ画像生成のやり方もわかってきたような…?

今回の僕の体験談が、同じように新しい画像生成AIとの付き合い方に悩んでいる方の、何かのヒントになれば幸いです。

以上、「ChatGPTの新・画像生成AIの落とし穴!?挫折と再挑戦のリアル体験記」についてお伝えしました。

引き続き、みなさんがいきいきと学び・働くためのヒントをお届けしていきます。次回をお楽しみに!

この話を耳から聴きたい方はこちらからどうぞ!


Viewing all articles
Browse latest Browse all 2077

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>