投稿

9月 7, 2025の投稿を表示しています

ChatGPT-5とGeminiの画像生成能力を比較して思うこと(2025年8月時点)

イメージ
ネット上の最新評価まとめ Gemini(Imagen 4 搭載) 鮮明でリアル Google I/O 2025で Imagen 4 へアップグレードされ、写真のような鮮明さと高解像度が強みと評価されている 編集機能が強力 部分修正やリタッチに強く、少ないプロンプトでも狙った変更を反映しやすい 多彩なスタイル 「かぎ針編み風」などユニークなスタイル生成にも対応 課題 過去には歴史的描写や人物生成に偏りがあり、バイアス問題で批判を受けた経緯もある ChatGPT-5(DALL·E 系) プロンプトの柔軟性 ネット評価では「複雑な指示や創造性に強い」とされ、抽象的・感情的表現も扱いやすい 現状の限界 写真のようなリアルさは弱く、レビューや Reddit では「ChatGPT-4oより劣る」との声がある 特に色味がアンティーク調に寄りやすく、フォトリアル表現では Gemini に劣るとの意見が目立つ 自分が感じること 普段 ChatGPT を使って画像生成やプロンプト生成を試しているが、正直どこが強化されたのかよくわからないというのが実感 画像を提出してプロンプト化しても、表現がズレることが多い 「プロンプト生成能力が優秀」という触れ込みはあるが、実際には下手で調整が何度も必要になる ChatGPT は画像生成モデル(DALL·E)のポリシーを正確に理解していないため、弾かれる → 作り直しの回数が多すぎる 色味の問題も無視できない ChatGPT はアンティーク調・黄みがかった色合いに偏るため、現代的で鮮明なリアルさを求めると必ず後処理が必要になる 一方で Gemini はリアルさや鮮明さに強いが、非現実的な想像物やファンタジー表現は苦手 リアル写真風なら Gemini、有り得ないものを描かせるなら ChatGPTを使うしかない ただし ChatGPT が特別うまいわけではなく、Gemini が下手だから相対的にマシという程度 まとめ リアルな現実的画像生成 → Gemini が有利 想像物やファンタジー系 → ChatGPT の方がまだ使える(ただし完成度は低い) 色味問題 → ChatGPT は...