ChatGPT-5とGeminiの画像生成能力を比較して思うこと(2025年8月時点)

ネット上の最新評価まとめ

Gemini(Imagen 4 搭載)

  • 鮮明でリアル
    Google I/O 2025で Imagen 4 へアップグレードされ、写真のような鮮明さと高解像度が強みと評価されている
  • 編集機能が強力
    部分修正やリタッチに強く、少ないプロンプトでも狙った変更を反映しやすい
  • 多彩なスタイル
    「かぎ針編み風」などユニークなスタイル生成にも対応
  • 課題
    過去には歴史的描写や人物生成に偏りがあり、バイアス問題で批判を受けた経緯もある

ChatGPT-5(DALL·E 系)

  • プロンプトの柔軟性
    ネット評価では「複雑な指示や創造性に強い」とされ、抽象的・感情的表現も扱いやすい
  • 現状の限界
    写真のようなリアルさは弱く、レビューや Reddit では「ChatGPT-4oより劣る」との声がある 特に色味がアンティーク調に寄りやすく、フォトリアル表現では Gemini に劣るとの意見が目立つ

自分が感じること

普段 ChatGPT を使って画像生成やプロンプト生成を試しているが、正直どこが強化されたのかよくわからないというのが実感

  • 画像を提出してプロンプト化しても、表現がズレることが多い
  • 「プロンプト生成能力が優秀」という触れ込みはあるが、実際には下手で調整が何度も必要になる
  • ChatGPT は画像生成モデル(DALL·E)のポリシーを正確に理解していないため、弾かれる → 作り直しの回数が多すぎる

色味の問題も無視できない ChatGPT はアンティーク調・黄みがかった色合いに偏るため、現代的で鮮明なリアルさを求めると必ず後処理が必要になる 一方で Gemini はリアルさや鮮明さに強いが、非現実的な想像物やファンタジー表現は苦手 リアル写真風なら Gemini、有り得ないものを描かせるなら ChatGPTを使うしかない ただし ChatGPT が特別うまいわけではなく、Gemini が下手だから相対的にマシという程度

まとめ

  • リアルな現実的画像生成 → Gemini が有利
  • 想像物やファンタジー系 → ChatGPT の方がまだ使える(ただし完成度は低い)
  • 色味問題 → ChatGPT はアンティーク調に偏る、Gemini は現実寄りすぎて非現実物が苦手
  • ChatGPT-5 の評価はまだ定まっておらず、画像生成に関して大幅な進化は体感できない

現時点ではどちらか一方が万能ということはなく、用途に応じた使い分けが必須という結論になる

コメント

このブログの人気の投稿

ChatGPT「Sora」が突然消えた件

AIとペットの類似構造

Geminiとの対話から見えたAI全体の課題 ― 擬人化表現と中立性の限界