最近リリースされたGoogleの画像生成AI、それがImageFXの「Imagen 3」です。
本記事では、高品質な画像生成を実現するImagen 3の技術や、商用利用の可能性、日本語対応、使い方など、ImageFXの魅力についてお伝えします。
ImageFXとは
ImageFXは、Googleが提供する最新のAI画像生成ツールです。
Googleアカウントでログインすれば誰でも無料で利用できます。
高画質な画像生成が可能で、とくに人物画像のリアルな表現に優れています。
最新バージョンImagen 3を搭載
Imagen 3は、Googleが開発した最新のAI画像生成技術です。
テキストの説明から画像を生成することができます。
写真のようなリアルな風景画から質感豊かな油絵、クレイメーションシーンまで、幅広いフォーマットとスタイルで画像を生成できます。
Imagen 3の特徴
前世代(Imagen 1、2)のAI画像生成技術と比べて、より詳細で鮮明な画像を生成できます。
たとえば、人物の表情や服のしわ、風景の細かな質感など、微細なディテールまで正確に再現することが可能です。
ユーザーが入力する自然言語の指示(プロンプト)を高度に理解し、それを視覚的に表現する能力が大幅に向上しています。
長文で複雑な説明や、抽象的な概念を含むプロンプトでも、意図を正確に把握し、それに基づいた画像を生成することができます。
画像内のテキスト表現が大幅に向上し、誕生日カードやプレゼンテーションスライドなど、文字を含む画像の生成精度が飛躍的に高まりました。
他の生成AIとの比較
以下は、Google DeepMindが公開したImagen 3のレポートからの詳細です。
全体的な品質を比較した図です。Imagen 3は、他のモデルよりも優勢なことがわかります。
プロンプトと画像の一致度を比較した図です。Imagen 3は、他のモデルよりも優勢なことがわかります。
視覚的な魅力を比較した図です。Midjourney v6が全体的にリードしていますが、Imagen 3は2位につけています。
他の生成AIモデルと比較して、とくに複雑で長いプロンプトへの対応力はImagen 3が大きく勝っている点が注目です。
ImageFXの商用利用については不明
ImageFXの商用利用については、明確に言及されていません。
しかし、ImageFXと同様にGoogleが提供する画像生成サービスであるGeminiでは、生成された画像の商用利用が認められています。
ImageFXもGeminiと同じ扱いになる可能性は高いと考えられます。
またImageFXで生成された画像には、AIによって作成されたことを証明するSynthIDという電子透かしが埋め込まれています。 これは、画像の出所や作成者についての情報を追跡できるため、商用利用においても一定の信頼性を担保するものと考えられます。
AI Test Kitchenに関するポリシーについてはこちらから確認できます。
ImageFXは日本語でも生成できるが・・・
ImageFXのインターフェースは日本語化されていますが、プロンプト入力の際には英語を使うことが、より良い結果を得るためのポイントと言えます。
英語で入力した方が、より高精度な画像が生成されるためです。
プロンプトを作成したい場合は、DeeplやGoogle翻訳などを利用して、英語に翻訳してから入力すると良いでしょう。
ImageFXの使い方
- ImageFXの公式ページ(https://aitestkitchen.withgoogle.com/ja/tools/image-fx)にアクセスします。
- Googleアカウントでログインします。
- 生成したい画像のイメージを英語でテキスト入力します。 より詳細な指示を出すことで、生成される画像の精度が向上します。
- 「作成」ボタンをクリックすると、AIが画像を生成します。
- 生成された画像はダウンロードできます。
まとめ
本記事では、GoogleのAI画像生成ツールであるImageFXについて解説しました。
ImageFXは最新のImagen 3を搭載し、高品質な画像生成が可能です。とくに人物画像のリアルな表現に優れており、微細なディテールまで再現できます。
商用利用については明言されていませんが、同様のGoogleサービスであるGeminiでは認められているため、ImageFXも同様の可能性が高いと推測されます。
日本語インターフェースですが、英語でのプロンプト入力が高精度な画像生成の鍵となります。
コメント