Dall-E2 と安定拡散はプロンプトは同じだが結果が異なるとは何を意味するか

Dall E2 To An Ding Kuo Sanhapuronputoha Tongjidaga Jie Guoga Yinarutoha Hewo Yi Weisuruka



ダル-E2 ' そして ' 安定した拡散 」はどちらも、ユーザーからのテキストプロンプトを写真に変換する AI ベースの画像ジェネレーターです。 Dall-E はもともと「」によってリリースされました。 オープンAI 」は2021年1月にリリースされ、そのアップグレード版Dall-E2は2022年4月にリリースされました。ただし、Stable Diffusionは「」によって作成されました。 安定性AI これらのプラットフォームはどちらも、ユーザーが入力したテキストのリアルな外観を作成することに努めています。 Stable Diffusion は Playground AI プラットフォーム上で誰でも無料で使用できますが、Dall-E2 はサブスクリプション ベースです。

この記事では、両方のプラットフォームで同じプロンプトをテストし、どちらが最も本物に近い画像を生成するかを確認します。

Dall-E2 と安定拡散が同じプロンプトで異なる結果をもたらすとはどういう意味ですか?

Playground AIではStable Diffusionを完全無料で利用可能 Webサイト 。 Dall-E2 には、Open AI で個人認証情報を使用してログインすることでアクセスできます。 Webサイト 。それぞれの Web ページを開くと、ユーザーはテキスト入力ボックスに案内され、画像を生成するためのプロンプトを入力できます。ユーザーは、作成したい画像のスタイルを指定することもできます。







AI が処理できる情報が多ければ多いほど、より良い最終結果が得られるため、テキストのプロンプトはできるだけ詳細にすることができます。ただし、あまり夢中になりすぎないように注意する必要があります。そうしないと、結果が完全に非現実的に見え始めます。



例1

最初の例では、草地にあるユニコーンの画像を生成しました。プロンプトの詳細は、AI ベースのクリエイターが具体的な詳細を追加して一貫した画像を作成するのに役立ちます。



緑の草の野原を疾走する白いユニコーンの水彩画、カラフルで鮮やかな色、ファンタジー、暗く、超現実的、神聖で魔法のような景色。

Dall-E2 の結果





安定した拡散結果

例 2

この例では、鮮やかな色の洞窟にいる男性と犬に関する次のプロンプトを入力しました。これにより、Dall-E2 と安定拡散の両方が鮮やかでカラフルな画像を作成する能力をテストできます。



熱帯雨林の真ん中にある滝を訪れる男性の洞窟探検家とその金色のラブラドールのデジタルアート、ダークファンタジー、鮮やかな色、ブラシストローク、高品質、ムーディーなカラーグレード。

Dall-E2 の結果

安定した拡散結果

例 3

次のプロンプトでは、両方の画像ジェネレーターの創造的な可能性を確認するために、いくつかの抽象的な単語を追加しました。

オックスフォード大学で重力、鮮やかな色、星、銀河、宇宙、そして暗い学術界を学生に説明する男性天体物理学者教授のリアルな絵。

Dall-E2 の結果

安定した拡散結果

結論

Dall-E2 と Stable Diffusion によって生成された画像を 3 つのカスタム ユーザー プロンプトに対して提示しました。どちらの AI ベースの画像生成プラットフォームでも、いくつかの類似点と特定の相違点を備えた高品質の画像が生成されました。どの作品が自分のスタイルに合うか、また無料の Stable Diffusion プラットフォームを使用するか Dall-E2 画像ジェネレーターを購読するかについては、お客様の判断に委ねられます。