画像生成AI「Stable Diffusion XL」のデモ版を使う方法。無料で簡単に画像生成を試せる

指示文から画像を生成できる「画像生成AI」に注目が集まっています。その1つとして知られる「Stable Diffusion」（ステイブル・ディフュージョン）の上位モデル「Stable Diffusion XL」では、従来版と比較してより短いキーワードで精細な画像生成が可能です。

従来モデルから大幅に進化

文字から文字を生成する対話型AI「ChatGPT」や「Google Bard」とあわせて、文字から画像を生成する「画像生成AI」にも注目が集まっています。

ChatGPTやBardに質問（指示文）を投げかけると、まるで人間のように自然な文章で回答が生成されます。それと同じように、画像生成AIはテキストで伝えたイメージを、まるで人間が描いたような画像として描画するのが特徴です。

画像生成AIのサービスは次々と登場しており、生成される画像は本当に人間が描いたイラスト、もしくは写真のような仕上がりとなり、とても自動的に生成されたとは思えないレベルにまで達しています。

そうした画像生成AIの中で、本記事で紹介するのが「Stable Diffusion XL」（ステイブル・ディフュージョン・エックスエル：SDXL）です。複雑なパターンや特徴を学習する能力の指標となるパラメータ数は23億とされ、従来モデル（Stable Diffusion 2.1）よりも短いキーワードで詳細な画像や構図の生成が可能になったと公表されています。

まずはその実力を見てください。以下はStable Diffusion XLに「Cute cat at home」（家にいるかわいい猫）というキーワードを与え、生成した画像です。

Stable Diffusion XLで「Cute cat at home」（家にいるかわいい猫）の画像を生成しました。パッと見では写真のように見えます。

このレベルの画像が自動生成できてしまうとは驚きです。Stable Diffusion XLは、公開元のStability AI社のWebサービスである「DreamStudio」のほか、子会社であるInit ML社のWebサイト「Clipdrop」でデモ版を試すことができます。

DreamStudioではアカウントの作成が必要になるため、本記事ではログイン不要のClipdropで、Stable Diffusion XLを試す方法を紹介します。

Stable Diffusion XLのデモ版

DreamStudio
Clipdrop

目次

Stable Diffusion XLで画像を生成する
Clipdropのツールで画像を加工する
英語のキーワード作成に便利な「DeepL翻訳」

動画で操作方法を見る

※BGMが流れます。音量にご注意ください。

Stable Diffusion XLで画像を生成する

1キーワードと画像のスタイルを指定する

Clipdropのサイトにアクセスすると、Stable Diffusion XLのキーワード入力欄が表示されるので、キーワードを入力しましょう。ここでは例として「Cute cat at home」（家にいるかわいい猫）と入力しました。生成する画像のスタイルも指定可能で、ここで［Photographic］を選択しました。［Generate］をクリックします。