全ての記事

「Stable Diffusion(ステイブル・ディフュージョン)」の使い方や料金を徹底解説!無料版はある?日本語での利用は?

tsukasa
記事内に商品プロモーションを含む場合があります
このエントリーをはてなブックマークに追加

『Stable Diffusion』は、オープンソースの画像生成AIツールで、クリエイティブな分野で活動するプロフェッショナルからアート作成に興味がある一般ユーザーまで、幅広い層に適しています。

このツールの特徴は、自然で高品質な画像をテキストや画像から生成できる柔軟性にあります。

さらに、Stable Diffusionは商業利用が可能で、さまざまなカスタマイズが行える点も魅力の一つです。

この記事では、Stable Diffusionの主要な機能、使い方、およびそれを利用するための技術的要件や料金体制について、初心者でも理解しやすいように詳しく説明しています。

Stable Diffusionの使用を検討している方は、ぜひこの記事を参考にしてください。

【PR】

Stable Diffusionとは

引用:https://ja.stability.ai/

「Stable Diffusion」は、2022年にStability AIによって公開されたオープンソースのAI画像生成ツールです。

ユーザーがテキストプロンプト(命令分)を入力すると、Stable Diffusioはそれに基づいて様々な画像を生成します。

例えば、「森林の中の幻想的な城」と入力すると、そのイメージに合った画像を自動で作り出します。

Webアプリとしても、ローカル環境での利用も可能で、ユーザーは自分の好みや必要に応じて利用形態を選べます。

Webアプリを使用する場合は簡単にアクセスできる利点がありますが、ローカルで使用する場合、Webアプリで利用する場合に比べてより高度なカスタマイズや制御が可能になります。

Stable Diffusionで生成した画像

Stable Diffusionを用いると、プロンプトやLoRAを駆使して、リアルな風景画像からアニメ風の美少女画像、漫画のようなイラストまで、多種多様なジャンルの画像を自由自在に生成することができます。

アダルトな画像(NSFW)も生成が可能なため、AIグラビアなどを作成することもできます。

Stable Diffusionについて学べる書籍

引用:0からはじめるStable Diffusion(Amazon)

この本は、画像生成に関心はあるものの、今までなかなか上手くいかなかった方や、そもそもどう始めたらいいのかわからない初心者向けに、Stable Diffusionの使い方をイチから学べるガイドブックです。

本書では、Stable Diffusionを活用して、まるで本物のようにリアルな画像や、愛らしいアニメ風の美少女キャラクターを作り出す方法を、図解入りで分かりやすく説明しています。

Google Colabを利用することにより、高性能なパソコンがない方でも、誰でも画像生成を楽しめるようになる方法が紹介されているのも特徴の一つです

技術的な部分でつまずいてしまった人、美しい画像を作りたいけれどどう進めればいいのか分からない人、または高スペックのPCを持っていないけれど画像生成を試してみたいと考えている人におすすめです!

Stable Diffusionが使えるWebアプリ

ここでは、Stable Diffusionが使えるWebアプリの中から、3つを紹介します。

①Hugging Face

グラフィカル ユーザー インターフェイス, アプリケーション, メール

自動的に生成された説明

Hugging Faceは、機械学習のモデルやデータセットを共有するプラットフォームです。 

Stable DiffusionのモデルもHugging Faceに公開されており、Webブラウザから直接アクセスできます。 

手軽にStable Diffusion を使ってみたい方は、Hugging Face上で公開されているデータセット「Stable Diffusion 2.1 Demo」にアクセスしてみてください。

プロンプトを入力するだけで、生成された画像をプレビューできます。

アクセスすると以下の画面が表示されますので、画面上部の「Enter your prompt」と表示されているテキストボックスに、好きなプロンプトを打ち込み、「Generate Image」ボタンをクリックしましょう。

グラフィカル ユーザー インターフェイス, テキスト, アプリケーション, メール

自動的に生成された説明

「white cat jumping」とプロンプトに入力して実行したところ、以下のように白い猫がジャンプしている画像が生成されました。

猫, 動物, 哺乳類, 飼い猫 が含まれている画像

自動的に生成された説明

また、Hugging Faceでは、モデルの詳細やコードも閲覧できます。

②Dream Studio

Dream Studioは、画像生成AIを使って、オリジナルのイラストやアニメを作成できるWebアプリです。 

Stable DiffusionのモデルもDream Studioに組み込まれており、テキストからイラストやアニメを生成できます。

グラフィカル ユーザー インターフェイス, アプリケーション

自動的に生成された説明

生成する画像のスタイルを選んで画像のテイストを決めることもでき、とても手軽に希望するスタイルの画像が生成できます。

以下はプロンプトに「white cat jumping」と入力して、スタイルに「Anime」を選んだ場合と「Photographic」を選んだ時の生成画像の違いです。

モニター画面に映る猫の写真のコラージュ

中程度の精度で自動的に生成された説明

生成した画像は、編集や保存もできます。 また、他のユーザーが生成した画像も見ることができます。

③Mage.space

Mage.spaceは、テキストを入力するだけで画像を生成できる、シンプルな使い心地のWebアプリです。 

入力欄にプロンプトを入力した後、右側のオレンジの矢印ボタンをクリックするだけで画像が完成します。

以下は「white cat jumping」を入力した後の生成画像です。

テレビの画面のスクリーンショット

自動的に生成された説明

生成した画像をもう一度作り直すこともできます。

以下は、上記の状態から「Reimage」ボタンをクリックした後の状態です。

テレビの画面のスクリーンショット

自動的に生成された説明

Stable DiffusionのモデルもMage.spaceに利用されており、テキストから人物や動物、風景などの画像を生成できます。

生成した画像は、ストーリーの一部として保存できます。

また、他のユーザーが作成したストーリーも読むことができます。

Stable Diffusionで生成できる画像

Stable Diffusionは、テキストを基に様々な画像を生成できるAIモデルです。

ここでは、Stable Diffusionで生成された画像の例を3つ紹介します。

リアルな風景のような画像

プロンプトに「夕日が沈む海岸」と入力した結果、水平線に沈む太陽や波打ち際の砂浜が表現されたリアルな風景画像が生成されます。

この画像は、自然の美しさを捉えたかのようなリアリズムに溢れています。

テレビゲームの画面のスクリーンショット

低い精度で自動的に生成された説明

アニメ風の美少女画像

「青い髪の女の子が笑顔でカメラを見る」というプロンプトからは、青い髪と瞳を持つアニメ風の美少女が描かれた画像が生み出されます。

この画像は、アニメファンに特に魅力的なビジュアルを提供します。

 青い髪や瞳など、アニメ風の美少女が描かれています。

漫画のような画像

「剣を持った勇者がドラゴンと戦う」というプロンプトによって、剣を振りかざす勇者と炎を吐くドラゴンが描かれた漫画のような画像が生成されます。

Stable Diffusionは日本語で使える?

Stable Diffusionは、基本的に英語で使うことを想定されていますが、日本語でも使うことも可能です。

ただし、日本語で使う場合には、英語よりも精度が低い場合があります。

Stable Diffusionの料金

Stable Diffusionはローカル環境で利用する場合は全機能を無料で使用できますが、Webアプリを利用する場合には、それぞれのアプリごとに料金体系が異なります。

Dream Studioでは従量課金制が採用されており、アカウント作成時には25クレジット(画像100枚分)が付与され、Stable Diffusionの全機能を利用できます。

Mage spaceにはいくつかのプランがあります。フリープランでは無料で利用できますが、使用できるモデル数に制限があります。

スタンダードプランでは月額8ドルで160以上のモデルを使用でき、プロプランでは月額15ドルでより高速な画像生成が可能になり、さらにプロ+プランでは月額30ドルでカスタムモデルのインポートが可能です。

Stable Diffusionの機能

Stable DiffusionのWebUIの基本的な機能を順番に説明します。

txt2img(プロンプトから画像生成する方法)

txt2imgはテキストから画像を生成する機能です。

この機能を使えば、「25歳のアイドルのような顔立ちの日本人女性」のような簡単な指示から画像を生成することができます。

プロンプトには日本語や英語など、任意の言語を使用することが可能です。

さらに、複数のプロンプトを組み合わせることで、一つの画像に複数の要素を取り入れたり、より詳細な指定をすることもできます。

img2img

img2imgは画像から別の画像を生成する機能です。

例として、顔写真をアップロードすれば、似たような別の人物の顔写真を生成することが可能です。

さらに、画像にテキストを追加して、画像を変更したり、特定のスタイルに変換することもできます。

例えば、「髪の毛の色を赤くして」とテキストを入力すると、その指示に従った画像が生成されます。

PNG info

PNG infoを使用すると、画像に含まれる情報を取得できます。

特に、自動生成した画像の生成に使われたプロンプトを知りたいときに便利です。

例えば、Civitaiなどのプラットフォームに投稿された画像から、お気に入りの画像がある場合、PNG infoを使ってその画像がどのようなプロンプトで生成されたのかを確認できます。

自分自身でプロンプトを試行錯誤しているがうまくいかない時には、他の人が生成した画像のプロンプトを参考にするのも一つの方法です。

Checkpoint Merger

モデル(チェックポイント)をマージする機能です。

お気に入りのモデルがあり、ライセンス的に問題がなければ、統合して新しいモデルを作成するのもOKです。

テレビゲームの画面のスクリーンショット

中程度の精度で自動的に生成された説明

モデルの統合には少々時間がかかりますが、統合後は画面左上のモデルに表示され、選択できるようになります。

グラフィカル ユーザー インターフェイス, アプリケーション

自動的に生成された説明

以下は、マージしたモデルを使用して画像生成した例です。

生成した画像の商用利用について

Stable Diffusionは商用利用可能な画像生成AIですが、使用するモデルのライセンスやコンテンツの性質によっては制限があります。

法律に違反する内容や人に危害を加える内容の生成は禁止されています。商用利用する際は、使用するモデルのライセンスを確認し、無断でダウンロードした画像や既存のブランド、商標に関連する画像の生成は避けるべきです。

つまり、Stable Diffusionで生成した画像は基本的には商用利用が可能ですが、商用利用を考えている方は、事前に利用するモデルや取り込む画像などの著作権やライセンスについて確認することを推奨します。

他の画像生成AIとの比較

製品名ランニングコスト操作性自由度商用利用
Stable Diffusion無料複雑高い基本的に可能(使用するモデルのライセンスなどに注意)
Midjourney有料(月6ドル~120ドル)シンプル低い可能
Image Creator from Designer無料(画像生成を早くしたい場合は課金が必要)シンプル低い不明(不可能と考える方がよい)
画像生成AIの比較

画像生成AIとしては、Stable Diffusionの他にMidjourneyやImage Creator from Designer(旧:Bing Image Creator)などが知られています。

ここでは、これらの画像生成AIとStable Diffusionの違いを見てみましょう。

まず、Stable Diffusionは、ユーザーはテキストや既存の画像を用いて画像内容を指定することで、指定に基づいたが画像を生成が可能です。

Stable Diffusionの最大の特徴はオープンソースであり、無料で利用可能である点、そして生成した画像を基本的に商用利用できる点です。

加えて、モデルやパラメータの自由な調整により、高い自由度の画像生成が可能です。

ただし、モデルやパラメータの設定には専門知識が求められ、画像生成に時間がかかる場合があります。

一方で、MidjourneyやImage Creator from Designerは利用が手軽な画像生成AIです。

どちらもテキスト入力から簡単に画像を生成でき、ウェブサイトやアプリを通じてアクセス可能です。

しかし、Image Creator from Designerで生成した画像の商用利用には注意が必要で、Midjourneyは無料プランがなく、利用には料金がかかります。

また、これらのサービスはStable Diffusionに比べ自由度が低めです。

つまり、手軽に始めたい場合はMidjourneyやImage Creator from Designerが適していますが、より本格的でカスタマイズ性を求めるならStable Diffusionがおすすめです

Q&A

Q.Stable Diffusionはスマホで利用できる?

Stable Diffusionのスマホアプリはありませんが、ブラウザアプリでWebアプリに直接アクセスすることでスマホでもPC版と変わらずに画像生成することが可能です。

Q.日本語で利用できる?

Stable Diffusionは日本語に対応しており、プロンプトも全て日本語で入力することが可能です

Q.無料で利用できる?

Stable Diffusionはオープンソースのためローカルで動かす場合には無料で利用可能です。

Q.生成した画像は商用利用できる?

Stable Diffusionは商用利用可能な画像生成AIですが、使用するモデルのライセンスやコンテンツの性質によっては制限があります。

Q. AIグラビアって作れる?

はい、作れます。

Beautiful Realistic Asians(BRA)などのモデルを使い、作りたい画像のプロンプトを入力することでリアルな美しい女性の画像を生成できます。

ただし理想の画像を作るにはモデルやLoRAの選択、プロンプトの作り込みが必要となります。

まとめ

この記事では、オープンソース画像生成AIツールである「Stable Diffusion」の特徴、使い方、料金体系、安全性について詳しく解説しています。

Stable Diffusionは、テキストや画像から高品質な画像を生成するAI機能を備えており、様々なカスタマイズが可能です。

オープンソースであるため、広く利用が可能で、商用利用もできる点が大きなメリットです。

このツールは、デザイナーやクリエイターだけでなく、幅広いユーザーにとって価値あるリソースとなり得ます。また、無料で利用できるので、多くの人が手軽に高品質な画像生成を体験できます。

これから利用しようと思っている方はぜひこちらの記事を参考にしてみてください!

このエントリーをはてなブックマークに追加
ABOUT ME
つかさ
つかさ
ChatGPT×ビジネス
データサイエンティストがChatGPTを活用する方法を発信中|データサイエンティスト歴5年|ゲーム会社→フリーランス(現在)|データサイエンティストのためのChatGPTメディア「GPT研究所 データサイエンス支部」運営者
記事URLをコピーしました