「FLUX.1(フラックス)」は高度な画像生成AI!Stable Diffusionとの違いや使い方を解説

a.matsuzaki
記事内に広告を含む場合があります
このエントリーをはてなブックマークに追加

FLUX.1は、Stable Diffusionの開発者たちが設立した「Black Forest Labs」が開発した画期的な画像生成AIモデルです。

複雑なスクリプトに対する高精度な再現性や、画像内における文字表示の正確さが大きな特徴です。

特に、人の指の形状や本数といったこれまでのAIが苦手としてきた細部も、驚異的な精度で描写します。

本記事では、FLUX.1の特徴や使い方、料金について分かりやすく解説します。

【PR】

FLUX.1とは

画像引用:https://blackforestlabs.ai/

FLUX.1(フラックス)は、Stable Diffusionを開発した人たちによって設立された「Black Forest Labs」が開発した、高性能の画像生成AIサービスです。

これまで、画像生成AIとして性能トップと言われていたMidjourneyを超えるほどの高い評価を受けています。

モデルによっては、Stable Diffusionと同様のオープンソースとなっており、ローカル環境での利用が可能です。

写真のようにリアリティがあり緻密な描写が可能です。光の反射や髪の毛の質など、細部まで丁寧に表現できるのが特徴です。従来の画像生成AIは、人間の指や手の形状や構造物の描写など、さまざまな点で不自然さが残っていましたが、FLUX.1ではこのような不自然さを感じさせません。

API経由またはローカル環境での利用が可能です。

また、2024年8月からは、X(旧Twitter)のGrok-2にFLUX.1が統合されています。

FLUX.1は日本語で利用できる?

FLUX.1は現時点では日本語には対応していません。プロンプト入力についても、英語で行う必要があります。

なお、X(旧Twitter)に搭載されているものについては、日本語のプロンプトが利用できます。

また、画像内に表示可能な文字表記も基本的にアルファベットのみで日本語には対応していない点は把握しておきましょう。

FLUX.1のモデル別料金

FLUX.1は用途やニーズの異なる3つのモデルがあります。それぞれの概要は次の通りです。

モデル基本料金概要商用利用提供プラットフォーム
Schnell無料個人利用・開発向けモデル。3タイプの中で最速Hugging Face、GitHub、Replicate、fal.ai、mystic、deepinfra
Dev無料Proモデルに次いで高品質。原則として非商用ライセンス要問合せHugging Face、Replicate、fal.ai、mystic、deepinfra、hyperbolic
Pro約0.05ドル/1枚最高性能モデルReplicate、fal.ai、mystic

FLUX.1の料金は、利用方法とモデルによって異なります。

Proモデルを利用する場合は、画像1枚あたり約0.05ドル(約8円)かかります。Dev、Schnellについては、オープンソースとして公開されており、ローカル環境で使用する場合は無料で利用可能です。

なお、オンラインサービスを通して利用する場合、プラットフォームによって料金は異なります。

FLUX.1の特徴

FLUX.1は従来の画像生成AIと比較すると、かなり高性能です。ここでは、主な特徴を3つ見ていきましょう。

高品質な画像生成

FLUX.1は120億のパラメータを持つ大規模モデルです。Stable Diffusion XLのパラメータは35億ですので、桁違いに多いことが分かります。そのため、非常にリアルで高品質な画像を生成できます。

特に、自然な光と影の表現が際立ち、細部まで鮮明に描くことが可能です。

プロンプトに忠実

複雑なプロンプトにも忠実に応答します。従来のモデルでは、長いプロンプトに対応する際に内容が反映されにくい問題がありましたが、FLUX.1は詳細な指示に基づいて正確な画像を生成します。

リアルな描写

FLUX.1は、解剖学的に正確な画像を生成する能力に優れています。人体などを細部までリアルに再現するため、自然で違和感のない描写が可能です。

FLUX.1の使い方

FLUX.1の利用方法はモデルによって異なります。

Proモデルは、APIベースのプラットフォームで利用できます。Dev、Schnell

のほか、ここでは、その中から代表的なものを紹介します。

Proモデル

特に高性能なProモデルを使う場合は、APIベースのプラットフォームを利用するのがおすすめです。

今回は、Repicateでの使い方について解説します。

Repicateを利用するには、GitHubとの連携が必要です。ここでは、GitHubの登録方法を含めた手順を紹介します。

引用元:https://replicate.com/black-forest-labs/flux-pro

1.GitHubにサインイン

Replicateを利用するには、GitHubへのサインインが必要です。

GitHubのアカウントを作成していない場合は、GitHubの公式ページでメールアドレス・パスワード・ユーザーネームなどを入力し、アカウントを作成しましょう。

必要事項を入力の都度、Continue(続く)をクリックすると次の項目が開きます。

・Enter your email(メールアドレス入力)
・Create a password(パスワードを作る):15文字以上、または英数込みで8文字以上
・Enter a username(ユーザーネーム入力)
・Email preferences(メール設定):お知らせを受け取る場合、チェックを入れる

画面の指示に従い、順番に入力していきましょう。

認証が終わると、メールアドレス宛にローンチのためのコードが送信されます。コードを入力すると、GitHubの登録が完了です。

2.GitHubと連携する

Replicateと連携するには、公式サイトトップ画面の下にある「Sign in with GitHub」をクリックします。

3.決済情報の登録

Replicateでの画像生成は有料で、下記の金額がかかります。

引用元:https://replicate.com/black-forest-labs/flux-pro

画像1枚当たり$0.055または、画像18枚で$1です。無料プランや無料トライアルはありません。

そのため、使用する際は必ずクレジットカードの情報登録が必要です。

クレジットカードの登録方法は次の通りです。

画面下の「Manage billing」をクリックします。

「Set up billing」をクリックすると、下記の画面が開きます。

GPayまたはカード情報などの決済情報を選択し、必要事項を入力しましょう。

クレジットカードを使う場合は最後に「カードを保存」をクリックすると完了です。

使いすぎが心配といった場合には、事前に一か月の上限額を決めることが可能です。

Account Settings の、「Spend limit」欄(上記画像の赤枠)で上限額を設定しましょう。

Dev・Schnellモデル

Dev、Schnellはオープンソースとして公開されています。そのため、プラットフォームだけでなく、ローカル環境やGoogle Colab上での利用も可能です。

ローカル環境で利用する場合は、無料で利用できるのがメリットです。

Hugging FaceやGitHubからアクセスし、モデルをダウンロードしましょう。

URL
Hugging Face【FLUX.1-schnell】https://huggingface.co/black-forest-labs/FLUX.1-schnell
Huuging Face【FLUX.1-dev】https://huggingface.co/black-forest-labs/FLUX.1-dev/
GitHub https://github.com/black-forest-labs/flux

FLUX.1はX(旧Twitter)でも使える

FLUX.1を手軽に試したい方は、X(旧Twitter)での利用も検討してみましょう。

なお、現段階(2024年9月)でFLUX.1が使用できるのは、X PremiumおよびPremium+に加入しているアカウントのみとなります。

1.Xの有料アカウントに登録

2.Grokを開く

3.チャットを使って生成

Grokを使う場合は、日本語のプロンプトに対応しています。

ただし、サイズは横長(1024 x 768ピクセル)のみの対応です。

FLUX.1で実際に生成した画像例

FLUX.1で実際に生成した画像を紹介します。

なお、プロンプトは日本語で作ったものを、ChatGPT4oで英語にして使っています。

カフェでコーヒーを飲む女性

髪の毛一本一歩までリアルな画像が生成できました。また、コーヒーカップには「FLUX.1」と書かれており、指の形や光の当たり具合に不自然さを感じさせません。

【日本語プロンプト】
女性がカフェでコーヒーを飲んでいる。そのコーヒーカップには「FLUX.1」と書いてある。

この日本語を基に、ChatGPTで英語プロンプトを生成しました。

【英語プロンプト】
A woman is sitting in a cozy cafe, casually enjoying her coffee. She holds a stylish coffee cup with the words ‘FLUX.1’ clearly printed on it. The cafe has warm lighting and a relaxed atmosphere with wooden furniture. The woman is smiling softly, dressed in modern, casual clothing, and her table has a small vase with a flower. Through the large windows, soft sunlight illuminates the scene.

ファンタジー要素を含んだ画像

ファンタジー要素が含まれた画像もリアルに生成できました。このプロンプトにはあえて、多くの詳細を詰め込んでいますが、多くの要素を含んだ画像が生成できました。

【日本語プロンプト】
夕暮れ時のスチームパンク風の都市景観。建物にはそびえ立つ機械構造や歯車が見えます。前景には、ビクトリア朝風の服装とシルクハットを身に着けた若い女性が浮遊するプラットフォームの上に立っています。彼女は片手に光り輝く未来的なオーブを持ち、もう片方の手は肩に止まった機械の鳥に触れています。空には、エアシップや熱気球が浮かんでおり、すべてが夕日の柔らかなオレンジ色の光に照らされています。背景には、巨大な時計塔があり、複雑に動くパーツと蒸気が立ち上っています。シーン全体は、温かい夕焼けの色合いと冷たい影が混ざり合い、建物や機械の金属面に反射しています。
【英語プロンプト】
A steampunk-style cityscape at twilight, with towering mechanical structures, gears, and cogs visible on the buildings. In the foreground, a young woman wearing Victorian-era clothing and a top hat is standing on a floating platform. She is holding a glowing, futuristic orb in one hand while her other hand rests on a mechanical bird perched on her shoulder. The sky is filled with airships and hot air balloons, all illuminated by the soft, orange glow of the setting sun. In the background, a massive clock tower with intricate, moving parts is visible, with steam rising from its base. The scene is bathed in a mix of warm sunset colors and cool shadows, with reflections glinting off the metallic surfaces of the buildings and machines.

ニューヨークタイムズに掲載される恐竜

画像にはニューヨークタイムズのロゴが入っています。また、ニューヨークの街並みに現れた恐竜が生成できました。

【日本語プロンプト】
ニューヨークに現れた恐竜がニューヨークタイムズに掲載される
【英語プロンプト】
A towering dinosaur is walking through the busy streets of New York City, appearing as if it’s part of the front page of The New York Times. The dinosaur is detailed and realistic, blending into the urban environment with tall buildings, traffic, and people around it. The newspaper headline at the top clearly reads ‘The New York Times,’ and the dinosaur’s image is strikingly prominent, with the cityscape serving as a backdrop. The scene has a surreal, yet realistic feel, as if the dinosaur is part of modern-day New York.

FLUX.1で生成できないコンテンツについて

知的財産権侵害、法律違反、他者のプライバシーを侵害、性的に露骨、暴力的なもの、倫理的に問題のあるコンテンツなどの生成は規約によって禁じられています。

詳しくは、FLUX TERMS OF SERVICEでご確認ください。

FLUX.1で生成したコンテンツの商用利用について

商用利用の可否はモデルによって異なります。ProおよびSchnellで生成した場合は商用利用が可能です。

Devは、非商用モデルであり商用には使えない点を把握しておきましょう。商用利用を希望する場合は、会社にライセンス申請が必要です。

ライセンス申請について、詳しくはHugging Faceのガイダンスに記載されています。

FLUX.1は安全?運営元は?

FLUX.1はStable Diffusionの開発者たちが設立したBlack Forest Labsが開発・提供しています。

特に、Schell、Devはオープンソースとして公開されており、ユーザーのプライバシーへの配慮が伝わります。また、商用利用と非商用利用を明確に区別している点からも、透明性と誠実さを重視した運営姿勢がうかがえます。

Q&A

Q.FLUX.1はスマホで利用できる?

はい。X(旧Twitter)のサービスなどを利用すると、スマホでも簡単に画像生成が可能です。

Q.日本語で利用できる?

FLUX.1は英語のプロンプトが適しています。ただし、Xを利用する場合は、日本語プロンプトで画像を生成できます。

Q.FLUX.1は無料で利用できる?

Dev、Schnellモデルは、オープンソースとして公開されており、無料で利用することも可能です。

Q.生成したFLUX.1は商用利用できる?

Pro、Schnellモデルで生成した画像は商用利用が可能です。Devモデルで生成したものは基本的には商用利用はできません。ライセンス申請が必要です。

まとめ

FLUX.1は、Stable Diffusionの元開発者たちが開発した、高性能の画像生成AIサービスです。

写真のようなリアリティのある緻密な画像が生成できるのが特徴です。また、アルファベットを画像内に正確に表示させることができます。

3タイプあり、Dev、Schnellモデルはオープンソースが公開されており、ローカル環境での利用が可能です。

最高性能のProモデルはオープンソースはありません。公式が紹介しているプラットフォームなどを利用して、高品質な画像を生成してみてはいかがでしょうか。

※本記事は、2024年9月時点の情報に基づいています。

サービス内容や料金は変更される可能性がありますので、詳細は公式サイトでご確認ください。

このエントリーをはてなブックマークに追加
記事URLをコピーしました