Stable diffusion 人気モデルのAnything系を徹底比較!秘密が明らかに!!

AI is in wonderland
16 May 202318:10

TLDRこの動画では、Stable Diffusionの人気モデルであるAnything系のV3, V4, V4.5, V5の4種類を徹底比較しています。これらのモデルはそれぞれ異なる作者によって開発され、異なる画風を提供しています。紹介された拡張機能を通じて、プロンプトの入力が容易になり、タグのオートコンプリートが提案されます。また、プロンプトの傾向を可視化するプログラムについても説明され、その使用方法が詳述されています。さらに、XYZプロットを使用して、各モデルとネガティブエンベッティングの比較を行い、体操をしている女の子の画像を例にしています。結果として、V3とV5は同じ系列で、青みが強い特徴がありますが、V4.5は柔らかい感じがします。また、イージーネガティブV2は、顔の光り方や表情を豊かに捉えています。最後に、視聴者が自分の好みに応じたモデルを選ぶことを促し、チャンネル登録とコメントでのフィードバックを呼びかけています。

Takeaways

  • 🎨 エニシングシリーズの異なるバージョン(V3, V4, V4.5, V5)を比較し、それぞれの特徴を分析しました。
  • 🖌️ V3とV5は同じシリーズで、青みが強く、輪郭がはっきりしています。
  • 🎭 V4.5は柔らかい感じで、輪郭線が細く、色合いが淡く、夢見がちな印象を与えます。
  • 🤖 V4.5とブイヨンは同じ作者によるとされていますが、V3との違いは明らかです。
  • 🌐 拡張機能を使って、プロンプトを書く際に楽しんで、候補の単語を知ることができます。
  • 📈 プロンプトの傾向を可視化するプログラムを使用し、公開されているプロンプトから学ぶことができます。
  • 📸 XYZプロットを使って、モデルの異なるバージョンを視覚的に比較しました。
  • 🔍 ネガティブエンベッディングの比較で、イージーネガティブとディープネガティブの絵の違いが明らかになりました。
  • 🖼️ 高解像度を使用し、画像のアップスケールを行い、より細かな比較ができました。
  • 🎨 エニシングv4.5とイージーネガティブV2が、個人的に好まれた組み合わせでした。
  • 📝 動画では、プロンプトの構成や拡張機能の活用方法について詳しく説明し、視聴者が理解しやすいように配慮しています。

Q & A

  • どのような拡張機能を使用してダンボールタグを検索することが可能になりますか?

    -ブールタグオートコンプレッションプロンプティングという拡張機能を使用することで、ダンボールタグを検索することが可能になります。

  • イージーネガティブとディープネガティブの間には何が違いますか?

    -イージーネガティブとディープネガティブの間には、顔の塗り方と表情の表現に違いがあります。ディープネガティブはベタ塗りで顔の光をあまり表現しないのに対して、イージーネガティブは顔の光り、頬の赤み、表情などを絵に取り入れています。

  • anything系のV3、V4、V4.5、V5のそれぞれの特徴は何ですか?

    -V3は青みが強く、線がはっきりしています。V4.5は柔らかい感じで輪郭線が細く、色合いが淡くなっています。V5は全体的に明るく、青みが強い特徴があります。V3とV5は漫画やアニメ風のイラストでよく見られる輪郭が強く色彩が強い特徴を持っていますが、V4.5はより柔らかい夢見がちな印象を与えるような絵を作ります。

  • プロンプトの傾向を可視化する方法として、どのようなプログラムを使用しましたか?

    -プロンプトの傾向を可視化するために、チャットGPTフォーさんから提供されたプログラムを使用しました。このプログラムは、公開されているプロンプトから傾向を簡単に分析し、グラフで可視化することができます。

  • XYZプロットを使用する際の注意点は何ですか?

    -XYZプロットを使用する際には、モデルごとに改行されていないため、慎重に選択する必要があります。また、シード値をずらして比較したい場合は、キープマイナス1フォーシーズにチェックを入れることで、それぞれの絵でシード値をずらすことができます。

  • 動画で説明されている拡張機能をインストールする際のエラーが発生した場合、どのように対処しましたか?

    -エラーが発生した場合は、UIを再起動してから再度インストールを試みます。それでも問題が解決しない場合は、エラーの内容を確認し、適切な対処を行う必要があります。

  • イージーネガティブV2とイージーネガティブの間には何が違いますか?

    -イージーネガティブV2とイージーネガティブは全体的に似ていますが、V2の方がやや暗めの光を採用している印象があります。また、背景の描写においても違いがあり、V2では細かく細い筆で描いたような描写で、イージーネガティブの方は太めの筆でややぼかしている感じがします。

  • 動画で使用されたプロンプトは何ですか?

    -動画で使用されたプロンプトは、「マスターピースベストクオリティワ1ガールジムユニフォームスパークリングアイズアウトドアズサライト」です。

  • 動画で説明されているXYZプロットの使用方法について、具体的な手順を教えてください。

    -XYZプロットを使用するには、まずXタイプのところからチェックポイントネームを選択し、使用しないモデルを削除します。次にYタイプのところでプロンプトSスラッシュRを選択し、指定したプロンプトを一つずつ置き換える指示を入力します。シード値をずらしたい場合は、キープマイナス1フォーシーズにチェックを入れます。最後にジェネレートを押して画像を生成します。

  • 動画で説明されているプロンプトの可視化プログラムの導入方法はどのようにですか?

    -プロンプトの可視化プログラムを導入するには、まず「知りたい」のページから公開されているプロンプトをコピーし、Windowsのメモ帳アプリに貼り付けます。次にGoogleコラボを開いて新規ファイルを作成し、概要欄にあるプログラムを貼り付けて実行します。

  • 動画で使用されたXYZプロットの目的は何ですか?

    -XYZプロットは、anything系のV3、V4、V4.5、V5などのモデルを比較し、それぞれのモデルで生成された画像の差異を可視化する目的で使用されました。また、イージーネガティブV2、イージーネガティブ、ディープネガティブなどのネガティブエンベッティングを比較する際にも使用されました。

Outlines

00:00

🎼 Introduction to Art Style Comparisons and Extension Features

The assistant, Alice, greets the audience and expresses her enthusiasm for exploring different art styles within the 'anything' series, which includes V3, V4, v4.5, and V5 versions. She clarifies the authorship differences among the versions and mentions rumors about V3's successor, V4.5. Alice also discusses a browser extension that suggests 'ダンボール' (cardboard) tags without needing to visit the specific website. She guides the audience through installing and using the extension, adjusting settings for the number of suggested tags, and encountering an error during the process. The summary also includes a method for visualizing the trends of prompts used by others, which involves using a provided program and uploading a text file to Google Colab.

05:02

📈 XYZ Plot Analysis of Art Styles and Negative Embellishments

Alice transitions to the main topic of comparing the art styles of the 'anything' series using an XYZ plot. She describes the process of setting up the plot, selecting models, and adjusting prompts for negative embellishments, including Easy Negative, Easy Negative V2, and Deep Negative. The assistant provides a step-by-step guide on how to input the prompts and settings for generating images, including choosing a high-resolution upscale tool and selecting a sampling method. She also explains how to view the generated images and discusses the differences observed in the generated art, highlighting the distinct characteristics of each version and negative embellishment.

10:06

🖌️ Detailed Comparison of Generated Images and Preferences

Alice presents the generated images from the comparison and provides a detailed analysis of the differences between the models and negative embellishments. She observes that the Deep Negative versions tend to have a more expressionless and flat appearance, while the Easy Negative versions incorporate more details like facial highlights and blush. The assistant also notes the differences in background details and the overall vibrancy of the images. She expresses her personal preference for the Easy Negative V2 with the V4.5 model, but encourages viewers to explore and find their own preferences. Alice concludes by thanking the audience for watching and inviting them to subscribe and like the video for more informative and enjoyable content.

15:07

🎉 Conclusion and Future Content Tease

In the final paragraph, Alice summarizes the content covered in the video and thanks the viewers for their attention. She emphasizes the enjoyment she finds in drawing and comparing art styles and invites viewers to share their preferences and suggestions for future video topics. Alice also encourages viewers to subscribe to the channel and use the like button to support the content. She bids farewell with a short movie showcasing the image comparisons and ends the video on a note of anticipation for future content.

Mindmap

Keywords

Stable diffusion

Stable diffusionは、画像生成のアルゴリズムの一種で、様々なスタイルの画像を生成することができます。このビデオでは、Stable diffusionの異なるバージョン間の画風の違いを比較しています。

Anything系

Anything系は、Stable diffusionのモデルの中で、特に多様なスタイルの画像を生成できるシリーズです。V3, V4, v4.5, V5の4種類が存在し、それぞれの特徴や画風に違いがあります。

ブイヨン

ブイヨンは、Stable diffusionのモデルの一つで、特に自然な風景や物体を綺麗に表現することが知られています。ビデオでは、他のバージョンと比較してブイヨンの画風の特徴が解説されています。

ネガティブエンベッティング

ネガティブエンベッティングは、画像生成時に特定の要素を避ける指示です。ビデオでは、イージーネガティブ、イージーネガティブV2、ディープネガティブの3つの種類を比較しています。

XYZプロット

XYZプロットは、画像生成アルゴリズムで使用される手法で、異なるパラメータを用いて画像を生成し、比較することができます。ビデオでは、これを用いてモデル同士の画風の違いを可視化しています。

ハイレゾ

ハイレゾは、画像の解像度を上げるプロセスです。ビデオでは、Stable diffusionで生成された画像を2倍の解像度でアップスケールする手法が使用されています。

プロンプト

プロンプトは、画像生成アルゴリズムに入力するテキストで、生成される画像のスタイルや内容を指示します。ビデオでは、プロンプトの書き方や効果、そしてその傾向を分析しています。

タグオートコンプリート

タグオートコンプリートは、プロンプト入力時に使用される機能で、入力された一部分のタグを自動的に完成させるものです。ビデオでは、この機能を使ってプロンプト入力を効率化する方法が紹介されています。

イージーネガティブV2

イージーネガティブV2は、ネガティブエンベッティングの一種で、生成される画像から不要な要素を除外する効果があります。ビデオでは、他のバージョンと比較してその特徴が説明されています。

RDSR

RDSRは、画像のアップスケールに使用される手法で、Stable diffusionで生成された画像を高解像度に変換します。ビデオでは、RDSRを用いて画像をアップスケールするプロセスが説明されています。

WEBUI

WEBUIは、Webベースのユーザーインターフェースの略で、Stable diffusionの操作を簡易化したウェブインターフェースです。ビデオでは、WEBUIを使用して画像生成プロセスを実行する方法が紹介されています。

Highlights

比較対象のStable DiffusionのAnything系モデルはV3, V4, v4.5, V5の4種類あります。

ブイヨンとv4.5は同じ作者によるが、V3とV5は異なる作者によるとされています。

V3の後継モデルはブイゴとされていますが、正確な情報は不明です。

拡張機能を使って、ウェブサイトでタグを検索することが不要になりました。

オートマティックイレブンイレブン拡張機能を使って、タグのオートコンプリートを有効にできます。

プロンプトランに文字を入力すると、提案されたタグが表示されます。

初期設定では5つのワードが提案されますが、設定で最大数を増やせます。

プロンプトの傾向を可視化するプログラムが提供されています。

Googleコラボを使用して、プロンプトの分析を行うことができます。

XYZプロットを使って、異なるモデルの出力結果を比較することができます。

ネガティブエンベッディングとしてイージーネガティブ、イージーネガティブV2、ディープネガティブの3つの比較が行われます。

比較の際には、シード値を固定することで同じ結果を再現できます。

イージーネガティブ系は顔の光りや表情を豊かに表現しているとされています。

イージーネガティブV2は背景の描写が細かく、全体的にビビッドな絵になる傾向があります。

V3とV5は青みが強く、輪郭がはっきりしている印象があります。

V4.5は輪郭が柔らかく、色合いが淡く、夢見がちな印象を与えるとされています。

V3, V5系は大きな奇形の発生頻度が高い傾向にありますが、新しいバージョンで改善が見られると述べています。

最終的には、個人の好みによって選ぶべきモデルであり、比較結果が参考になると結論づけています。