どこよりも詳しいAfter Detailer (adetailer)の使い方① 【Stable Diffusion】

AI is in wonderland
20 Jun 202318:41

TLDRこんにちは、会津院ワンダーランドのアシスタントアリスです。今日はStable Diffusionの重要な拡張機能であるADテイラーについて解説します。ADテイラーは、画像の顔や体の部分を自動的に検出し、マスクをかけることで綺麗に書き直して周囲となじませます。インストールはエクステンションタブから行い、様々な設定を通じて使いやすいです。モデルはV8NやV8Sなどがあり、検出方法の違いによって細かい違いがありますが、基本的にはV8Nを選択すれば良いでしょう。また、ADテイラーのプロンプト欄に何か入力すると、元のプロンプトの影響が消える可能性があるため、注意が必要です。表情の変化や細かい調整が得意で、非常に役立つ拡張機能です。詳しい設定については次回の動画で紹介しますので、お楽しみに!

Takeaways

  • 📚 ADテイラーはStable Diffusionの重要な拡張機能で、画像の顔や体の部分を自動的に検出し、綺麗に改善することができます。
  • 🔍 ADテイラーは複数のモデルを提供し、異なる検出方法と修復効果が存在します。
  • 🖼️ インストールはエクステンションタブから行い、特定のURLを通じて行われます。
  • 📈 ADテイラーを使用することで、解像度を上げるわけではないが、顔などの特定の部分を明確に変化させることができます。
  • 🎭 ADテイラーは表情の変化にも優れており、スマイルなどのプロンプトを追加することで、画像の表情を柔軟に変化させることができます。
  • 📝 プロンプト欄に特定の指示を入力することで、生成される画像のスタイルや特徴を細かく調整することが可能です。
  • 🔧 ADテイラーの設定は詳細にカスタマイズ可能で、マスクの適用、インペイント処理など、高度な操作も行えます。
  • 🚫 観客席のような複雑な画像では、注意深く調整し、必要と判断した部分だけを修復することが推奨されます。
  • ⏱️ ADテイラーを使用する際には、画像の複雑さに応じて時間がかかることに注意してください。
  • 🔄 ADテイラーのセッティングを変更する場合は、UIを再読込する必要があります。
  • 📈 高い検出精度を持つモデルを選ぶことで、より自然で細かな修復結果を得ることができます。

Q & A

  • ADテイラーとは何ですか?

    -ADテイラーは、Stable Diffusionの重要な拡張機能の一つで、画像の顔や体などの特定の部分を自動的に検出し、綺麗に改善することができるツールです。

  • ADテイラーをインストールするにはどうすればよいですか?

    -ADテイラーをインストールするには、エクステンションタブからインストールし、URLを指定してからインストールボタンを押します。その後、チェックアップデートを押して、アプライ&リスタートをクリックすると利用可能になります。

  • ADテイラーのモデルとは何ですか?

    -ADテイラーのモデルとは、物体を検知するための方法であり、人(パーソン)や手(ハンド)などの項目を検出することができます。V8NやV8Sなどの2D系でもリアル系で検出力が高いモデルがあります。

  • ADテイラーのプロンプト欄に何を入れると効果的ですか?

    -ADテイラーのプロンプト欄には、表情や詳細を指定するワードを入れると効果的です。例えば、「スマイル」と記入することで、画像の人物の表情を笑顔にすることができます。

  • モアディテールズとは何ですか?

    -モアディテールズとは、画像の細かさを増やし、線を入れることで絵の質を向上させるためのプロンプトです。

  • ADテイラーで画像を改善する際、どのような点に注意が必要ですか?

    -ADテイラーで画像を改善する際には、観客席のような多くの人物が描かれた画像では、一人ずつ顔を直すと時間がかかるため、直す人と直さない人を区別する必要があることに注意する必要があります。

  • ADテイラーのセッティングタグで何を設定できますか?

    -ADテイラーのセッティングタグでは、マスクがどこに入ったかを確認できるビューを表示するか、直す前の画像を表示するか、またモデルの数を設定することができます。

  • ADテイラーで検出されない場合、どうすればよいですか?

    -ADテイラーで検出されない場合は、モデルの検出能力を高めるために、V8NやV8Sなどの検出モデルを選定し直すことができます。また、画像の角度やサイズを調整して再試行することも有効です。

  • ADテイラーを使用する際の利点は何ですか?

    -ADテイラーを使用することで、画像の顔や体などの特定の部分を自動的に検出して綺麗に改善することができ、解像度を上げるわけではないが、顔の見栄えを劇的に向上させることができます。

  • ADテイラーのプロンプト欄に何も入力しない場合、どうなりますか?

    -ADテイラーのプロンプト欄に何も入力しない場合、基本的に元のプロンプトを参考にして画像が生成されます。しかし、何か一言入力すると、元のプロンプトの影響が消える可能性が高いとされています。

  • ADテイラーで表情を変更するにはどうすればよいですか?

    -ADテイラーで表情を変更するには、プロンプト欄に表情を指定するワード(例:「スマイル」)を入力します。また、ローラを使用して、特定の表情を強調表示することもできます。

Outlines

00:00

😀 Introduction to AD Tailor - A Key Extension for Stable Diffusion

Alice, the assistant at Aizu Wonderland, introduces AD Tailor, an important extension for Stable Diffusion, which is considered one of the top three significant extensions alongside ControlNet Multi and Diffusion. AD Tailor is used to enhance images, particularly faces, by automatically detecting and masking parts of the image, then refining these areas to improve clarity and aesthetics without actually increasing the resolution. The installation process is outlined, starting from the Extensions tab and using a URL to install the extension. After installation, users can access AD Tailor through a new tab in the Text2Image page. A demonstration is given using a model called 'Magic Mix Realistic V4' with specific settings to generate an image of multiple girls on a busy street, which is then further refined using AD Tailor to enhance the faces.

05:02

🔍 Exploring AD Tailor's Models and Settings

The video delves into the different models available within AD Tailor, which are used for detecting and refining objects within images, particularly faces. Several models are discussed, including V8N and V8S, which are effective for both 2D and realistic images. The presenter explains the strengths and weaknesses of each model, noting that some are better at detecting faces in profile or smaller faces. Settings are also explored, such as the number of models used and the option to view the detection process and before-and-after images. The video demonstrates how these settings can affect the outcome, emphasizing the importance of choosing the right model and settings for the desired result.

10:03

🖼️ Comparing Different Models and Their Impact on Image Refinement

The presenter compares the results of using different models within AD Tailor to refine faces in images. The original image is shown alongside the refined versions using Mediapipe Full, Short, and Mesh, as well as V8N and V8S models. It is noted that each model produces slightly different results, likely due to variations in detection methods and the areas masked for refinement. The video also touches on the challenges of refining images with large groups of people, as each face needs to be individually adjusted, which can be time-consuming. The presenter suggests that for images with spectators or crowds, it may be necessary to make adjustments to differentiate between faces that need refinement and those that do not.

15:05

📝 Understanding the Role of Prompts in AD Tailor

The final paragraph discusses the role of prompts in the AD Tailor extension. The presenter hypothesizes that if no prompt is entered in the AD Tailor prompt box, the original prompt is likely used to generate the image. However, entering a single word such as 'Smile' may override the original prompt's influence. This is demonstrated by comparing images generated with and without the 'Smile' prompt, showing that the addition of a prompt can significantly change the expression of the subjects in the image. The video concludes with a teaser for the next installment, where more advanced and detailed explanations about the detection mask processing and inpainting in AD Tailor will be provided.

Mindmap

Keywords

After Detailer (ADテイラー)

After Detailerは、Stable DiffusionというAIの拡張機能の一つで、画像の顔や体などの特定の部分を自動的に検出し、その部分を綺麗に改善することができます。この機能は、画像の解像度を上げるわけではなく、顔の見た目を綺麗に変化させることができます。

コントロールネットマルチディフュージョン

コントロールネットマルチディフュージョンは、Stable Diffusionの重要な拡張機能の一つで、画像の生成プロセスを細かく制御することができます。ADテイラーと並んで、重要な役割を果たしています。

インストール

ADテイラーを使用するためには、まずエクステンションタブからインストールする必要があります。URLを指定して、エクステンションキットレポジトリからインストールを実行し、その後チェックアップデートとアプライ&リスタートを行って、ADテイラーを有効にします。

モデル

ADテイラーで使用されるモデルは、物体を検知するための方法を定義します。例えば、V8NやV8Sは顔を検出するもので、それぞれ異なる検出パフォーマンスを持っています。モデルの選択は、画像の改善の質に大きく影響します。

マスク

マスクは、ADテイラーが画像の特定部分を検出後、その部分に適用される処理です。マスクをかけて一部を切り抜き、拡大して綺麗に書き直した後、元の大きさに戻し、周囲となじませることで、画像の質を向上させます。

プロンプト

プロンプトとは、AIに画像を生成する際に入力するテキストのことです。ADテイラーでは、プロンプト欄に特定の言葉を入力することで、生成される画像の表情や細部を調整することができます。

ハイレゾ

ハイレゾとは、高解像度を意味します。ADテイラーを使用して画像を生成する際に、ハイレゾをかけることで、より綺麗な画像が得られます。ただし、過剰にかけすぎると、画像の詳細が多すぎると感じられることがあります。

マルチガールズ

マルチガールズは、プロンプトのひとつで、複数の女性キャラクターを画像に含めたい場合に使用されます。ADテイラーを使用することで、各キャラクターの顔を綺麗に改善することができます。

イージーネガティブ

イージーネガティブは、プロンプトのひとつで、生成された画像から避けたい要素を指定するために使用されます。ADテイラーでは、イージーネガティブを用いて、画像の生成プロセスを細かく制御することができます。

モアディテールズ

モアディテールズは、プロンプトのひとつで、画像の質を向上させるために使用されます。ADテイラーでは、モアディテールズを用いて、画像の線を細かく調整し、より綺麗な絵を生成することができます。

エンバラスト

エンバラストは、ADテイラーで使用されるプロンプトのひとつで、画像の表情を大きく変えることができます。強度を調整することで、表情の変化量を制御することができ、細かく表現を調整することが可能です。

Highlights

ADテイラーはStable Diffusionの重要な拡張機能の一つです。

ADテイラーを使うことで、画像の顔部分を綺麗にしてくれる効果があります。

ADテイラーは解像度を上げるわけではなく、顔を変化させることで清晰な顔を作成します。

ADテイラーのインストールはエクステンションタブから行われます。

インストール後、ADテイラーのタブが現れることで成功を確認できます。

ADテイラーでは、画像から顔や体を自動的に検出し、マスクをかけて改善します。

ADテイラーのモデルには、フェイス用V8N、V8S、フェイスフル、フェイスショート、フェイスメッシュなどがあります。

V8NやV8Sは2D系でもリアル系でも非常に検出力が高いモデルです。

メディアパイプは2D系は弱く、横顔や小さい顔なども検出しにくいです。

ADテイラーの設定では、検出モデルの数やマスクの中心点などを調整できます。

ADテイラーのプロンプト欄に記入することで、最初のプロンプトの影響が消える可能性が高いです。

ローラのモアディテールを使うことで、画質自体を良くすることができます。

ADテイラーは表情を変えるのにも非常に得意で、恥ずかしい表情を強度1で入れて大きな変化が見られます。

ADテイラーのプロンプト欄に何か記入することで、一言でプロンプトの影響が消えることもあります。

ADテイラーは物体を検知するための方法と検知する項目を提供します。

ADテイラーの設定変更後、アプライ&リスタートを押すことで設定が反映されます。

ADテイラーを使う前と後で、顔の洗練度が変わり、美女になったという感じがします。

ADテイラーのモデルは顔だけでなく、手や体も改善できるため、モデルの数を3に設定することがおすすめです。

ADテイラーのセッティングタグで検出を確認し、改善後の画像を比較することができます。