Stable Diffusion Prompt Guide

pixaroma
15 May 202411:23

Summary

TLDRCe script vidéo présente des techniques pour créer des prompts efficaces dans Stable Diffusion. Il explique comment spécifier le type d'image, le sujet, l'environnement et les détails pour obtenir des résultats plus précis. Le tutoriel couvre l'utilisation de la UI de Forge, de Juggernaut XL, de grains de départ fixes, de prompts négatifs, de styles d'art, et de l'ajout de poids à certains mots. Il suggère également d'utiliser Chat GPT pour varier les prompts et de finir par des astuces pour des générations plus cohérentes et des variations subtils.

Takeaways

  • 🖌️ L'utilisation de l'interface Stable Diffusion Forge UI et du modèle Juggernaut XL permet de créer des images spécifiques en utilisant des requêtes (prompts) bien définies.
  • 🔍 Il est conseillé de spécifier le type d'image souhaitée (photo, illustration, peinture, etc.) pour guider l'intelligence artificielle vers une génération d'image plus précise.
  • 🌳 Ajouter des détails sur l'environnement (comme un forêt ou une plage) et les attributs spécifiques (comme les cheveux blonds) à la sujet de l'image peut améliorer la précision de la génération.
  • 👚 Spécifier des éléments de mode et de tenue peut aider à obtenir une image plus proche de ce que l'on a à l'esprit, comme un chandail rouge au lieu d'un chemise blanche.
  • 🎨 Pour explorer différentes styles artistiques, il est possible de préciser le type de peinture ou de dessin souhaité, comme un tableau à l'huile ou un dessin au crayon de mine.
  • 🔄 Utiliser un seed fixe pour les expériences ou un seed aléatoire pour la génération d'images peut aider à obtenir des résultats plus prévisibles ou variés.
  • 🚫 Les requêtes négatives sont utilisées pour exclure des éléments indésirables des images générées, bien que leur efficacité varie selon les mots utilisés.
  • 🔄 La recherche et le remplacement de mots dans les requêtes permettent d'explorer différentes variations d'images, comme des couleurs de cheveux différentes.
  • 👩‍💼 La personnalisation de la requête avec des détails spécifiques, comme un prénom inventé pour la sujet, peut aider à maintenir la cohérence entre les générations d'images.
  • 🔧 L'ajustement des paramètres tels que le sampling steps ou le CFG scale permet de contrôler la variabilité des générations d'images.
  • 🤖 L'utilisation de Chat GPT pour adapter des requêtes existantes ou pour générer de nouvelles requêtes basées sur des métiers différents est un outil utile pour la création de requêtes.
  • 🏠 L'ajout de poids à certains mots dans une requête en utilisant des parenthèses permet de rendre ces mots plus importants pour la génération d'images.

Q & A

  • Quel logiciel est utilisé pour la diffusion stable dans le script ?

    -Le logiciel utilisé est la version 10 du modèle Juggernaut XL de Stable Diffusion Forge UI.

  • Pourquoi les prompts simples peuvent-ils ne pas être suffisants dans certaines interfaces AI ?

    -Les prompts simples laissent trop de liberté à l'IA, ce qui peut mener à des résultats qui ne correspondent pas à ce que l'utilisateur a à l'esprit.

  • Comment spécifier le type d'image souhaitée dans un prompt ?

    -On peut ajouter des mots comme 'photo', 'illustration', 'peinture', etc., pour préciser le type d'image que l'on souhaite générer.

  • Quelle est l'utilité d'utiliser un seed fixe lors de l'expérimentation de prompts ?

    -Un seed fixe permet de générer des images cohérentes et de faciliter les comparaisons entre différentes versions d'un prompt.

  • Comment placer le sujet d'un prompt dans un environnement spécifique ?

    -On peut ajouter des descriptions comme 'dans la forêt', 'sur une plage' ou 'photo de studio avec un fond noir' pour définir l'environnement du sujet.

  • Pourquoi ajouter des détails spécifiques comme la couleur des cheveux ou la lumière peut-il être important ?

    -Ajouter des détails spécifiques permet à l'IA de générer des images plus proches des attentes de l'utilisateur et d'éviter les résultats généraux.

  • Quels sont les avantages de l'utilisation de la fonction XYZ plot pour remplacer des mots dans un prompt ?

    -La fonction XYZ plot permet de rechercher et de remplacer des mots dans un prompt de manière efficace, offrant ainsi une variété de résultats basés sur différentes options de remplacement.

  • Comment utiliser un nom inventé pour assurer une cohérence entre les générations d'images ?

    -En donnant un nom spécifique au sujet et en l'incluant dans le prompt, on peut aider l'IA à maintenir une certaine cohérence dans l'apparence du sujet entre les différentes générations d'images.

  • Quelle est la différence entre l'utilisation de la fonction 'Generate Forever' et la sélection d'un nombre spécifique de générations ?

    -La fonction 'Generate Forever' permet de générer continuellement des images jusqu'à ce que l'utilisateur l'arrête, tandis que la sélection d'un nombre spécifique de générations crée un lot prédéfini d'images.

  • Comment utiliser Chat GPT pour obtenir des prompts adaptés à différents métiers ?

    -On peut demander à Chat GPT d'adapter un prompt existant pour différents métiers, comme un médecin ou un chef, et il fournira des versions adaptées de ces prompts.

  • Quels sont les avantages de l'utilisation d'art styles pour influencer la génération d'images ?

    -Les art styles permettent d'ajouter une touche particulière à l'image générée, en apportant une ambiance ou un style spécifique qui peut être en harmonie avec le sujet et l'environnement.

  • Comment modifier la pondération de certains mots dans un prompt pour les rendre plus ou moins importants ?

    -On peut utiliser des parenthèses pour augmenter ou réduire la pondération de certains mots dans le prompt, ou utiliser les touches de direction avec la touche 'Ctrl' pour ajuster rapidement la pondération.

Outlines

00:00

🎨 Création de prompts pour la diffusion stable

Le premier paragraphe traite de la manière dont l'auteur utilise l'interface de diffusion stable Forge UI et le modèle Juggernaut XL pour créer des prompts plus rapidement. Il suggère d'être spécifique pour obtenir des résultats plus proches de ce que l'on a en tête, en mentionnant le type d'image, le sujet, l'environnement, les détails comme la couleur des cheveux ou de la lumière, et en utilisant des astuces pour varier les prompts, comme le remplacement de mots clés et l'utilisation de l'historique de génération pour conserver la cohérence entre les générations d'images.

05:01

🖌️ Techniques avancées de prompts et variations

Dans ce paragraphe, l'auteur partage des techniques pour améliorer la précision des prompts, notamment en utilisant des graines fixes, en ajustant l'échelle CFG pour des variations subtils, et en donnant un nom inventé à la personne représentée pour une cohérence entre les générations. Il mentionne également l'utilisation de chat GPT pour obtenir des listes de variations de prompts basées sur différents métiers, et des astuces pour adapter les prompts à l'aide de l'interrogation par image (CLIP) et de l'ajout de poids à certains mots pour les rendre plus importants dans la génération d'images.

10:03

🔄 Génération de séries d'images et partage de communauté

Le dernier paragraphe explique comment utiliser la fonction 'Generate Forever' pour produire une série d'images ininterrompue et comment générer un lot spécifique d'images à partir de prompts listés dans un fichier texte. L'auteur encourage également à rejoindre sa communauté Facebook pour échanger des prompts, des défis et des designs, et remercie les membres pour avoir atteint le nombre de 1 000. Il invite les téléspectateurs à liker la vidéo si elle a été utile et souhaite une bonne journée à tous.

Mindmap

Keywords

💡Stable Diffusion

Stable Diffusion est un modèle de génération d'images basé sur l'apprentissage profond. Dans la vidéo, il est utilisé pour créer des images spécifiques en utilisant des invites (prompts). L'auteur mentionne qu'il utilise la version XL de Juggernaut et l'interface Forge UI, illustrant comment cette technologie peut être adaptée à différents modèles et paramètres pour obtenir des résultats souhaités.

💡Invite (Prompt)

Dans le contexte de l'intelligence artificielle, une 'invite' est une phrase ou un ensemble d'instructions qui guident le modèle à générer du contenu spécifique. L'auteur explique comment être plus spécifique dans les invites pour obtenir des images plus proches de ce qu'on a en tête, en donnant des exemples comme 'portrait d'une femme' ou 'photo moderne'.

💡Graine (Seed)

La 'graine' fait référence à un nombre utilisé pour initialiser le processus de génération d'images, qui permet de reproduire des résultats similaires. L'auteur mentionne l'utilisation d'une 'graine fixe' pour expérimenter avec les invites et obtenir des variations cohérentes.

💡Environnement

L'environnement dans le script fait référence au contexte dans lequel se trouve le sujet de l'image. Par exemple, l'auteur suggère de placer une femme 'dans la forêt' ou 'sur une plage', ce qui influence le résultat de la génération d'images.

💡Couleur des cheveux

La mention de la 'couleur des cheveux' est un exemple de spécification dans une invite pour guider la génération d'images vers un look particulier. L'auteur utilise 'blonde hair' dans le script pour décrire la femme qu'il souhaite créer.

💡Rim Light

Le 'rim light' est une technique de lumière qui éclaire les contours d'un sujet, créant un effet de relief. L'auteur mentionne l'ajout d'un 'rim light' dans les invites pour donner plus de profondeur et d'impact visuel à l'image.

💡Heure d'or (Golden Hour)

L'heure d'or est une période de la journée où la lumière du soleil est plus douce et crée des effets visuels agréables. L'auteur suggère d'utiliser cette notion pour donner un aspect naturel à l'image en utilisant une invite spécifique.

💡Cheveux bangs

Les 'cheveux bangs' sont une coiffure où une partie des cheveux est coupée plus courte et tombe devant le visage. L'auteur utilise ce terme pour préciser le style de coiffure qu'il souhaite inclure dans l'image générée.

💡Chat GPT

Chat GPT est un outil de génération de texte basé sur l'IA qui peut aider à créer des invites pour la génération d'images. L'auteur l'utilise pour obtenir des listes de variations, des descriptions ou des adaptations de prompts, montrant comment l'IA peut faciliter le processus de création.

💡Variations

Les 'variations' dans le script se réfèrent aux différentes versions ou adaptations d'une image générée. L'auteur parle de l'ajustement de paramètres comme le 'CFG scale' pour obtenir des variations subtils d'une image de base.

💡Art Styles

Les 'styles d'art' sont des catégories de techniques et d'esthétiques artistiques. L'auteur discute de l'utilisation de styles comme 'peinture à l'huile' ou 'dessin au fusain' dans les invites pour influencer le style de l'image générée.

💡Negative Prompt

Un 'negative prompt' est utilisé pour exclure certains éléments de la génération d'images. L'auteur explique comment utiliser cette technique pour éviter des éléments indésirables, comme un 'badge de police', dans l'image finale.

💡XYZ Plot

L'XYZ Plot est un outil dans certaines interfaces de génération d'images qui permet de rechercher et de remplacer des mots dans les invites. L'auteur utilise cet outil pour expérimenter avec différentes couleurs de cheveux sans avoir à réécrire complètement l'invite.

💡Batch Slider

Le 'batch slider' est un contrôle qui permet de définir le nombre d'images à générer en une seule fois. L'auteur mentionne cet outil pour générer un certain nombre d'images ou pour générer plusieurs invites à partir d'un fichier texte.

Highlights

Introduction to the process of creating prompts for stable diffusion and the use of specific models and settings.

The importance of being specific in prompts to guide AI towards desired outcomes, rather than leaving too much to AI interpretation.

Using additional descriptors such as 'modern' to refine the type of image generated, such as specifying a 'modern photo'.

Utilizing a fixed seed for experimentation to maintain consistency in image generation.

Incorporating environmental settings into prompts, like placing the subject in a forest or on a beach.

Specifying physical attributes in prompts, such as hair color or clothing, to achieve a more tailored result.

Adding lighting effects to prompts, like rim light or golden hour lighting, to enhance the image's mood.

Using chat GPT to generate lists for elements like women's clothing to diversify prompt options.

Experimenting with different art styles in prompts, such as oil painting or watercolor, to achieve varied visual effects.

The use of negative prompts to exclude unwanted elements from the generated images.

Techniques for replacing words in prompts to see variations, such as changing hair color.

Giving the subject a name in prompts to maintain consistency across generations.

Adjusting sampling steps or CFG scale for subtle variations in image generation.

Using chat GPT to adapt existing prompts for different jobs or scenarios, like a doctor or chef.

Uploading a photo or illustration to chat GPT to generate a descriptive prompt based on the image.

Adding weight to certain words in prompts to emphasize their importance in the generated image.

Using art styles to enhance short prompts and achieve specific visual effects.

The release of a new GPT model facilitating the creation of prompts for desired outcomes.

Using the 'generate forever' feature for continuous image generation until manually stopped.

Batch generation of images from multiple prompts listed in a text file or box.

Invitation to join the Facebook group for further discussions, prompts, and community engagement.

Transcripts

play00:00

hey today I want to show you how I

play00:01

prompt in stable diffusion how I think

play00:03

about it when prompting and what methods

play00:05

I use to create prompts faster I'm using

play00:08

stable diffusion Forge UI and Juggernaut

play00:11

XL version 10 model but you can use any

play00:13

model you prefer with the settings that

play00:15

work best for that model many beginners

play00:18

simply prompt something simple like

play00:19

portrait of a woman while many short

play00:22

prompts still work in interfaces like

play00:24

Focus or AI like mid journey and chat

play00:26

GPT you're leaving too much freedom to

play00:29

the AI

play00:30

you can be more specific to get

play00:32

something closer to what you have in

play00:33

mind for example you can specify the

play00:35

type of image you want such as a photo

play00:37

illustration painting and so on as you

play00:40

can see even by mentioning photo the

play00:42

possibilities are still too many I got a

play00:44

vintage photo so maybe you can add an

play00:47

extra word like modern to specify that

play00:49

you want a modern photo instead of a

play00:52

vintage one to experiment better with

play00:54

the prompt you can use a fixed seed you

play00:57

can either use the last seed or just

play00:59

type number and generate again so we

play01:03

have the type of image and a subject but

play01:06

let's also place the subject in an

play01:08

environment maybe we can put her in the

play01:10

forest or on a beach or perhaps we want

play01:12

a studio photo with a black background

play01:14

behind maybe I don't want the woman to

play01:17

have a random hair color so I add blonde

play01:20

hair in the prompt perhaps I want her

play01:22

shirt to always be white so it stands

play01:24

out against the black background maybe I

play01:26

want the image to pop out more so I can

play01:29

add a rim light coming from behind

play01:32

visible in the hair alternatively I

play01:34

might want a golden hour type of light

play01:36

to make it look more natural if you have

play01:39

a specific hairstyle in mind you can add

play01:41

that to the prompt if you don't know the

play01:43

name you can search on Google for

play01:45

hairstyles women names for example if

play01:48

you like bangs you can add that to the

play01:51

prompt Additionally you can use chat GPT

play01:54

to provide lists for anything such as a

play01:56

list of women's clothing so I can use

play01:58

like a red cardigan instead of a white

play02:00

shirt let's try different types of art

play02:03

styles for the photo instead of just

play02:05

saying painting portrait which is a

play02:07

broad category we can specify further

play02:10

for example it could be an oil painting

play02:12

maybe with an old look or perhaps it's a

play02:15

watercolor painting we could also

play02:17

consider a pencil drawing but in this

play02:19

case we'd need to adapt the colors and

play02:21

background to match that style uh let's

play02:24

play around more with photography a

play02:27

cinematic fashion portrait could look

play02:29

cool

play02:30

we can also mention the nationality of

play02:33

the woman or the country for instance we

play02:36

could generate in African woman or a

play02:39

police woman since we've been so

play02:42

specific with clothes it might not

play02:44

include the police uniform so instead of

play02:46

a cardigan let's add a police suit or

play02:49

uniform let me quickly show you the

play02:52

negative prompt here you list things

play02:55

that you don't want to appear in your

play02:57

image it doesn't work perfectly some

play03:00

words are stronger than others but for

play03:02

example if you don't want a police badge

play03:05

you can add that to the negative prompt

play03:07

now when I generate again the badge is

play03:09

gone if you don't like the blue light

play03:11

behind you can add it to the negative

play03:13

prompt if that doesn't work you can try

play03:15

different seeds um in the worst case

play03:18

scenario you can use in painting to

play03:20

remove it let me remove the negative

play03:22

prompt and I'll show you how you can

play03:24

replace different words in the prompt

play03:25

scroll down and go to the XYZ plot on

play03:28

the X Type search for prompt Sr on the X

play03:31

values you put the words you want to

play03:33

search and replace first so for example

play03:36

I want to search for the word blonde and

play03:38

replace it with different colors like

play03:40

dark purple red and so on this way you

play03:43

can see how the girl looks with

play03:45

different hair colors as you can see now

play03:47

it started to generate the policewoman

play03:49

with different hair colors as a bonus at

play03:52

the end you have a grid with the

play03:53

searched word and all the other

play03:55

variation words that were replaced you

play03:57

can open it and see how they look in

play03:59

different

play04:00

colors let me dress her in a white shirt

play04:02

real quick let's say I want to redo

play04:04

everything but the girl's face to be

play04:06

more similar between Generations one

play04:09

thing that helps is to give her a name I

play04:11

usually use a random invented name but

play04:14

you can also use a mix of celebrities if

play04:16

you want so I'll give you a name and

play04:19

I'll generate again with that search and

play04:21

replace script active as you can see in

play04:24

the results the woman is quite similar

play04:26

between

play04:27

Generations because it has the same seed

play04:30

and the same description and name only

play04:33

the color is different let's say you

play04:35

like the results of a prompt but you

play04:37

just want a very subtle variation of it

play04:40

you can do that by adjusting the

play04:42

sampling steps or CFG scale you can do

play04:45

that automatically if you go back to the

play04:46

scripts and instead of prompt search and

play04:49

replace you choose CFG scale for the X

play04:52

values you can put between five and

play04:54

seven for example now when you generate

play04:57

you'll get those very subtle variations

play04:59

they might be harder to see on the

play05:00

screen but let's go to the folder where

play05:02

they were saved and switch from one to

play05:04

another as you can see some don't have

play05:06

badges or the light is a little

play05:08

different so you can choose the best one

play05:10

from all or you can combine them in

play05:12

Photoshop and keep what is best from

play05:15

each I also like to get variations for

play05:18

prompts using chat GPT so I have this

play05:20

prompt that I know works okay and I want

play05:23

a prompt adapted from different

play05:25

jobs I can ask GPT to adapt it for me

play05:29

and as you can see I get some nice

play05:32

variations let me test quickly the

play05:34

doctor prompt as you can see it added a

play05:37

white coat to the prompt now let's see

play05:39

how it looks like as a chef copy and

play05:41

paste The Prompt using the control plus

play05:43

C and Control Plus V shortcuts and

play05:46

generate quickly different variations

play05:49

sometimes I'm too lazy to write

play05:51

descriptive prompts so I just ask chat

play05:54

GPT to write it for me you just need to

play05:56

guide it a little in the right direction

play05:59

let's test it really quick to see what

play06:00

we get seems to work okay go to image to

play06:03

image and let me show you another trick

play06:06

that you can use when you don't know how

play06:07

to prompt but you have a photo or an

play06:09

illustration upload it here and then

play06:11

click on the paperclip icon that will

play06:14

interrogate clip which stands for

play06:16

contrastive language image pre-training

play06:18

the first time you're using it it will

play06:20

take some time to download a model you

play06:22

can see when it's ready in the command

play06:24

window but after that it should

play06:26

interrogate quicker that will give you a

play06:29

prompt for that image I'll copy this

play06:31

prompt and test it quickly the result is

play06:34

not bad could be better you can see that

play06:37

it's a policewoman but she doesn't look

play06:38

very similar to my image what seems to

play06:41

work better and get more consistent

play06:44

results for me is chat GPT I just upload

play06:47

a photo to chat GPT and ask it to

play06:49

describe it for me in a long sentence

play06:52

let's copy The Prompt and test it to see

play06:53

what we get now look at that how similar

play06:56

the photos look like with the image I

play06:58

gave it

play07:00

now you can talk with chat GPT to change

play07:02

the prompt how you want it for example

play07:04

you can adapt it for a doctor instead

play07:07

and this is the result if you don't have

play07:09

access to GPT or the internet and you

play07:12

still have problems with uh prompting

play07:14

but want to get some nice generation you

play07:17

can use art styles instead so if you

play07:20

have a short prompt you can go to art

play07:22

styles and either save your own art

play07:25

styles or download some free art styles

play07:27

from the internet I have an entire video

play07:29

with with 260 art styles and how to

play07:31

download them if you look at the prompt

play07:33

description then you look at the info

play07:35

for Generation you can see that you get

play07:38

the original prompt first then the art

play07:40

style is just another already saved

play07:42

prompt that is added to the original

play07:44

prompt plus the negative prompt let's

play07:47

talk a little bit about how to add more

play07:49

weight to certain words I have this

play07:52

prompt where I added green blue house

play07:54

next to each other to show you how I can

play07:56

make one word more important than the

play07:57

other so this is what I get for this

play08:00

prompt the house has blue and green in

play08:02

it I can make the words Blue House more

play08:04

important if I add round brackets you

play08:07

can see if you forgot to close a bracket

play08:10

it shows in red in the corner where the

play08:12

tokens are once I generate you can see

play08:15

the house has more blue than green you

play08:17

can add even more weight to those words

play08:19

if you add another

play08:21

bracket but there's an easier way to do

play08:24

this faster you just select the words

play08:27

then press control and use the up Arrow

play08:29

key to add more

play08:30

weight with control and the down arrow

play08:33

you can reduce the weight it can also

play08:36

have a negative value if you want it to

play08:37

be less important to change the value

play08:40

you select only the text without the

play08:42

brackets and numbers and use the

play08:44

shortcut again alternatively you can

play08:47

just change the numbers manually you

play08:50

should avoid going too high usually if

play08:52

you go more than 1.9 or two values it

play08:56

starts to go a little crazy and you get

play08:58

something like this like an a I exploded

play09:00

brain if I add a negative value to The

play09:02

Gnome for example it will be less

play09:05

important and you can see in the results

play09:07

that it's barely visible the main

play09:10

subject becomes the

play09:12

house here's how I usually prompt I put

play09:15

the art style or medium either first or

play09:17

last then comes the subject followed by

play09:19

the description then the environment and

play09:22

finally any extra information like

play09:23

colors lighting and mood while I was

play09:26

working on the video chat GPT released a

play09:29

new model version GPT 40 so now it's

play09:32

even easier to just ask for a stable

play09:35

diffusion prompt for what you want to

play09:36

create so if I want a watercolor

play09:38

painting of a cute bunny with glasses I

play09:40

can get a prompt quickly now I can test

play09:43

it in stable diffusion and the result is

play09:45

what I asked for I can then make more

play09:48

changes for example I can ask chat GPT

play09:51

to make it more minimalist and add a

play09:53

white background so now when I test it I

play09:55

get a nice cute cartoon bunny on a white

play09:58

background another thing you can do is

play10:00

to turn on generate Forever by right

play10:02

clicking on the generate button and

play10:04

choosing generate

play10:06

forever to stop it you need to

play10:08

rightclick again and choose cancel

play10:10

generate forever if you don't want to

play10:12

let it generate forever and have a

play10:14

specific number of generations in mind

play10:16

like between one and 100 you can move

play10:19

the batch slider to the value you want

play10:22

and it will generate that number of

play10:24

images alternatively if you have

play10:27

multiple different prompts you can

play10:29

choose prompts from a file or a text box

play10:32

you can paste prompts here or upload a

play10:34

text file with the prompts just make

play10:35

sure each prompt is on a separate line

play10:38

um I can once again use chat GPT to give

play10:40

me a list of different variations of the

play10:42

prompt with different animals then I can

play10:45

uh copy and paste that list of prompts

play10:47

in the text area when I hit generate it

play10:50

will start generating each of those

play10:52

prompts um as you can see I get

play10:53

different animals on a white background

play10:56

if you have any questions you can post

play10:57

them in my Facebook group pix Roma

play10:59

Community I usually post news prompts

play11:02

daily challenges design and crafts there

play11:05

I've recently passed 1,000 members so

play11:07

thank you to all who joined if you found

play11:09

something useful in this video leave a

play11:11

like thank you and have a great day

Rate This

5.0 / 5 (0 votes)

Related Tags
Création d'ImagesIntelligence ArtificiellePromptingStable DiffusionForge UIJuggernaut XLModèles IAPhotographiePeintureAjustement de PromptVariations VisuellesGénération Automatique
Do you need a summary in English?