【Stable-Diffusion】🔰基本を見直そう!単語vs.文章!?意外な特性 #stablediffusion #強調構文 #BREAK #トークン
Summary
TLDRこの動画では、AI画像生成技術の進化とその基礎知識、実用的なテクニックについて解説しています。特に単語と文章でのプロンプト入力方法の違い、強調と抑制の技術、トークンとチャンクの概念、そして要素の調整方法について詳しく説明しています。視聴者は、これらのテクニックを活用して、より魅力的なAI生成画像を作成できるようになるでしょう。
Takeaways
- 🌊 AIの画像生成技術が急速に進化し、継続的なリアルタイム画像生成や1枚の画像から動画を生成する機能が向上しています。
- 📝 プロンプトの入力方法には、単語を並べる方式と文章式の書き方があります。どちらにもメリットとデメリットがあります。
- 🔍 単語並べ方式では、要素ごとに強調がつきやすく、メリハリがつく傾向がありますが、意図しない共通性が発生しやすく、調整が難しい場合があります。
- ✍️ 文章式書き方では、要素単位でのまとまりが容易出现し、全体的なバランスが良くなりますが、目立たれる要素が弱くなりがちです。
- 🎨 強調と抑制を用いた調整では、要素の重要度を調整することで、生成される画像の印象をコントロールできます。
- 🔧 強調と抑制を組み合わせて、主役と脇役の関係を変化させることができます。
- 🚫 要素が多すぎる場合、ブレイク構文を使用することで、トークン数を調整できますが、画像品質が低下するリスクがあります。
- 📉 トークン数を超えると画像が破綻しやすくなり、制御が難しくなるため、要素を減らしてシンプルにすることが重要です。
- 🌟 AI画像生成において、プロンプトの構成が最終的な成果に大きな影響を与えることから、細かい特性を理解し、活用することが大切です。
- 📚 この動画では、ステーブルディフュージョンのプロンプト入力の特徴や、単語と文章の違い、強調と抑制の使い方など、実践的なテクニックが解説されています。
- 👍 参考にできる情報を提供することで、視聴者はAI画像生成の基礎知識を身につけ、実用的なスキルを向上させることができます。
Q & A
AI画像生成の進化はどの分野で特に顕著ですか?
-AI画像生成の進化は、画像生成から連続したリアルタイムの画像生成や1枚の画像から動画を生成するAI動画生成の流れで特に顕著です。
プロンプト入力の基本的な方法は何ですか?
-プロンプト入力の基本的な方法は、単語を並べる方法と文章式に書き換える方法の2つがあります。単語を並べる方法は、要素として単語を一つ一つ列挙し、文章式に書き換える方法は、要素を文章で結びつけます。
単語並べ方式と文章書き方式の違いは何ですか?
-単語並べ方式では、各要素が言葉としての意味を絵に反映し、要素単独の主张が強めになる傾向があります。一方、文章書き方式では、要素単位でのまとまりが出やすく、全体的に要素がバランスよくまとまっています。
強調と抑制をどのように適用すれば、画像の印象をよくすることができるのですか?
-強調と抑制を適用するために、全体のシーンや主役と脇役の関係を考えて、その強弱をつけていきましょう。強調したい要素には重みを上げ、抑制したい要素には重みを下げることで、絵の印象を良くすることができます。
トークンとは何ですか?
-トークンは、フロント欄に記載された単語や文章ごとに割り当てられた数値であり、プロンプトの要素を表すものです。トークンは積み上げられ、一定の上限に達すると、次のチャンクに続行されます。
ブレイク構文とは何ですか?
-ブレイク構文は、プロンプトの要素が多くなりすぎることを防ぐために使用される特殊なコマンドです。ブレイクを用いることで、要素の間に意味のない入力を埋めることで、トークンの数を75未満に保つことができます。
AI画像生成において、要素の選別と整理はどのように重要ですか?
-要素の選別と整理は、綺麗な絵を生成するための重要な手順です。要素を減らし、明瞭に整理することで、画像の品質が向上し、意図しない共通性が発生するのを防ぐことができます。
プロンプト入力で平凡でつまらない画像が生成される原因是什么ですか?
-平凡でつまらない画像が生成される原因は、プロンプトの構成が単調であることが多いです。要素を単に並べるだけで、それぞれの要素的独特性や関係性が活かされないため、興味深い絵が生成されにくいです。
AI画像生成で印象的な絵を生成するためには、どのようなアプローチが有効ですか?
-印象的な絵を生成するためには、プロンプトの構成に创意を加え、要素の強調と抑制を適切に活用することが有効です。また、全体のシーンや主役と脇役の関係を考え、バランスの取れた要素の選別と整理も重要です。
プロンプト入力の際に、トークンの上限に達した場合どうすれば良いですか?
-トークンの上限に達した場合、ブレイク構文を使用して意味のない入力を埋めることで、トークン数を制御することができます。ただし、過剰に使用すると画像品質が低下するため、適切な回数まで制限することが重要です。
AI画像生成の基礎知識として、どのようなスキルや知識が必要ですか?
-AI画像生成の基礎知識としては、プロンプトの適切な構成方法、要素の強調と抑制の技術、トークンとチャンクの概念、ブレイク構文の使い方などが必要です。また、創造力を培养し、独自のアイデアを発揮することも重要です。
Outlines
🎨 AI画像生成の基礎知識とテクニック
この段落では、AI画像生成技術の発展とその基礎知識、実用的なテクニックについて説明されています。最近、AI画像生成は画像生成からリアルタイムの画像生成、動画生成まで急速に進化しています。このチャンネルでは、ステーブ・ディフュージョンの基礎知識と実践を解説し、プロンプトの基本的な注意点や要素を強化・抑制する方法を紹介しています。
🖌️ 単語と文章の違いと強調と抑制
この段落では、プロンプト入力方法における単語と文章の違い、および強調と抑制のテクニックについて説明されています。単語並べ方式では、要素ごとに強調がつきやすく、メリハリがつく一方、意図しない共通性が生まれやすく、調整が難しくなることがあります。文章方式では、要素がバランスよくまとまり、調整がしやすい反面、目立たない要素が弱くなってしまうことがあります。強調と抑制をうまく使うことで、主役と脇役の関係を変化させ、絵の構図を豊かなものにすることができます。
🌸 桜のイメージを使ったプロンプトの調整
この段落では、桜のイメージを使ったプロンプトの調整方法が紹介されています。まず、要素をリストアップし、自動翻訳を用いてプロンプトを作成します。その後、強調したい要素に重みを与えることで、絵の印象を変化させることができます。強調と抑制を使い分けることで、主役と脇役の関係を明確にし、絵の焦点を決定することができます。また、要素の追加や減少によっても構図が変わっていくことが示されています。
🔄 プロンプトのトークン数とブレイク構文
この段落では、プロンプトのトークン数とブレイク構文について説明されています。トークン数は、プロンプト欄に記載された単語や文章克換算された数値で、この数が75を超えると画像の生成に影響を与えます。ブレイク構文を用いることで、トークン数を管理しながら、要素の調整を行うことができます。しかし、ブレイクの乱用は画像品質の低下につながるため、適切な回数で使用する必要があります。
📚 まとめと今後の活用
最後の段落では、AI画像生成の基礎知識とテクニックの重要性についてまとめています。単語と文章書きによる違いや、強調と抑制のテクニックを理解し、プロンプトの構成に活用することで、より魅力的な絵を生成することができます。この動画が参考になった方には、チャンネル登録やいいねボタンを押してほしいと呼びかけています。また、次の動画でお会いするのを楽しみにしています。
Mindmap
Keywords
💡AI画像生成
💡プロンプト入力
💡単語と文章の違い
💡強調と抑制
💡トークン
💡ブレイク構文
💡ステーブルディフュージョン
💡チャンク
💡調整
💡印象
💡品質
Highlights
AI画像生成技術の急速な進化とその応用
AIで画像生成から連続したリアルタイム画像生成の進歩
ステーブディフュージョンの基礎知識と実践的なテクニックの解説
プロンプト入力の基本と注意点に関する解説
単語と文章の違いとそれぞれのメリット・デメリット
強調と抑制の技術を使った要素の調整方法
トークンとチャンクの概念、およびそれらの上限に関する説明
ブレイク構文の使い方とトークン数の管理
AI画像生成における見た目と要素のバランスの取り方
主役と脇役の関係を調整するためのテクニック
要素の選別と整理の重要性とその方法
強調と抑制を組み合わせて主役を目立たせる方法
要素の重みを調整して構図を変える技術
ブレイク構文の効果と適切な使い方
AI画像生成のコツと失敗時の対処法
ステーブルディフュージョン式のプロンプト入力の特徴
改めてAI画像生成技術の可能性と応用範囲の広さ
Transcripts
えどうも皆さんこんにちはAI道草
チャンネルの道草ザコですえ最近はAIで
画像生成から発展して連続したリアル
タイムの画像生成や1枚の画像から動画を
生成したりAI動画生成の流れがまた急速
に進化してきましたねそんな進化が加速
する中このチャンネルではAI画像生成に
申しの方のために今更聞けない基礎知識や
実用的なテクニックを実際の画面を見せし
ながら解説していきたいと思います今回も
ステーブディフュージョンの基礎知識に
ついて解説と実践をしていきたいと思い
ますがえ急速な深海についていくためにも
改めて基礎畳めということで基本に立ちて
プロンプト入力の基本とその他基礎的な
注意点について簡単に解説していきたいと
思いますえ私もそうだったんですがいつも
なんとなくプロンプとを構成していると
どうしても平凡でつまらない画像になって
しまうなってことがあると思いますえ
そんなお悩み解消のためにえこの動画を
見ればこのような平凡なイラストをえ要素
を加えながら目張りの効いた道場のある
イラストへ仕上げることができるように
なりますえ今回解説する内容はこの3つ
ですえ単語と文章の違い2つ目が強調と
抑制についてえ3つ目がトクとチャンクに
ついて
ですまずは単語と文章の違いからえ皆さん
プロンプとの入力方法といえばA単語を
思い浮かべる方も多いかと思いますが
こんな風に要素となる単語を並べていくと
いうやり方ですねただこれ実は英文でも
OKなんですなので入力方法としては
大きく分けてこの2種類がありますという
ことでこの2つの違いについて説明して
いきたいと思いますこれは私が書いた
サンプルですが海辺の少女ということで
要素を書き出してみましたでこれをベース
に文章式に書き換えてみたいと思いますえ
左が単語を鳴られていくスタイルで右が
文章で書き下すスタイルですで細かく見て
いくと要素はこんな感じですえ単語の方の
要素がえ1人の少女学生セーラセーラは
セーラ服浜辺浅内木は水遊び夏青空笑顔を
果し立っているワンダルスンセラ
Beachblinginザウターin
サーブルスカイスマイルバフッ
スタンディングで文章書きの方はこんな
感じにしました夏の青空の日に1人の
セーラー服すの女子学生が笑顔で裸になり
浜辺の浅い波打際に立って水遊びをして
いるでえっと英文に自動翻訳をかけたのが
onaBLsdayAGirlinis
SmilingandBU
Standingintheシロウonザ
beinザウターですで生成したものは
こんな感じですね一見ほぼ同じに見えるん
ですがよく見ると微妙に違いがあって単語
文章でそれぞれ異なる特徴があるなと思っ
てますで色々あるのですが単語並方式と
文章書き形式のそれぞれ特徴表にまとめて
みるとこんな感じ
ですでメリットデメリット書いてますので
それぞれ個別に説明していきたいと思い
ますまずは単語並べ方式からこれの特徴は
え各要素はそれぞれ言葉としての意味を絵
に反映しているので全体的に要素単独の
主張は強めになる傾向がありますなので
よく言うとメリハリがつきやすいという
反面意図しない共通が起きやすかったりも
しますそれからいい面としては要素を単独
で強調させたり増やしたり減らしたり
できるという点で後の調整がラフという
利点もあります難点としては特に色や動物
やモチーフの持つ要素例えば犬と入れて
おくと犬耳になったり尻尾が生えたり顔
だけ犬になったりということも起き
やすかったりしますなのでこんな風に
うまく目張がはまってくれるといい絵に
なりやすかったりもするのですがこんな風
に意図しない主張はは飛び出したり
溶け合ってしまうこともしばしばあります
ねここは足毛が主張して顔とかがかかれて
ないっていう状態ですね裸ってところが
強調されちゃったらかもしれませんねこれ
はプレイングザウォーターっていうところ
はえ中面でちゃったパターンかもしれませ
んねなんか足上げて変な感じでやっちゃっ
てますねこういう意図しない状況が押し
ちゃったりするのは単を形式の特徴ですね
ということでえメリハリが出やすい分
ちょっとなんか変なことを起きるというの
も特徴だったりしますはいそれか章がき
方式の方ですがえまずさっき言った要素
同士の見解やミックスということが比較的
起きにくいという特徴がありえ文章として
繋がった要素単位でのまとまりが出やすい
ですえ反面文章で全て変えてしまうと
目張りが弱く説明的な絵になりがで印象が
まとまりすぎてしまうという特徴もあるの
と途中でこの回要素ほとの調整が少し面倒
という難点もありますえこのように複数パ
生成しても比較的安定して同じような特徴
の画像になるのもこの文章方式の特徴かな
と思いますえ単語形式と比較すると全体的
に要素がバランスよくまとまってるのは
なんとなく分かりますでしょうかえサイド
比較するとこんな感じですねえ以上単語
並べ方式と文章書き方式の誓についての
説明でし
たえ次に表情と抑制についてですがえ画像
を生成する手順を追って説明していきたい
と思いますえまずはテーマから要素をめて
いきますねじゃあ仮テーマをえ桜のと着
女子としてみましょうかこんな感じの
イメージです
ねえ1人の少女え物の姿黒神え春桜の木ま
さ桜の花びらカメラ目線なき道散歩美しい
造りえ石段こんな感じの要素をえいた書い
てみまし
たでこれをえこれを自動翻訳にかけまして
えワンがる着物ブラックヘアスプリング
チリーブロムフデオブフリングチェリー
ブロッサムえチェリーブロッサムペティ
ですキントビーア3ラインドストリーツ
ストーンステイヤーケースはいでこれを
一旦生成してみますえするとこんな感じの
絵になりましたえ立絵として使う場合には
これでもいいと思うんですがえ1枚の
イラストとして考えた時にはもうちょっと
なんとかしたいので絵の印象をよくして
いくためにA全体での見場や主役と脇役の
手中関係を考えてその強弱をつけていき
たいと思いますでようやくこっから強調と
抑制の説明になるんですがステーブル
ディフュージョンでは強調公文はこのよう
な書き方がありますえ半角括弧で田部や
文章を書こうことでそれら要素の重要度を
え1.1倍に上げることはできますさらに
もっと変動させたい場合はコロン1.いく
つというように書くとさらに重きを上げ
たり下げたりすることができ
ますちなみにで括をつけると1.1下
1.1で1.21倍という書き方もでき
ますでサンプルとしてこのスマイルで試し
てみた感じがこんな感じですえ要素0.5
倍から2倍まででえこんな感じですね同じ
シード値なんですが重要度が変わると周り
の業者にも影響を及ぼしていることがフる
と思いますでスマイルだとちょっと分かり
づらかったのでえジャンピングでも試して
みまし
たこっちはこんな時の姿勢や背景が変化し
てますねえたまたまかもですが2倍の絵は
靴が脱げちゃっていうのは結構いい感じ
です
ねちなみにこうやってそれぞれにかこへ
倍率指定をする方法もいいんですがえこの
ようにまとめてかっこでくることでかこ内
をまとめて倍率変化させることもできます
えそれからこれはややこしくなるので
あんまりえなくてもいいかもしれませんが
えこんなように大格を使うと反転して
マイナス方面に強調させるという書き方も
あるようですこれは使い方が難しいので私
はとりあえずかこの方だけでやってみて
ますということでえこの強調工運を使って
見場にしたい主役の要素を強めていきたい
と思いますじゃあえまず仮にこの黄色い
部分1人の少女暇の姿空神えマチ桜え桜の
花びらえこの辺りを気調してみましょうで
プロンプとはこんな感じでえ強調しており
ますで生成したものはこちら
ですでこんな感じで桜の木と花が広めに
描かれて強調されてますねえ女の子の方は
ちょっと引きの絵になってしまった分印象
はちょっと弱めになっちゃいましたねえ
じゃあ次はさらに弱める方向の調整も加え
て主役と脇役に言い分けてみましょう
じゃあやっぱり着物の女の子を主役にして
桜のハドの背景要素は弱めにしてみ
ましょうかはいではこの青色の部分をえ
0.8と0.5を使って2段階に脇役要素
の重みをさえてみますでえ生成したものは
こちらです背け要素がちょっと控えめに
なって女の子と着物の書き込み要素が表情
されているのが分かりますでしょう
[音楽]
かちょっとねさっきよりも着物は豪華に
なってますねはいここまでが強調工具を
使った強調と抑制のえ製作でですでこの
状態でもいいかなと思うんですがさらに
追い込みたい場合はえここからえ主役を
さらに目立たせるためにえ見せたいもの
以外を選別して消していきますえじゃ
さらに着物の女の子を魅力的に見せたいと
した場合こ足元の要素をちょっと削って
いきたいと思いますもうこのえ散歩とか
造りとか石段あたりはえはってしまい
ましょうで生成したものはこちらですえ
足元の要素を削ったことで上半身が集中的
に描写できるようになり女の子が大きく
描かれるようになりますねこのように指定
する要素の重みや要素自体を減らしたり逆
に足すことでも構図が変わって主役脇役の
関係が変わってきますので強調候文と
合わせて要素の選別と整理をしてみると
いいかなと思い
ますで最後とくとちゃん君についてえここ
からに要素を出したいんだけどという時え
例えばこの女の子をえ私ダスコに変えたい
時えそんな時はえ私を見出す時のプロンク
と今こんな感じですとりあえずこれを単純
にプラスオンしちゃいますで生成すると
こんな感じになりましたぱっと見まあまあ
いいかなという気もするんですがよく見る
と変な出来上がりなものも結構多くなって
しまっていますえこんな感じで髪飾りを
抜けてたり2人目が登場したり髪が長かっ
たたりなんか眼鏡みたいなもの持ってたり
どうしても背景が弱くなりがちかなって
いう感じですねそれから色の要素がこれ
分かりますたでもえ着物の色がほぼほぼ黒
と緑になっちゃってますよねでなんで
かってことなんですがこれはおそらくです
がえいわゆる要素が大すぎ問題だと思われ
ますでこのプロンプト欄のここに注目して
くださいえこの数字気にしたことあります
かえこれ何かと言いますとトークンと呼ば
れるものでフロント欄に記載した単語だっ
たり文章ごとにトークンという数値で換算
されそれを積み上げられてここにカウント
されていきますでこのプロンプトラーは1
ジャンクとカウントされえ75トークンが
マックスの入れ物となってるようです75
トークンを超えるとどうなるかと言うと次
のページに行くように次のチャンクさが
続くようになっていますでねこのように
表記されていきえ次のチャンクがいっぱい
になるとまた次のチャンクへ続いていくと
いう仕組みらしいですえそれで一応
ステーブルディフュージョンの説明には
このチャンクの上限は特に決まってない
ようでえ実質PCのスペックに依存して
いるとのことですがえあまりに増えすぎる
と画像が破綻しやすくなり制御がどんどん
難しくなっていく傾向がありますなので
基本は要素を減らした方が綺麗な絵になり
やすいのですがそれでもどうしても要素が
多くなっちゃうという時はちょっとした
テクニックがありますえそれがこのブレイ
クってものですでこのブレイクという特殊
なコマンドプロンプととでも言うん
でしょうかねブレイク構文と呼ばれる書き
方がありますこのように多くなりすい
ちゃったプロンプトに対してこのブレイク
を組み込んでいきますでそもそもおかしく
なる原因を調べたところえこのようにえ
トク数が75の近辺でチャンクとチャンク
まえ出る要素これが悪営業を及ぼしやすい
とのことですということで少々ややこしい
んですがえ今ここでは
1/50となってますがえチャークま発生
してるのでえここのフレッシュフラワー
ヘアオーナメントお花の髪飾りの辺りです
かねえこちゃ玉をなくすためにブレイクを
使っていきたいと思います開業して
ちょっと分かりやすくしていますがこんな
感じでブレイクを組み込んでいきますえ
こんな感じでブレイクを入れることで
ブレイクを記載したところまでで75
トークンになるようになっていますで調べ
たところえ要するに75未満の半端なトク
数の後に続く形でブレイクが75トークン
となるようにえそのの隙間を意味のない
入力で埋めているらしいですで書き方とし
てはこのような書き方でブレイクの前後に
半角スペースを入れて要素と要素の間に
組み込むということですカマじゃなくて
いいそですで組み込んだものがこちらです
生き物の色はブラックヘアに影響されてい
そうだったのでその間にもブレイクを入れ
てみまし
たよしじゃあブレイクをたくさん入れれば
整理できて良さそうじゃんと思うと思うん
ですがででちょっと待ってくださいこんな
感じでブレークを使うことに全体のトク数
が激増してしまいやすくこれが生成画像の
品質を落とす原因になってしまいがちなの
でやってみた感じで言うとブレイクは5回
ぐらいまでに収めておいた方がいいかなと
思いますでブレイクを使って調整して生成
してできたものがこちらですまあまあいい
感じにできたんじゃないかなと思いますえ
回数回してみた感じはえトカ数が激増して
いる分成功率は少し不安定な気もしますが
色移りや要素の漏れなどが多少置きにくく
なったかなって印象でしたえなので多
すぎる要素対策としてはそこまで決定的な
解決方法ではないみたいですね逆に失敗
画像もえ出退していましたということで
効果はおじない程度と覚えていただけると
いいかなと思います結論としては強調と
抑制をつけて要素はなるべく少なく明瞭に
整理することが綺麗に画像生成をするコツ
になってくるかなと思いますはいという
ことで今回は以上です今回はステーブル
ディフュージョン式のプロンプト入力の
特性についての解説でしたがいかがだった
でしょうかえ改めて調べてみると結構独特
な細かい特性も色々あって奥が深いなと
感じましたえ特に単語と文章書きによる
違いなどは一見分かいづらいんですがよく
見ると違いがあって面白いですよねえ私も
今後プロンプとの構成にうまく活用できる
といいなと思ってますえということでえ
この動画が参考になったよっていう方はは
グッドボタンチャンネル登録の方よろしく
お願いしますえそれでは最後までご視聴
いただきましてありがとうございました
よかったらまた次の動画でお会いし
ましょうさよならバイ
[音楽]
バイ
Voir Plus de Vidéos Connexes
5.0 / 5 (0 votes)