【喋るAIイラスト】StableDiffusionで無制限に口パク動画を作る方法【SadTalker】
Summary
TLDRこの動画では、ステーブルディフュージョンの拡張機能である「さっとトーカー」を使って、無料で画像を喋らせる方法を紹介しています。手順は、まずWEBUIからさっとトーカーをインストールし、モデルデータをダウンロードして設定します。次に、fmpegという動画・音声の変換・再生ソフトウェアを導入し、設定を整えます。最後に、ユーザードットバットファイルを編集して、チェックポイントフォルダのパスを指定します。これで、顔と口がはっきりしている画像と音声ファイルを用意してアップロードすることで、自然な口パク動画が作成できます。有料のサービスと比較して、クオリティは劣りますが、無料で使える点で魅力的です。
Takeaways
- 📦 ステーブルディフュージョンの拡張機能である「さっとトーカー」を使用すると、無料で画像を喋らせる動画を作成できます。
- 🔍 オートマチック1111で使える「さっとトーカー」は、画像と音声を組み合わせて口パク動画を生成します。
- 🎥 動画作成には、まずステーブルディフュージョンのWEBUIを開き、拡張機能をインストールする必要があります。
- 📂 モデルデータをダウンロードし、チェックポイントフォルダに配置する必要があります。
- 📝 ユーザードットバットファイルの編集で、チェックポイントフォルダのパスを設定します。
- 📼 fmpegというフリーソフトを導入し、Windowsに認識させる必要があります。これは動画と音声を扱うためのツールです。
- 🖼️ 口パクさせる画像は、顔と口がはっきり見えるものを選ぶ必要があります。
- 🔊 音声ファイルは、音楽などのノイズがないようにしてください。
- ⏱️ 音声ファイルの処理には時間がかかることがあります。例えば、12秒の音声で5分程度かかることがあります。
- 🖌 フェイスウェイハンスメントのオプションを有効にすると、顔の画質が向上し、自然な表情が得られます。
- ✅ リムーブヘッドホンモーションのオプションを有効にすると、顔の動きが減り、動画のクオリティが向上します。
- 🚫 イラスト系の画像や、顔がはっきり映っていない画像は、エラーを引き起こす可能性があるため注意が必要です。
Q & A
ステーブルディフュージョンとは何ですか?
-ステーブルディフュージョンは、画像を喋らせる拡張機能を提供するAI技術です。
オートマチック1111とは何ですか?
-オートマチック1111は、ステーブルディフュージョンの拡張機能で、パソコンにインストールすることで使用できます。
無料で使える最強の口パクツールとは何ですか?
-無料で使える最強の口パクツールとは、ステーブルディフュージョンの拡張機能であるサットトーカーです。
サットトーカーをインストールするにはどうすればよいですか?
-サットトーカーをインストールするには、まずWEBUIから拡張機能をインストールし、その後、モデルデータをダウンロードして設定する必要があります。
サットトーカーを使用する際には、どのような要件が必要ですか?
-サットトーカーを使用するには、画像と音声ファイルが必要です。また、画像は顔と口がはっきり見える必要があり、エラーを避けるためにはアニメ系でもリアルな画風の画像が望ましいです。
fmpegとは何ですか?
-fmpegは、動画と音声を記録、変換、再生するためのフリーソフトで、サットトーカーがこのソフトを使用して動画を作成します。
サットトーカーで作成された動画の品質はどのようになりますか?
-サットトーカーで作成された動画は、有料のサービスに比べて品質は低く、顔の動きが不自然になる場合がありますが、設定を調整することで改善可能です。
サットトーカーの導入後に必要な設定変更は何ですか?
-導入後には、ユーザードットバットファイルの編集でチェックポイントフォルダのパスを設定し、fmpegの導入とWindowsへの登録が必要です。
サットトーカーで動画を作成する際、どのようなポイントを意識すべきですか?
-動画を作成する際には、顔の画質を高く保ち、フェイスウェイハンスメントを活用し、必要に応じてヘッドホンのリムーブヘッドモーションのチェックを入れることで、自然な表情の変化を実現できます。
サットトーカーを使用する際には、どのようなファイル形式が推奨されますか?
-サットトーカーで使用する画像ファイルは、顔と口がはっきり見えるものを選ぶことが重要です。また、音声ファイルは音楽などの他の音声と混ざらないように注意する必要があります。
サットトーカーを使用した動画作成のプロセスを簡潔に説明してください。
-まずWEBUIを開き、拡張機能をインストールします。次に、モデルデータをダウンロードして設定し、ユーザードットバットファイルを編集します。fmpegを導入し、Windowsに登録した後、サットトーカーを使用して動画を作成します。
サットトーカーで作成した動画を改善するためには?
-フェイスウェイハンスメントを使用し、必要に応じてヘッドホンのリムーブヘッドモーションのチェックを入れることで、動画の品質を向上させることができます。
Outlines
😀 ステーブルディフュージョンで無料で使える口パクツール「サットトーカー」の紹介
ステーブルディフュージョンの拡張機能であるサットトーカーを使って、無料で画像を喋らせる動画を作成する方法が紹介されています。手順は、WEBUIからサットトーカーをインストールし、モデルをダウンロードし、ユーザードットバットを修正、fmpegの導入を行って、最後にサットトーカーを使って実際に口パク動画を作成するというものです。比較として、有料の口パクAIとの違いも説明されています。
📂 サットトーカーのインストールとモデルデータのダウンロード手順
ステーブルディフュージョンのWEBUIからサットトーカーをインストールし、必要なモデルデータをダウンロードする方法について説明されています。チェックポイントフォルダの作成、ダウンロードサイトからファイルをダウンロードし、展開して配置する手順が詳しく説明されています。また、ユーザードットバットの設定変更も行われています。
🎥 サットトーカーを使って実際に口パク動画を作成するプロセス
サットトーカーを使って口パク動画を作成するプロセスが詳しく説明されています。画像と音声ファイルを用意し、設定を調整しながら動画を作成する方法が紹介されています。フェイスウェイハンスメントやリムーブヘッドホンのチェックを入れることで、自然な表情の動画を作成することができるとされています。また、動画の品質向上のためのアドバイスも提供されています。
Mindmap
Keywords
💡ステーブルディフュージョン
💡さっとトーカー
💡口パク動画
💡WEBUI
💡fmpeg
💡チャットトーカー
💡フェイスウェイハンスメント
💡リムーブヘッドホン
💡エクステンション
💡ユーザードットバット
💡チェックポイント
Highlights
ステーブルで風情LoveUIを使用可能に、画像を喋らせる拡張機能が非常に優れています。
この拡張機能は、オートマチック1111で使用でき、無料で使える最強の口パクツールです。
YouTubeで詳細を確認できます。有料のしゃべらせるAIもありますが、無料で使える場合は魅力的です。
ステーブルディフュージョンを使用すれば、ずっと無料で作り放題です。お金をかけたくない方におすすめです。
チャットトーカーは中国の開発者によって作られた、ステーブルディフュージョンの拡張機能です。
画像と音声だけあれば、口パク動画が作れます。Twitterでも話題になっていました。
ステーブルディフュージョンWEBUIとオートマチック1111をパソコンにインストールする必要があります。
インストール方法は、提供された動画を参考にしてください。
拡張機能を有効にするには、WEBUIを再起動する必要があります。
サットトーカーのモデルデータをダウンロードし、特定のフォルダに配置する必要があります。
ユーザードットバットファイルを編集して、チェックポイントフォルダのパスを設定します。
fmpegというフリーソフトを導入し、動画と音声の記録・変換・再生に使用します。
fmpegをWindowsに認識させるために、特定のコマンドを実行する必要があります。
さっとトーカーを使用して、口パク動画を作成する方法が説明されています。
画像と音声ファイルをアップロードし、設定を調整することで、口パク動画が生成されます。
フェイスウェイハンスメントを有効にすると、顔の画質が向上し、自然な動きになります。
リムーブヘッドホンながらのチェックを入れると、顔の動きが減り、クオリティが向上します。
アニメ系の画像では失敗する可能性があり、顔がはっきり映っている単一人物の画像が望ましいです。
ステーブルディフュージョンウェブアイの拡張機能を使って、無料で口パク動画を作成する方法が解説されています。
Transcripts
今回はステーブルで風情LoveUI
オートマチック1111で使える
画像を喋らせる拡張機能が想像以上に
すごかったのでご紹介します今からお見せ
する動画が実際に喋らせてみた動画になり
ます
画像を喋らせてみた
画像を用意してアップロードするだけ
ずっと無料で使える最強口パクツール
シャドダルカーで検索
詳細はYouTubeでどうですか有料の
しゃべらせるAIはいくつかありますが
これが無料で使えるならアリですね
比較するために平原で作成した
口パク動画と比較してみましょう
さすがに有料のはクオリティが高いですね
目をつぶったり顔は動かす動作が自然です
ね今回紹介するサットトーカーは
ステーブルディフュージョンは武勇Iが
使えればずっと無料で作り放題なのでお金
をかけたくない方はおすすめですチャット
トーカーとは中国の方が作った
ステーブルディフュージョンの拡張機能で
画像と音声だけあれば
口パク動画が作れますTwitterでも
話題になっていましたねさっとトーカーは
ステーブルディフュージョンWEBUI
オートマチック1111がパソコンに
インストールされている必要があります
インストールがまだの方はこちらの動画を
参考にインストールしてくださいね今回の
動画の流れです1WEBUIから
サドータルカンをインストールにサブタル
カーのモデルをダウンロード3ご意見
ユーザードットバットを修正4fmpeg
の導入後
佐渡タルカを使ってみるこんにちは
モニタロですミントだよ当チャンネルでは
AIAIイラスト
ITに関する最新テック情報をお届けして
いますこの動画がいいなと思っていただけ
たらいいねフォローしていただけると
励みになりますそれではさっとトーカーを
導入して
口パク動画を作ってみましょう
[音楽]
まず最初に
ステーブルリフジョンマブユーアイを開い
てください開けたらエクステーション
スタブに移動しますその中のインストール
from
URLタブに移動します
URL欄に上のURLを入れてください
動画
概要欄にリンクを貼っておきます
URLが入ったらインストールボタンで
インストールしましょうリスタートと表示
されたらインストール完了です
インストールタブに移動します
[音楽]
拡張機能を有効にするために
アプライアンドリスターという愛ボタンを
押してWEBUIを再起動します再起動に
少し時間がかかります
この時は2分くらいかかりましたもし
再起動しない場合は一旦WEBUIを消し
て再起動してみてくださいWEB
UIが立ち上がったらさっとトーカーが
追加されていたら
成功ですですがこのままでは使えません
一旦WEBユーザーは終了してください次
はサットトーカーのモデルデータの
ダウンロードです
まず最初にモデルデータを入れるフォルダ
を作ります指テーブルディフュージョン
WEBUIフォルダ内の
エクステンションスフォルダ内のサット
トークンフォルダを開きますチャット
トーク内に
チェックポイントフォルダを作成します
[音楽]
次に動画
概要欄にあるチャットトーカーの
ダウンロードサイトを開き全てのファイル
をダウンロードしましょう全てを選択し下
ボタンでダウンロードできますデータ容量
が大きいため
反応が鈍い場合があります
ZIPファイルが2つダウンロードされる
はずです先ほど作った
チェックポイントフォルダに保存して
ください
[音楽]
ZIPファイルが保存できたら右クリック
して全て
展開してください
[音楽]
もう一つのZIPファイルも展開し
ましょう
[音楽]
展開が終わったらフォルダ内のファイルを
切り取って
チェックポイント内に貼り付けてください
ファイルを置き換えるかメッセージが出た
場合はバツで閉じればOKです
最終的にフォルダが2つファイルが8つに
なればダウンロードは完了です
では次に
ウェディーユーザードットバットの修正
です
[音楽]
[拍手]
増えてユーザードットバットファイルを右
クリックして
編集で開いてください
[音楽]
チェックポイントフォルダのフォルダパス
をコピーしセットPythonの下に追加
します
ポルダパスは環境によって違うのでこちら
を参考に追加してくださいね
[音楽]
では次に
fmpagの導入です
fmpegとは動画と音声を記録変換再生
するためのフリーソフトでチャットトー
カーがこのソフトを使っているため必要に
なります動画
概要欄にリンクを貼ってあるので開いて
ダウンロードしましょう
ダウンロードできたら保存先を開いて
圧縮ファイルを展開します特殊な圧縮
ファイルなのでソフトが必要です7
Zipというフリーソフトが有名ですまだ
未導入の方はインストールしてくださいね
動画
概要欄にリンクを貼っておきます
展開したfmpegフォルダをCドライブ
の直下に移動させフォルダ名を
fmpagだけにしましょう
次に
fmpegフォルダの場所を
Windowsに知らせてあげます
Windowsシステム32の中に
cmd.Excelがあるので右クリック
して
管理者として実行で開きます
黒画面が開いたら上のコマンドを入力して
Enterを押します
[音楽]
指定した値は保存されましたと表示され
たらOKです
これでさっとトーカーの導入が終わりまし
た
[音楽]
それではさっとトーカーを使ってみ
ましょういつも通りWeユーザードット
バットから起動します
起動しました
[音楽]
さっとトーカータブに移動します簡単に
説明しますねここに
口パクさせる画像を入れます顔
口がはっきり写っている画像でないと
エラーが出る確率が高いですアニメ系でも
リアルな画風な画像は
成功します音声ファイルはここに入れます
音楽などは入らないようにしてくださいね
今回私が使う音声ファイルはこちら
画像を喋らせてみた
画像を用意してアップロードするだけ
ずっと無料で使える最強口パクツール
サドータルカーで検索
詳細はYouTubeで
クロップは拡大リサイズはサイズ変更です
がサイズはそのままのサイズで出力する
フォルがおすすめです他はチェックを入れ
ずに出力してみますね
だいたい12秒の音声で5分くらいかかり
ます
[音楽]
出てきました開いてみます
[音楽]
ちょっと顔の画質が悪いのと顔が動きすぎ
て不自然ですね大丈夫です先ほどの
チェックを入れると
改善されます次は
フェイスウェイハンスメントにチェックを
入れてみましょう
[音楽]
出てきました見てみましょう
顔が高画質になりました少し時間がかかり
ますが
フェースウェイハウスメントにはチェック
は入れた方が良さそうです
では最後にリムーブヘッドホンながらの
チェックを入れてみましょう
[音楽]
出てきました見てみましょう
顔の動きが減ってクオリティが高くなり
ましたねこれが冒頭で流した動画になり
ます
もう少し顔の動きが欲しいところですね
リムーブヘッドモーションのチェックは
好みで入れなくてもいいかもです
ちなみに私のアイコンになっている画像で
試したところエラーになってしまいました
イラスト系でも顔がはっきり映っている
画像で1人だけ映っている画像であれば
成功します
口が閉じている画像だからなのか
口が不自然ですね
アニメ系は失敗してしまいましたお疲れ様
でしたどうでしたか今回はステーブル
ディフュージョンウェブアイの拡張機能
さっとトーカーを導入して
口パク動画を作るを解説しましたこの動画
がいいなと思っていただけたらいいね
フォローしていただけると
励みになります最後までご視聴ありがとう
ございましたまたお会いしましょうまたね
Ver Más Videos Relacionados
【AI作曲】StableAudioの使い方!商用可の音楽を作成する方法!
【Morph studio/モーフスタジオ】動画を生成してワンショットをつなぎ合わせていけるサービス!100ショット(シーン)くらい長くつなげる!!
【顔出しなしOK】完全無料!Canva×ChatGPTを使って本格的なアニメーション動画を作成する方法・全手順
【無料で使える動画生成AI】Stable Video Diffusionってどうなの?PikaやGen-2と比較してみた
Make Money Creating AI Animation Video | Kids Learning YouTube Video | AI Tools
【最新】ChatGPT4oでできること10選!「チャットGPT4o」の使い方/無料版と有料版の違いとは!?
5.0 / 5 (0 votes)