【喋るAIイラスト】StableDiffusionで無制限に口パク動画を作る方法【SadTalker】

これすご-AIクリエイティブ-
24 May 202313:03

Summary

TLDRこの動画では、ステーブルディフュージョンの拡張機能である「さっとトーカー」を使って、無料で画像を喋らせる方法を紹介しています。手順は、まずWEBUIからさっとトーカーをインストールし、モデルデータをダウンロードして設定します。次に、fmpegという動画・音声の変換・再生ソフトウェアを導入し、設定を整えます。最後に、ユーザードットバットファイルを編集して、チェックポイントフォルダのパスを指定します。これで、顔と口がはっきりしている画像と音声ファイルを用意してアップロードすることで、自然な口パク動画が作成できます。有料のサービスと比較して、クオリティは劣りますが、無料で使える点で魅力的です。

Takeaways

  • 📦 ステーブルディフュージョンの拡張機能である「さっとトーカー」を使用すると、無料で画像を喋らせる動画を作成できます。
  • 🔍 オートマチック1111で使える「さっとトーカー」は、画像と音声を組み合わせて口パク動画を生成します。
  • 🎥 動画作成には、まずステーブルディフュージョンのWEBUIを開き、拡張機能をインストールする必要があります。
  • 📂 モデルデータをダウンロードし、チェックポイントフォルダに配置する必要があります。
  • 📝 ユーザードットバットファイルの編集で、チェックポイントフォルダのパスを設定します。
  • 📼 fmpegというフリーソフトを導入し、Windowsに認識させる必要があります。これは動画と音声を扱うためのツールです。
  • 🖼️ 口パクさせる画像は、顔と口がはっきり見えるものを選ぶ必要があります。
  • 🔊 音声ファイルは、音楽などのノイズがないようにしてください。
  • ⏱️ 音声ファイルの処理には時間がかかることがあります。例えば、12秒の音声で5分程度かかることがあります。
  • 🖌 フェイスウェイハンスメントのオプションを有効にすると、顔の画質が向上し、自然な表情が得られます。
  • ✅ リムーブヘッドホンモーションのオプションを有効にすると、顔の動きが減り、動画のクオリティが向上します。
  • 🚫 イラスト系の画像や、顔がはっきり映っていない画像は、エラーを引き起こす可能性があるため注意が必要です。

Q & A

  • ステーブルディフュージョンとは何ですか?

    -ステーブルディフュージョンは、画像を喋らせる拡張機能を提供するAI技術です。

  • オートマチック1111とは何ですか?

    -オートマチック1111は、ステーブルディフュージョンの拡張機能で、パソコンにインストールすることで使用できます。

  • 無料で使える最強の口パクツールとは何ですか?

    -無料で使える最強の口パクツールとは、ステーブルディフュージョンの拡張機能であるサットトーカーです。

  • サットトーカーをインストールするにはどうすればよいですか?

    -サットトーカーをインストールするには、まずWEBUIから拡張機能をインストールし、その後、モデルデータをダウンロードして設定する必要があります。

  • サットトーカーを使用する際には、どのような要件が必要ですか?

    -サットトーカーを使用するには、画像と音声ファイルが必要です。また、画像は顔と口がはっきり見える必要があり、エラーを避けるためにはアニメ系でもリアルな画風の画像が望ましいです。

  • fmpegとは何ですか?

    -fmpegは、動画と音声を記録、変換、再生するためのフリーソフトで、サットトーカーがこのソフトを使用して動画を作成します。

  • サットトーカーで作成された動画の品質はどのようになりますか?

    -サットトーカーで作成された動画は、有料のサービスに比べて品質は低く、顔の動きが不自然になる場合がありますが、設定を調整することで改善可能です。

  • サットトーカーの導入後に必要な設定変更は何ですか?

    -導入後には、ユーザードットバットファイルの編集でチェックポイントフォルダのパスを設定し、fmpegの導入とWindowsへの登録が必要です。

  • サットトーカーで動画を作成する際、どのようなポイントを意識すべきですか?

    -動画を作成する際には、顔の画質を高く保ち、フェイスウェイハンスメントを活用し、必要に応じてヘッドホンのリムーブヘッドモーションのチェックを入れることで、自然な表情の変化を実現できます。

  • サットトーカーを使用する際には、どのようなファイル形式が推奨されますか?

    -サットトーカーで使用する画像ファイルは、顔と口がはっきり見えるものを選ぶことが重要です。また、音声ファイルは音楽などの他の音声と混ざらないように注意する必要があります。

  • サットトーカーを使用した動画作成のプロセスを簡潔に説明してください。

    -まずWEBUIを開き、拡張機能をインストールします。次に、モデルデータをダウンロードして設定し、ユーザードットバットファイルを編集します。fmpegを導入し、Windowsに登録した後、サットトーカーを使用して動画を作成します。

  • サットトーカーで作成した動画を改善するためには?

    -フェイスウェイハンスメントを使用し、必要に応じてヘッドホンのリムーブヘッドモーションのチェックを入れることで、動画の品質を向上させることができます。

Outlines

00:00

😀 ステーブルディフュージョンで無料で使える口パクツール「サットトーカー」の紹介

ステーブルディフュージョンの拡張機能であるサットトーカーを使って、無料で画像を喋らせる動画を作成する方法が紹介されています。手順は、WEBUIからサットトーカーをインストールし、モデルをダウンロードし、ユーザードットバットを修正、fmpegの導入を行って、最後にサットトーカーを使って実際に口パク動画を作成するというものです。比較として、有料の口パクAIとの違いも説明されています。

05:12

📂 サットトーカーのインストールとモデルデータのダウンロード手順

ステーブルディフュージョンのWEBUIからサットトーカーをインストールし、必要なモデルデータをダウンロードする方法について説明されています。チェックポイントフォルダの作成、ダウンロードサイトからファイルをダウンロードし、展開して配置する手順が詳しく説明されています。また、ユーザードットバットの設定変更も行われています。

10:14

🎥 サットトーカーを使って実際に口パク動画を作成するプロセス

サットトーカーを使って口パク動画を作成するプロセスが詳しく説明されています。画像と音声ファイルを用意し、設定を調整しながら動画を作成する方法が紹介されています。フェイスウェイハンスメントやリムーブヘッドホンのチェックを入れることで、自然な表情の動画を作成することができるとされています。また、動画の品質向上のためのアドバイスも提供されています。

Mindmap

Keywords

💡ステーブルディフュージョン

ステーブルディフュージョンとは、人工知能を用いて画像を生成・編集することができるソフトウェアです。このビデオでは、その拡張機能の一つである「さっとトーカー」を使って、画像を喋らせる動画を作成する方法が紹介されています。

💡さっとトーカー

さっとトーカーは、ステーブルディフュージョンの拡張機能で、画像と音声を繋げて口パク動画を作成することができます。ビデオでは、無料で使える強力なツールとして紹介されており、手順通りに導入すれば誰でも簡単に利用できると説明されています。

💡口パク動画

口パク動画とは、人物の画像に対して音声を合わせて、その人物が話しているように見える動画を作成する方法です。このビデオでは、さっとトーカーを使って画像を喋らせ、自然な口パク動画を作る方法が詳しく説明されています。

💡WEBUI

WEBUIとは、Web User Interfaceの略で、ウェブ上でのユーザーインターフェースを意味します。ビデオでは、ステーブルディフュージョンのWEBUIを使ってさっとトーカーをインストールし、操作する方法が説明されています。

💡fmpeg

fmpegは、フリーソフトウェアで、動画や音声の記録・変換・再生ができるツールです。ビデオでは、さっとトーカーがこのソフトを利用して動画を作成しているため、導入が必要とされています。

💡チャットトーカー

チャットトーカーとは、中国で作られたステーブルディフュージョンの拡張機能で、音声と画像を繋げて口パク動画を作成できるツールです。ビデオでは、Twitterで話題になり、無料で使えるという利点が強調されています。

💡フェイスウェイハンスメント

フェイスウェイハンスメントは、さっとトーカーの機能の一つで、顔の質感を向上させるために使用されます。ビデオでは、この機能をオンにすることで、顔の画質が向上し、自然な表情が再現できることが説明されています。

💡リムーブヘッドホン

リムーブヘッドホンは、さっとトーカーの機能で、画像の頭部を削除するオプションです。ビデオでは、この機能をオンにすることで、顔の動きを減らし、クオリティを向上させることができると説明されています。

💡エクステンション

エクステンションとは、ソフトウェアに追加の機能を提供するプログラムのことです。ビデオでは、ステーブルディフュージョンのエクステンションとしてさっとトーカーをインストールし、利用する方法が紹介されています。

💡ユーザードットバット

ユーザードットバットとは、ソフトウェアの設定ファイルの一種で、ユーザーの設定を保存するために使われます。ビデオでは、さっとトーカーの導入手順の中で、このファイルを修正してモデルデータを読み込む方法が説明されています。

💡チェックポイント

チェックポイントとは、ソフトウェアの実行過程で特定のポイントまで到達したことを示すマークです。ビデオでは、さっとトーカーの導入手順で、チェックポイントフォルダを作成し、モデルデータを配置する必要があることが説明されています。

Highlights

ステーブルで風情LoveUIを使用可能に、画像を喋らせる拡張機能が非常に優れています。

この拡張機能は、オートマチック1111で使用でき、無料で使える最強の口パクツールです。

YouTubeで詳細を確認できます。有料のしゃべらせるAIもありますが、無料で使える場合は魅力的です。

ステーブルディフュージョンを使用すれば、ずっと無料で作り放題です。お金をかけたくない方におすすめです。

チャットトーカーは中国の開発者によって作られた、ステーブルディフュージョンの拡張機能です。

画像と音声だけあれば、口パク動画が作れます。Twitterでも話題になっていました。

ステーブルディフュージョンWEBUIとオートマチック1111をパソコンにインストールする必要があります。

インストール方法は、提供された動画を参考にしてください。

拡張機能を有効にするには、WEBUIを再起動する必要があります。

サットトーカーのモデルデータをダウンロードし、特定のフォルダに配置する必要があります。

ユーザードットバットファイルを編集して、チェックポイントフォルダのパスを設定します。

fmpegというフリーソフトを導入し、動画と音声の記録・変換・再生に使用します。

fmpegをWindowsに認識させるために、特定のコマンドを実行する必要があります。

さっとトーカーを使用して、口パク動画を作成する方法が説明されています。

画像と音声ファイルをアップロードし、設定を調整することで、口パク動画が生成されます。

フェイスウェイハンスメントを有効にすると、顔の画質が向上し、自然な動きになります。

リムーブヘッドホンながらのチェックを入れると、顔の動きが減り、クオリティが向上します。

アニメ系の画像では失敗する可能性があり、顔がはっきり映っている単一人物の画像が望ましいです。

ステーブルディフュージョンウェブアイの拡張機能を使って、無料で口パク動画を作成する方法が解説されています。

Transcripts

play00:00

今回はステーブルで風情LoveUI

play00:03

オートマチック1111で使える

play00:06

画像を喋らせる拡張機能が想像以上に

play00:10

すごかったのでご紹介します今からお見せ

play00:13

する動画が実際に喋らせてみた動画になり

play00:16

ます

play00:17

画像を喋らせてみた

play00:19

画像を用意してアップロードするだけ

play00:21

ずっと無料で使える最強口パクツール

play00:25

シャドダルカーで検索

play00:28

詳細はYouTubeでどうですか有料の

play00:31

しゃべらせるAIはいくつかありますが

play00:34

これが無料で使えるならアリですね

play00:38

比較するために平原で作成した

play00:41

口パク動画と比較してみましょう

play00:56

さすがに有料のはクオリティが高いですね

play00:59

目をつぶったり顔は動かす動作が自然です

play01:03

ね今回紹介するサットトーカーは

play01:06

ステーブルディフュージョンは武勇Iが

play01:08

使えればずっと無料で作り放題なのでお金

play01:12

をかけたくない方はおすすめですチャット

play01:15

トーカーとは中国の方が作った

play01:18

ステーブルディフュージョンの拡張機能で

play01:21

画像と音声だけあれば

play01:23

口パク動画が作れますTwitterでも

play01:26

話題になっていましたねさっとトーカーは

play01:29

ステーブルディフュージョンWEBUI

play01:31

オートマチック1111がパソコンに

play01:34

インストールされている必要があります

play01:37

インストールがまだの方はこちらの動画を

play01:41

参考にインストールしてくださいね今回の

play01:44

動画の流れです1WEBUIから

play01:47

サドータルカンをインストールにサブタル

play01:51

カーのモデルをダウンロード3ご意見

play01:54

ユーザードットバットを修正4fmpeg

play01:58

の導入後

play02:00

佐渡タルカを使ってみるこんにちは

play02:03

モニタロですミントだよ当チャンネルでは

play02:06

AIAIイラスト

play02:09

ITに関する最新テック情報をお届けして

play02:13

いますこの動画がいいなと思っていただけ

play02:16

たらいいねフォローしていただけると

play02:19

励みになりますそれではさっとトーカーを

play02:23

導入して

play02:24

口パク動画を作ってみましょう

play02:27

[音楽]

play02:31

まず最初に

play02:34

ステーブルリフジョンマブユーアイを開い

play02:35

てください開けたらエクステーション

play02:38

スタブに移動しますその中のインストール

play02:42

from

play02:42

URLタブに移動します

play02:45

URL欄に上のURLを入れてください

play02:48

動画

play02:49

概要欄にリンクを貼っておきます

play02:52

URLが入ったらインストールボタンで

play02:55

インストールしましょうリスタートと表示

play02:58

されたらインストール完了です

play03:01

インストールタブに移動します

play03:04

[音楽]

play03:07

拡張機能を有効にするために

play03:10

アプライアンドリスターという愛ボタンを

play03:12

押してWEBUIを再起動します再起動に

play03:16

少し時間がかかります

play03:23

この時は2分くらいかかりましたもし

play03:27

再起動しない場合は一旦WEBUIを消し

play03:30

て再起動してみてくださいWEB

play03:34

UIが立ち上がったらさっとトーカーが

play03:37

追加されていたら

play03:39

成功ですですがこのままでは使えません

play03:42

一旦WEBユーザーは終了してください次

play03:46

はサットトーカーのモデルデータの

play03:49

ダウンロードです

play03:53

まず最初にモデルデータを入れるフォルダ

play03:56

を作ります指テーブルディフュージョン

play03:59

WEBUIフォルダ内の

play04:01

エクステンションスフォルダ内のサット

play04:04

トークンフォルダを開きますチャット

play04:07

トーク内に

play04:08

チェックポイントフォルダを作成します

play04:13

[音楽]

play04:17

次に動画

play04:20

概要欄にあるチャットトーカーの

play04:21

ダウンロードサイトを開き全てのファイル

play04:24

をダウンロードしましょう全てを選択し下

play04:29

ボタンでダウンロードできますデータ容量

play04:32

が大きいため

play04:34

反応が鈍い場合があります

play04:36

ZIPファイルが2つダウンロードされる

play04:39

はずです先ほど作った

play04:41

チェックポイントフォルダに保存して

play04:43

ください

play04:44

[音楽]

play04:49

ZIPファイルが保存できたら右クリック

play04:52

して全て

play04:54

展開してください

play04:55

[音楽]

play05:11

もう一つのZIPファイルも展開し

play05:14

ましょう

play05:18

[音楽]

play05:35

展開が終わったらフォルダ内のファイルを

play05:37

切り取って

play05:39

チェックポイント内に貼り付けてください

play05:45

ファイルを置き換えるかメッセージが出た

play05:48

場合はバツで閉じればOKです

play05:53

最終的にフォルダが2つファイルが8つに

play05:57

なればダウンロードは完了です

play06:01

では次に

play06:03

ウェディーユーザードットバットの修正

play06:05

です

play06:06

[音楽]

play06:08

[拍手]

play06:10

増えてユーザードットバットファイルを右

play06:13

クリックして

play06:15

編集で開いてください

play06:16

[音楽]

play06:24

チェックポイントフォルダのフォルダパス

play06:26

をコピーしセットPythonの下に追加

play06:29

します

play06:30

ポルダパスは環境によって違うのでこちら

play06:34

を参考に追加してくださいね

play06:37

[音楽]

play06:43

では次に

play06:45

fmpagの導入です

play06:48

fmpegとは動画と音声を記録変換再生

play06:52

するためのフリーソフトでチャットトー

play06:55

カーがこのソフトを使っているため必要に

play06:58

なります動画

play07:00

概要欄にリンクを貼ってあるので開いて

play07:03

ダウンロードしましょう

play07:05

ダウンロードできたら保存先を開いて

play07:09

圧縮ファイルを展開します特殊な圧縮

play07:12

ファイルなのでソフトが必要です7

play07:17

Zipというフリーソフトが有名ですまだ

play07:20

未導入の方はインストールしてくださいね

play07:23

動画

play07:24

概要欄にリンクを貼っておきます

play07:30

展開したfmpegフォルダをCドライブ

play07:34

の直下に移動させフォルダ名を

play07:37

fmpagだけにしましょう

play07:40

次に

play07:41

fmpegフォルダの場所を

play07:43

Windowsに知らせてあげます

play07:46

Windowsシステム32の中に

play07:50

cmd.Excelがあるので右クリック

play07:52

して

play07:53

管理者として実行で開きます

play07:56

黒画面が開いたら上のコマンドを入力して

play08:01

Enterを押します

play08:05

[音楽]

play08:33

指定した値は保存されましたと表示され

play08:37

たらOKです

play08:40

これでさっとトーカーの導入が終わりまし

play08:43

play08:43

[音楽]

play08:47

それではさっとトーカーを使ってみ

play08:50

ましょういつも通りWeユーザードット

play08:54

バットから起動します

play09:08

起動しました

play09:08

[音楽]

play09:12

さっとトーカータブに移動します簡単に

play09:16

説明しますねここに

play09:19

口パクさせる画像を入れます顔

play09:22

口がはっきり写っている画像でないと

play09:25

エラーが出る確率が高いですアニメ系でも

play09:29

リアルな画風な画像は

play09:31

成功します音声ファイルはここに入れます

play09:34

音楽などは入らないようにしてくださいね

play09:37

今回私が使う音声ファイルはこちら

play09:42

画像を喋らせてみた

play09:43

画像を用意してアップロードするだけ

play09:46

ずっと無料で使える最強口パクツール

play09:50

サドータルカーで検索

play09:52

詳細はYouTubeで

play09:55

クロップは拡大リサイズはサイズ変更です

play09:58

がサイズはそのままのサイズで出力する

play10:01

フォルがおすすめです他はチェックを入れ

play10:04

ずに出力してみますね

play10:10

だいたい12秒の音声で5分くらいかかり

play10:13

ます

play10:14

[音楽]

play10:23

出てきました開いてみます

play10:30

[音楽]

play10:37

ちょっと顔の画質が悪いのと顔が動きすぎ

play10:41

て不自然ですね大丈夫です先ほどの

play10:45

チェックを入れると

play10:46

改善されます次は

play10:49

フェイスウェイハンスメントにチェックを

play10:51

入れてみましょう

play10:53

[音楽]

play10:59

出てきました見てみましょう

play11:04

顔が高画質になりました少し時間がかかり

play11:07

ますが

play11:09

フェースウェイハウスメントにはチェック

play11:10

は入れた方が良さそうです

play11:15

では最後にリムーブヘッドホンながらの

play11:19

チェックを入れてみましょう

play11:20

[音楽]

play11:46

出てきました見てみましょう

play11:52

顔の動きが減ってクオリティが高くなり

play11:55

ましたねこれが冒頭で流した動画になり

play11:58

ます

play11:59

もう少し顔の動きが欲しいところですね

play12:03

リムーブヘッドモーションのチェックは

play12:06

好みで入れなくてもいいかもです

play12:09

ちなみに私のアイコンになっている画像で

play12:12

試したところエラーになってしまいました

play12:16

イラスト系でも顔がはっきり映っている

play12:19

画像で1人だけ映っている画像であれば

play12:23

成功します

play12:26

口が閉じている画像だからなのか

play12:28

口が不自然ですね

play12:31

アニメ系は失敗してしまいましたお疲れ様

play12:35

でしたどうでしたか今回はステーブル

play12:40

ディフュージョンウェブアイの拡張機能

play12:42

さっとトーカーを導入して

play12:45

口パク動画を作るを解説しましたこの動画

play12:48

がいいなと思っていただけたらいいね

play12:51

フォローしていただけると

play12:53

励みになります最後までご視聴ありがとう

play12:56

ございましたまたお会いしましょうまたね

Rate This

5.0 / 5 (0 votes)

Related Tags
ステーブルディフュージョンさっとトーカー口パク動画フリーソフト導入手順AI技術YouTube比較動画拡張機能無料ツールチャットトーカー
Do you need a summary in English?