Lip Sync for your AI MOVIES!

Mickmumpitz
11 Feb 202404:46

Summary

TLDRこのビデオスクリプトでは、AIムービーのリップシンク作成のための2つのワークフローが紹介されています。最初に、Syntheesisという有料サービスを使った方法が説明され、次に無料のオプションとしてWave to Lipを使った手作業が多い手順が紹介されています。後半では、Comfyという無料ツールを使ってリップシンクを簡単に作成する方法が示されており、ワークフローの自動化と結果の改善に重点が置かれています。プロセス全体を効率化し、短編映画の制作期間を大幅に短縮できるようになりました。

Takeaways

  • 🔗 SynLabsを使用してAIムービーのリップシンクを作成する方法が紹介されています。
  • 🎥 無料バージョンに大きな透かしマークが追加されたため、SynLabsは有料版が推奨されています。
  • 🆓 無料の代替ワークフローとして、Wave to Lipツールが紹介されています。
  • 📉 Wave to Lipは優れたリップシンクを提供しますが、画像品質が低いという問題があります。
  • 🛠️ 低品質の口元をマスキングして元の高解像度ビデオに合成する工程が解説されています。
  • 🔄 PNGシーケンスを通じて顔の修復ツールにかけ、最終的なビデオ品質を向上させるプロセスが紹介されています。
  • 💡 Wave to Lipと組み合わせて使用する自動化された新しいワークフローが提示されています。
  • 📁 コミュニティからダウンロード可能な無料のコミワークフローが利用でき、簡単に統合できることが強調されています。
  • 🖥️ 必要なモデルとカスタムノードのインストールが必要であることが説明されています。
  • ⏱️ 新しいワークフローにより、リップシンクの追加にかかる時間が大幅に短縮されると強調されています。

Q & A

  • この映画でのリップシンク効果を作成するために使用されたツールは何ですか?

    -synlaabsというウェブサイトを使用しました。そのサイトにビデオと音声ファイルをアップロードして、モデルを選択すると、リップシンク動画を生成できます。

  • synlaabsの無料バージョンにはどのような制限がありますか?

    -最近、synlaabsの無料バージョンには大きなウォーターマークが追加されました。したがって、大量のリップシンク動画を生成したい場合は、有料版を使う必要があります。

  • 前のワークフローではどのようなプロセスを経てリップシンクを作成していましたか?

    -以前のワークフローでは、wave to lipを使ってリップシンクを作成し、画質の悪いマウスだけを切り取って元の高解像度ビデオに重ね合わせていました。そして、PNG画像シーケンスに変換し、AUTOMATIC1111のExtrasタブを使って顔を修正していました。

  • 新しいワークフローはどのようなプロセスを経てリップシンクを作成していますか?

    -新しいワークフローでも、wave to lipをベースにリップシンクを作成しています。その後、コミーのワークフローを使ってマウスを自動的に切り取り、元の高画質ビデオと合成します。

  • 新しいワークフローの利点は何ですか?

    -新しいワークフローでは、リップシンク動画を作成するプロセスがシンプルで自動化されているため、時間をかけずにリップシンク動画を作成できるようになりました。

  • wave to lipを使用する際、どのように設定しますか?

    -wave to lipのリンクをクリックして、セットアップステップを実行します。その後、ビデオとオーディオファイルをアップロードして、リップシンク処理を実行します。

  • コミーのワークフローをインストールするにはどうすればよいですか?

    -私のパトロンページからコミーのワークフローをダウンロードし、コミーのUIにドラッグ&ドロップします。また、コミーマネージャーからカスタムノードとモデルをインストールする必要があります。

  • このワークフローでは、どのようにマウスを切り取っていますか?

    -コミーのワークフローには、低解像度のwave to lip動画から顔を修復するノードと、自動でマウスを切り取り、元の高画質ビデオと合成するノードが含まれています。

  • コミーのワークフローではどのようにして顔を修正していますか?

    -最後に顔修復ノードが追加されており、目などの顔の部分を修正することができます。ただし、顔の形を変えすぎる可能性もあるため、必要に応じて無効化することもできます。

  • これらのワークフローとツールを使って、どのような作品を作ろうとしていますか?

    -人工知能シリーズの次回エピソードで、宇宙での人類の未来についての話をする登場人物を作ろうと考えています。リップシンクを使って会話する主人公を作成し、短編映画を完成させる予定です。

Outlines

00:00

🖥️ 2つの無料アプリを使ったリップシンク動画の作り方

この段落では、リップシンク動画を作成する2つの無料ワークフローについて説明しています。まず、Syntoaysというサービスを使って、動画とオーディオファイルをアップロードすると、数分でリップシンク動画が作成できます。しかし、無料版では大きな透かしが付くため、長時間のリップシンク動画を作る場合は高額な料金が必要になります。2番目のワークフローでは、WaveToLipというツールを使い、口元の部分だけを切り取ってオリジナル動画に合成する無料で複雑なワークフローを説明しています。最後に、この方法には多くの手順が必要だったため、簡単でよりオートメーション化された新しいワークフローを紹介しています。

Mindmap

Keywords

💡リップシンク

口の動きを音声に合わせる技術のこと。この動画では、リップシンクを使ってAIキャラクターに口を動かして話させる方法を説明している。「SynLabsを使って簡単にリップシンクが作れる」「wave to lipを使って無料でリップシンクを作る」など、多くの例を挙げて説明されている。

💡AIキャラクター

人工知能によって生成された映像キャラクターのこと。動画では、「プレゼンターやプロタゴニスト役のAIキャラクターを作りたい」と述べ、リップシンク技術を使ってAIキャラクターに口を動かす方法を紹介している。

💡AIフィルムメーカー

人工知能を使って映像作品を作る人のこと。動画の作者は自分を「AI フィルムメーカー」と呼び、AIのツールを使って短編映画を作成する過程を説明している。「私のように、AIフィルムメーカーにとっては便利なワークフローになるはずです」といった例がある。

💡ワークフロー

特定の作業を効率的に行うための一連の手順のこと。動画では、リップシンクを適用する2つのワークフロー(SynLab、wave to lipとComify)の説明が中心となっている。「この新しいワークフローなら、とても簡単にリップシンク映像を作れます」など、ワークフローの手順を詳しく説明している。

💡SynLab

リップシンクを自動生成するWeb製品の名前。動画では「SynLabsを使うと、動画とオーディオファイルをアップロードするだけでリップシンクが作れる」と説明し、この製品の使い方を紹介している。無料版では大きな透かし入りになる点も指摘されている。

💡wave to lip

リップシンクを自動生成するオープンソースのツールの名前。動画の後半では、wave to lipとComifyを組み合わせて使う新しいワークフローが紹介されている。「wave to lipを基盤に使い、Comifyでマスクをかけて高解像度の映像と合成する」という手順が説明されている。

💡Comify

動画編集・画像処理用のAIツールの名前。動画では、Comifyを使って、wave to lipの低解像度の口元のみをマスクして、元の高解像度映像と合成するワークフローが紹介されている。「Comifyの無料ワークフローをダウンロードして使えば簡単にリップシンク映像ができる」と説明されている。

💡フェイス リストア

人工知能を使った顔修復の技術のこと。映像内の人物の顔を綺麗に修復し、違和感なく自然に見えるようにする処理のこと。動画のComifyのワークフローでは、フェイスリストアを使って、生成されたキャラクターの顔の品質を上げる手順が紹介されている。

💡パトロン

クリエイターの活動を金銭的に支援するファンの呼び名。動画の最後で、この動画がパトロンからの支援によって制作されたことに感謝の言葉が述べられている。「素晴らしいパトロンのおかげで、このような動画を作ることができます」という具合に、クリエイターとファンのつながりが示されている。

💡短編映画

映画の中でも短い尺の作品のこと。動画の作者は「次のAIシリーズの短編映画で実際にプレゼンターのAIキャラクターを作ろうと思っています」と述べており、リップシンク技術を使ってAIキャラクターを登場させる短編映画の制作を目指していることがわかる。

Highlights

Two workflows for creating lip sync for AI movies are discussed.

The first workflow utilizes Synlabs, a tool that allows users to upload a video and an audio file to generate lip-synced videos, with the recommendation to use their 1.5 model for the best results.

Synlabs offers a free version that allows users to generate minutes of audio per month, but with a large watermark.

For users who want to generate a lot of AI-generated lip sync videos and have the budget, Synlabs is a suitable tool, but it can become expensive for casual AI filmmakers.

The second workflow utilizes Wave to Lip, a free tool that produces good lip sync but with poor image quality.

To improve the image quality, the author manually masked out the mouth and placed it over the original video, then exported it as a PNG sequence.

The author then ran the PNG sequence through Automatic1111's extras tab, using a combination of GFPGAN and CodeFormer to fix the broken AI faces.

The final result was a high-resolution video with a poor-quality mouth that was fixed using this workflow.

The author simplified and automated the workflow to use Wave to Lip as the foundation, with a link provided in the video description.

The author's simplified workflow involves connecting to Google Drive, running the setup, and uploading the original video and audio files to generate the lip-synced video.

To improve the appearance, the author recommends downloading a free comi workflow from their Patreon page, which automatically cleans up the mouth, masks it out, and combines it with the original video.

The comi workflow includes face restoration nodes to fix low-resolution faces and mask out the mouth, combining it with the original high-resolution image.

The workflow also includes an optional face restoration node at the end to fix any issues with the face, like weird-looking eyes.

The author's simplified workflow takes no more than 2 minutes to add lip sync to any type of shot, allowing for faster completion of their new short film.

The author encourages viewers to subscribe to their channel to stay updated on the final film and full workflow video.

The author thanks their lovely Patreon subscribers, who make these videos possible.

Transcripts

play00:00

here are two workflows for creating lip

play00:02

sync for your AI movies I'm currently

play00:04

working on the next episode of my AI

play00:06

series about Humanities future in the

play00:08

cosmos and this time I actually wanted

play00:10

to have a talking character a presenter

play00:12

who becomes the protagonist of the film

play00:14

for this I used a new tool called syn

play00:16

laabs and all you have to do is go to

play00:18

their website upload a video and an

play00:21

audio file and select a model and I

play00:23

recommend their 1.5 model for the best

play00:25

results wait a few seconds and you will

play00:27

have your lip synced video you can

play00:29

generate minutes of audio per month for

play00:31

free but unfortunately they recently

play00:32

added a huge Watermark to the free

play00:34

version welcome to Titan city of

play00:37

Tranquility Humanity's gateway to the

play00:39

Stars so if you have the money and want

play00:41

to generate lots and lots of AI

play00:42

generated lip sying videos this tool is

play00:44

for you but for casual uses in AI

play00:46

filmmakers this can become quite

play00:48

expensive so let me show you my free

play00:50

alternative workflow you may remember

play00:52

that in one of my older videos I created

play00:54

a pretty complex workflow for this I

play00:57

used wave to lip which produces really

play00:59

good lip Sy for free but unfortunately

play01:02

with a very poor image quality to fix

play01:04

this I manually masked out just the

play01:06

mouth and placed it over the original

play01:08

video now I had a high resolution video

play01:10

with a poor quality mouth I then

play01:12

exported it as a PNG sequence which I

play01:14

ran through automatic 1111s extras tab

play01:17

with a mix of gfp Gan and code forer on

play01:20

top of it and both are tools to fix

play01:22

these broken AI faces then I had to

play01:25

convert the images back into video

play01:26

sequences and this was my final result

play01:30

the center of the earth that's

play01:32

impossible not if we follow his Clues

play01:34

come on Axel we have to go to

play01:37

Iceland H belela he is the toughest

play01:40

Hunter on the island he will be your

play01:42

guide what does he

play01:44

hunt

play01:47

Ducks excellent let's

play01:51

go I was quite happy with the results

play01:54

but creating these shots took a lot of

play01:55

time because of all these steps and

play01:57

that's why I simplified and automated

play01:59

the the whole workflow we're still going

play02:01

to use wave to lip as the foundation for

play02:03

our effect just use the link in the

play02:05

video description and click on copy to

play02:07

drive

play02:09

connect and run the first step the setup

play02:13

after about a minute it should be done

play02:15

and you can scroll all the way down to

play02:17

lip sync on your video

play02:19

file click on the small play button and

play02:22

then you will be asked for permission to

play02:23

access your files which you must Grant

play02:26

now you can click the browse button go

play02:27

to your folder with your clips and and

play02:30

upload the original video in my case the

play02:32

video was created in

play02:35

Runway scroll down to step three and do

play02:38

the same thing for your audio file you

play02:40

can use either MP3 or wave files once

play02:43

it's uploaded start the last step and

play02:45

after a few seconds you will have your

play02:46

lip synced

play02:48

video Welcome to Titan city of

play02:51

Tranquility Humanity's gateway to the

play02:53

stars and now let's actually make it

play02:55

look nice for that you can download my

play02:57

free comi workflow from my patreon page

play02:59

drag it into the user interface and

play03:01

simply upload your original video and

play03:03

your lip sync video from wave to lip and

play03:05

run it this workflow then automatically

play03:08

cleans up the mouth masks it out and

play03:10

combines it with your original video in

play03:12

a matter of seconds Humanity's gateway

play03:14

to the Stars welcome to Titan city of

play03:17

Tranquility Humanity's gateway to the

play03:19

Stars when you first import the workflow

play03:21

make sure to go to the comi manager and

play03:25

click on install missing custom notes

play03:28

also go to install models and make sure

play03:31

that you have code forer gfp Gan and one

play03:34

of the face detector models installed

play03:36

restart comu ey and upload your original

play03:38

video up

play03:40

here and your low resolution wave to lip

play03:43

video down

play03:47

here so here comes the first phase

play03:50

restore node which will fix the low

play03:51

resolution phase from wave to lip and it

play03:54

does a pretty good job but the area

play03:56

around the face is still low resolution

play03:59

and also the rest of the face looks a

play04:01

bit different now and you might want

play04:03

this because it looks better but I would

play04:05

like to control it separately so this

play04:07

next step will automatically mask out

play04:09

the mouth and combine it with the

play04:11

original high resolution image finally I

play04:14

added another face restoration note at

play04:16

the end and this can help you to tie

play04:18

everything together and fix other parts

play04:20

of the face like if the eyes look weird

play04:22

in the generated video but it can also

play04:24

change your face a little bit so if you

play04:26

don't want that just disable it with

play04:29

this workflow now takes me no more than

play04:30

2 minutes to add lip sync to any type of

play04:32

shot so I should be able to finish that

play04:34

new short film in no time make sure to

play04:37

subscribe so you don't miss out on the

play04:39

final film and full workflow video for

play04:41

it and thank you to my lovely patreon

play04:43

subscribers who make these videos

play04:45

possible

Rate This

5.0 / 5 (0 votes)

Do you need a summary in English?