【喋らせAI】イラスト・写真・アバターをしゃべらせる動画生成AI5選!特長を徹底比較!生成サンプルも大量披露!ディープフェイク動画の備えも!

365日の学び ~たいぞうのITカフェ~
29 Apr 202313:43

TLDRこの動画では、写真やイラスト、アバターを動かして話すAIを5つ紹介しています。ケイジェンは、テキスト入力でイラストを喋らせることができるサービスを紹介し、対応言語は40種類あります。また、声を録音したり、既存のボイスデータを使用することもできます。さらに、アバターの顔を画像で変えられる機能や、衣装の変更も可能で、ディープフェイク動画が作れると話題です。他にも、80言語対応のサービスや、オリジナルアバターを作成できるオーダーメイドサービスなど、多様な機能を提供しています。最後に、アバターの表情や服装、背景の選び方についてアドバイスを提供し、トーキングフォトの比較も行っています。

Takeaways

  • 📣 この動画では、写真やイラストアバターを動かして話すAIを5つ紹介し、それぞれの特徴と比較を行います。
  • 🎤 ケイジェンというAIサービスでは、自分で用意したイラストや画像をテキスト入力で喋らせることができます。
  • 🌐 対応言語は40種類あり、自分の声を直接収録したり、既存のボイスデータを利用することも可能です。
  • 👥 アバターはトーキングフォトだけでなく、身振り手振りで話すこともできるリアル派のものも用意されています。
  • 🧥 アバターの服装もカスタマイズ可能で、チャット形式で要求を出して衣装を変更できる機能があります。
  • 👓 特別な機能として、顔のスワップが可能で、誰かの顔を別の人物に変えることができます。
  • 🚫 ディープフェイクのような動画が作れる能力があるが、注意深く使用する必要があります。
  • 🌟 サービスはGoogleやFacebookとアカウント連携ができ、無料プランから有料プランまで用意されています。
  • 🎥 他のサービスも紹介されており、異なる特徴と言語対応、価格帯が説明されています。
  • 💬 アバターの数はサービスによって異なり、オーダーメイドサービスも提供されています。
  • 🎨 オリジナルのアニメキャラや企業のマスコットキャラを作ることができるビジネス向けのサービスも存在します。
  • ✂️ 動画制作において、アバターの表情や背景の選択が重要で、自然な動作のために正面を向いたシンプルな素材が推奨されます。

Q & A

  • ケイジェンというAIサービスの特徴は何ですか?

    -ケイジェンは、自分で用意したイラストや画像をテキスト入力で喋らせることができるAIサービスです。対応している言語はおよそ40種類あり、自分の声を収録することも可能です。また、トーキングフォトだけでなく、身振り手振りで話せるリアル派バターも用意されています。

  • ケイジェンでアバターの表情をカスタマイズすることはできますか?

    -ケイジェンでは、全てのアバターは好きな画像で保管を変更することができ、顔のスワップが可能となっています。これにより、ディープフェイクのような動画が作ることができます。

  • アバターの衣装を変更することはできますか?

    -はい、ケイジェンの特定のアバターでは、衣装をチャット形式で要求することができます。例えば、「赤いスーツにしてね」という要望を伝えると、それに応じて衣装が変わります。

  • ケイジェンの料金体系はどのようになっていますか?

    -ケイジェンはGoogleやFacebookアカウント連携ができ、無料プランでは1分間の動画生成が試せます。有料プランも用意されており、使うように応じたプランが選べるようになっています。

  • エーハイスタジオというAIサービスはどのような特徴を持っていますか?

    -エーハイスタジオは、リアルな部屋やバターをベースとしたサービスで、100を超えるアバターが利用可能です。アジア系のリアルアバターが多く、日本語を喋らせたい場合はおすすめです。また、対応言語は80を超える言語に対応しており、多言語対応が特徴です。

  • コメリというAIサービスはどのような特徴を持っていますか?

    -コメリは、トーキングフォトに特化したAIサービスで、多言語対応が特徴です。対応言語数は65で、汎用的な機能は他のサービスと比べて見劣りしますが、オーダーメイドサービスが提供されています。

  • オリジナルのアバターを作成するためにはどのようなプロセスが必要です?

    -オリジナルのアバターを作成するには、撮影した動画データを送ることが必要です。それに基づいて、高クオリティのオリジナルアバターが作成されます。また、簡易的な自撮り動画をもとにオリジナルアバターを作成するサービスも提供されています。

  • クリエイティブリアリティースタジオはどのようなAIサービスですか?

    -クリエイティブリアリティースタジオは、トーキングフォトに特化したAIサービスで、個人向けのプランも提供しています。リアルアバターは約30名おり、身振り手振りで豊かに話すことが可能です。対応言語は約70ある他、スライド形式で複数のシーンが作成でき、テンプレートや素材を利用して動画を作成することができます。

  • ケイジェンのようなAIサービスを利用する際、アバターの表情を豊かにするためにはどのようなポイントがありますか?

    -アバターの表情を豊かにするためには、正面を向いた素材を利用することが重要です。また、目、口、鼻などの顔立ちがしっかり見えるように、アニメ的すぎない写真を選ぶことが望ましいです。さらに、背景は均一なものを選ぶことが推奨されます。

  • ケイジェンのようなAIサービスで作られた動画は、どのような場面で利用できますか?

    -ケイジェンのようなAIサービスで作られた動画は、情報発信や企業プロモーション、YouTubeでのコンテンツ制作など、様々な場面で利用できます。個人的に楽しむためにも使い道は広がります。

  • ケイジェンのようなAIサービスを使い始める際の注意点は何ですか?

    -ケイジェンのようなAIサービスを使い始める際には、プライバシーや倫理的な問題に配慮し、怒られる範囲で使うように注意する必要があります。また、ディープフェイクのような動画作成機能を正しく使用し、他人の顔を使ったり、不適切な内容を作成しないように気をつけることが重要です。

Outlines

00:00

😀 Introduction to AI-driven Talking Avatars

The video introduces five carefully selected AI services that can make photos and illustrations talk. The first service, Keijen, allows users to animate their own illustrations or images with text input and supports about 40 languages. It also enables users to record their own voice or import recorded voice data. The avatars range from simple talking photos to realistic ones that use body language. There are over 100 avatars to choose from, including those with different clothing. The service also offers a unique feature where users can change the face of an avatar to any image they like, even allowing for a face swap. Additionally, there are features to customize the avatar's clothing through chat commands. The service is comprehensive, with the ability to create a logo voice from a user's own voice sample and write articles using a chat function. It supports account linking with Google or Facebook and offers both free and paid plans.

05:08

🌐 Multilingual AI Avatars for Global Communication

The second paragraph discusses the multilingual capabilities of the AI avatar services, which allow for global communication. The service, Heygen, is highlighted for its ability to provide automatic responses through a digital human and its advanced technology. It offers a trial plan and can be linked with a Google account for easy access. The service is similar in pricing to others mentioned, with a free trial that allows for a 1-minute video creation. The avatar count is slightly lower with 48 options, but it includes customizable and animated characters. The language support is extensive with 65 languages. The service's main strength is its custom order service, where users can get an original avatar created from their video data, although this is a paid feature. There are also cheaper options for creating simple selfie-based original avatars and animated photo avatars.

10:08

🎨 Tips for Creating High-Quality Talking Photos

The third paragraph provides tips for creating high-quality talking photos using the AI services. It emphasizes the importance of using frontal-facing images where the face is clearly visible. It also advises against using overly animated or cartoonish images to maintain a natural look. The background should be uniform to avoid distractions. The speaker also discusses their personal preference for the service Creative Reality Studio, which offers a good value plan for individuals. A comparison between two main services, Agent Creative Reality Studio, is mentioned, highlighting the differences in how the avatars' faces move and the extent of facial distortion that occurs. The video concludes with a reminder of the potential of these services for information dissemination, YouTube content creation, and corporate promotion.

Mindmap

Keywords

AI

AIとは、人工知能の略で、人間のように思考や判断を行う能力を持つ機械やソフトウェアのことを指します。このビデオでは、AIを使ってイラストや写真を動かし、話すことができるサービスを紹介しています。

サブスク

サブスクは、定期的な料金を支払ってサービスを利用する、サブスクリプションの略です。ビデオでは、ケイジェンというサービスをサブスクで利用していると触れています。

テキスト入力

テキスト入力とは、キーボードやタッチパネルなどを使って文字を入力する行為です。ビデオで紹介されているAIサービスでは、テキスト入力を使ってイラストやアバターに言葉を与えることができます。

アバター

アバターとは、ユーザーがオンライン空間で使用する自己表現のキャラクターです。ビデオでは、AIを使ってアバターを動かして話すことができるサービスが紹介されています。

ディープフェイク

ディープフェイクとは、人工知能を使って人物の顔を写し取って、別の動画に貼り付ける技術です。ビデオでは、AIを使ってディープフェイクのような動画を生成することができると触れています。

衣装

衣装とは、キャラクターやアバターが着用する服装のことを指します。ビデオでは、AIサービスを使ってアバターの衣装をカスタマイズできる機能が紹介されています。

チャットgtt

チャットgttとは、Google翻訳を使ってテキストを翻訳するサービスの略です。ビデオでは、このサービスを使って英語で文章を書くことができると説明しています。

オリジナル

オリジナルとは、既存のものとは異なる独自のデザインやアイデアを持つことを意味します。ビデオでは、オリジナルのアバターを作成することができるサービスが紹介されています。

オーダーメイド

オーダーメイドとは、お客様の要望に合わせて作られる商品やサービスのことを指します。ビデオでは、オーダーメイドサービスを使ってオリジナルのアバターを作ることができると触れています。

アニメーション

アニメーションとは、静止画を連続して再生することで動きのある映像を作る技術です。ビデオでは、AIを使ってアニメーション風のアバターを作成することができると紹介しています。

ビジネス

ビジネスとは、商売や事業を行なうこと、またその商売や事業自体を意味します。ビデオでは、ビジネス向けのサービスとして、企業の顔になるマスコットキャラやプレゼンターを提供していると触れています。

Highlights

5つのAIを厳選して紹介、写真やイラストアバターを喋らせる機能を徹底比較

ケイジェンはサブスクを好まないが、このサービスは久々に課金してしまった

テキスト入力でイラストや画像を喋らせることができ、対応言語は40種類

自分の声を直接収録することも可能で、既存のボイスデータを取り込むことができる

トーキングフォトだけでなく、身振り手振りで話すリアル派バターも利用可能

アバターの数は100を超え、洋服違いも含められる

アバターの顔を任意の画像で変えることができる唯一無二の機能

ディープフェイクのような動画が作れる機能を知っておくべきリスクがある

2つのアバター限定で、衣装をチャット形式で要望できる

アバターの服装数に応じて無限の数のアバターが作れる

GoogleやFacebookアカウント連携が可能で、無料プランから有料プランが選べる

エーハイスタジオはリアルな部屋やバターを提供し、アジア系のアバターが特長

対応言語は80を超え、世界に向けた情報発信が可能

ケイジェンのようなトーキングフォトには未対応だが、他にも自動応答のデジタルヒューマンが提供

コメリは多言語対応で、YouTubeなどで日本の文化を海外に発信することが可能

オーダーメイドサービスでオリジナルアバターを作ることができる

コロシアンクリエイターはリアルアバターが30名で、対応言語は70を超える

クリエイティブリアリティースタジオはトーキングフォトに特化し、個人向けのプランが登場

アバターの表情や背景の選択が動画のクオリティに大きく影響

トーキングフォトと比較して、アバターの興味が高まる傾向がある

YouTubeや企業プロモーションなど、様々な場面で活用が可能