【音声は違う...】ChatGPT-4oの活用パターンをデモ映像から予測

KEITO【AI&WEB ch】
16 May 202417:27

Summary

TLDRこんにちは、ケツです。今回は、GPT-4Oの活用パターンを予測し、デモ映像を見ながら解説します。音声会話の流暢さが向上し、翻訳や言語学習に役立つ可能性があります。GPT-4とGPT-4OMが無料解放され、親しみやすい音声機能がビギナーにも使いやすくなりました。高速な文章生成とビジョン機能の向上により、実務での活用が期待されます。特にチャットボットの高速化やリアルタイム翻訳が注目されています。今後の活用パターンとして、家庭教師やプログラミングのレビュー、会議の要約などが考えられます。皆さんの意見もコメント欄でお待ちしています。

Takeaways

  • 🚀 GPT-4の登場で、より高速で流暢な文章生成と音声入力・出力が期待できる。
  • 📈 GPT-4とGPT-4OMIが無料で利用可能になり、新しいユーザー層に向けたマーケティング戦略が見られる。
  • 🔍 GPT-4OMIのビジョン機能は画像や動画の認識と解析が向上し、多言語対応で翻訳や言語学習に役立つ。
  • 🎓 教育分野での活用が期待され、プログラミング学習や言語学習のサポートがリアルタイムで行える可能性がある。
  • 🗣️ 音声機能の向上により、翻訳や通訳のリアルタイム性が向上し、コミュニケーションの壁が低減される。
  • 👥 ビジネス会議やインタビューなど、音声とビジョン機能を組み合わせることで、会議要約やインタビュー記事作成が支援される。
  • 🎨 クリエイターに対して、デザインや動画制作のフィードバックをリアルタイムで提供する可能性がある。
  • 💻 パソコンでの作業にGPTを組み入れることで、問題解決やアドバイスがシームレスに受けられる。
  • 🧑‍🦯 アクセシビリティの観点から、視覚・聴覚に障害を持つ人々に対して、より多くの情報を提供できる。
  • 🌐 GPTのAPIが外部ツールと組み合わされた場合、VTuberやチャットボットなどの新しい活用方法が期待される。

Q & A

  • GPT-4のアップデートで、音声の部分はどのような変化が期待されていますか?

    -GPT-4のアップデートで、音声の部分はより流暢で自然な会話が期待されています。ため息やポーズなど、人間のような表現が含まれるようになる可能性があります。

  • GPT-4のデモ映像を観た感想は何ですか?

    -デモ映像を見ると、GPT-4は非常に流暢な感じで会話ができるようになっていると感じられます。これにより、ユーザーがより親しみやすく、自然な対話が実現できると期待されています。

  • GPT-4のビジネス活用において、特に役立つと予想される領域は何ですか?

    -翻訳や言語学習などの分野で、GPT-4は特に役立つと予想されます。また、プログラミングの学習やレビューにも活用が期待されています。

  • GPT-4とGPT-4OMIの違いは何ですか?

    -GPT-4は文章生成やカスタマイズされたAIの使用に長けているのに対し、GPT-4OMIは画像の認識と解析、動画の要約など、マルチメディアに関する機能に優れています。

  • GPT-4が無料で利用できる回数制限について教えてください。

    -GPT-4が無料で利用できるのは、回数制限付きで行われます。回数制限に達した場合、有料プランへの移行が提案されます。また、1日あるいは24時間経過後には回数制限がリセットされるようです。

  • GPT-4の高速化によって、どのような利点が期待されますか?

    -GPT-4の高速化によって、サービス開発時の待ち時間の短縮、リアルタイム翻訳の質の向上、音声入力・出力の迅速化など、ユーザー体験の向上が期待されます。

  • GPT-4のビジョン機能を使って、どのような場面を想定していますか?

    -GPT-4のビジョン機能は、プログラミングの学習やデザインのフィードバック、パソコン内の作業の監視など、様々な場面で活用される可能性があります。また、アクセシビリティの向上にも寄与することが期待されています。

  • GPT-4がZOOM会議に参加し、どのような役割を果たすことができますか?

    -GPT-4はZOOM会議に参加して、会議の要約を作成したり、意見を提供したり、リアルタイムで文字起こしを行ったりするなど、会議の質と効率を向上させる役割を果たすことができます。

  • GPT-4がクリエイターの作業にどのように助けになる可能性がありますか?

    -GPT-4は、デザインのフィードバックや動画編集のアイデア提供、プログラミングのサポートなど、クリエイターが行うパソコン上の仕事にリアルタイムで助言やアドバイスを提供できる可能性があります。

  • GPT-4の音声機能がAPIとして外部ツールに組み込まれた場合、どのような影響が期待されますか?

    -GPT-4の音声機能がAPIとして利用可能になると、より自然な会話が可能なVTuberの登場や、リアルタイムでの対話型AIの普及が期待されます。これにより、ユーザーはより自然で親しみやすいインターフェースを体験できるようになります。

  • GPT-4の現在までのアップデートで、利用できる機能は何ですか?

    -GPT-4の現在までのアップデートで利用できる機能は、テキストの生成とビジョン機能の画像解析です。音声の部分やビデオの解析、デスクトップの監視などはまだ利用できないようです。

Outlines

00:00

😀 GPT-4の活用パターンとアップデートの概況

ビデオではGPT-4の活用パターンとアップデート内容について紹介しています。GPT-4がより流暢な音声での会話に対応し、翻訳や言語学習などにも役立つと予想されていますが、ビジネス活用においては特に大きな変革は見られないと述べています。また、GPT-4とGPT-4OMIが無料で利用可能になったと発表されており、これにより多くのユーザーがGPTを体験できるようになるというマーケティング戦略も取り上げられています。

05:01

😉 GPT-4OMIとジェミニの比較、およびその活用方法

GPT-4OMIとジェミニのそれぞれの特徴と、どのような場面でどちらを利用するべきかについて説明しています。GPT-4OMIは画像解析機能が優れており、文章の生成も得意ですが、ジェミニは動画の要約や解析が特に得意で、超長文の取り扱いも可能です。用途に応じて使い分けるとアドバイスされており、基本的な業務であればGPT-4OMIでも十分だとも述べています。

10:02

🤖 GPT-4の高速化とビジョン機能の活用事例

GPT-4の高速化がサービス開発において重要な要素となっていると強調されており、ウェブサイトやチャットボットでの迅速なレスポンスが求められる理由について説明されています。さらに、リアルタイム翻訳やアクセシビリティの活用においても高速化が重要な役割を果たすと述べられています。ビジョン機能と音声入力出力機能が組み合わさることで、例えば視覚障害者を支援するアプリケーションなど、多様な場面で活用が可能になるという事例も紹介されています。

15:03

📚 GPT-4OMIの多様な活用パターンの予想

GPT-4OMIが学習、言語学習、翻訳、プログラミングのサポート、会議要約、インタビュー記事作成、クリエイティブ支援など、多岐にわたる場面で活用される可能性について考察しています。また、ZOOM会議への参加やデスクトップの音声認識による文字起こしなど、さまざまな場面での活用が想定されており、非常に期待される機能として紹介されています。

🎉 GPT-4OMIの期待と今後の展望

最後に、GPT-4OMIがリリースされていない現状と、今後の展望について語られています。アクセシビリティの観点からの活用や、VTuberの可能性など、さまざまなアイデアが示されており、ユーザーからの意見やコメントが期待されています。また、チャンネル登録と動画の評価を呼びかけ、今後のアップデートに向けた期待感を高めています。

Mindmap

Keywords

💡GPT4O

GPT4Oは、テキスト、音声、画像を理解し、応答することができる高度なAIモデルです。このビデオでは、GPT4Oの様々な活用パターンが予測されており、その多機能性を強調しています。例えば、音声での会話や、画像の認識と解析、高速化された文章生成などが紹介されています。

💡音声入力と出力

音声入力と出力とは、AIが人の声を認識し、テキストに変換したり、逆にテキストを音声に変換して返答することができる機能です。ビデオでは、GPT4Oがリアルタイムで音声で会話できるようになり、それが翻訳や言語学習、アクセシビリティの向上に役立つと説明されています。

💡ビジョン機能

ビジョン機能とは、AIが画像や動画を読み込み、その内容を認識して解析する機能です。ビデオでは、GPT4Oのビジョン機能を使って、例えば数学の問題の解答をチェックしたり、プログラミングのコードをレビューしたりすることができると紹介されています。

💡高速化

高速化とは、AIがより迅速に応答を返すことを意味します。ビデオでは、GPT4Oの応答速度が向上し、サービス開発やリアルタイム翻訳、音声入力出力での会話において非常に重要だと強調されています。

💡翻訳

翻訳とは、異なる言語間のテキストや会話を移行するプロセスです。ビデオでは、GPT4Oが多言語に対応し、リアルタイムで翻訳ができるようになると予想されており、それが言語学習や海外でのコミュニケーションに役立つと説明されています。

💡アクセシビリティ

アクセシビリティとは、製品やサービスが障害を持つ人々に対しても使いやすいように設計されている状態です。ビデオでは、GPT4Oが視覚や聴覚に障害を持つ人々のサポートに役立つと述べており、例えばビジョン機能を通じて情報を提供することができると紹介されています。

💡プログラミング学習

プログラミング学習とは、コンピュータプログラミングのスキルや知識を身につけるプロセスです。ビデオでは、GPT4Oがプログラミングの学習をサポートし、コードのレビューや問題解決をリアルタイムで行えると予想されています。

💡言語学習

言語学習とは、第二言語や外国語の学習プロセスです。ビデオでは、GPT4Oが多言語に対応し、言語学習をサポートし、学習者がリアルタイムでフィードバックを得られると予想されています。

💡ZOOM会議

ZOOM会議とは、ビデオ会議ソフトウェアZOOMを使用して行われるオンラインミーティングです。ビデオでは、GPT4OがZOOM会議に参加し、会議内容の要約やリアルタイムの翻訳を提供できると予想されています。

💡クリエイティブタスク

クリエイティブタスクとは、デザイン、アート、プログラミングなど、創造性を必要とする作業です。ビデオでは、GPT4Oがクリエイターの側にいて、デザインのフィードバックやアイデアの提供を行うことができると予想されています。

💡VTuber

VTuberとは、バーチャルYouTuberの略で、オンライン空間で活動するバーチャルキャラクターのことです。ビデオでは、GPT4Oの音声機能がAPIとして活用され、より自然な会話ができるVTuberが登場する可能性が示唆されています。

Highlights

GPT4の活用パターンを予測し、デモ映像を見ながら解説する。

音声のアップデートが行われていないため、より流暢な会話を実現していない。

GPT4とGPT4OMIが無料解放され、一般の人にも利用できるようになる。

音声機能の向上により、親しみやすさが高まり、初心者にも優しい環境が整う。

GPT4OMIは画像認識解析機能が優れており、プログラミングの学習やレビューに役立つ。

GPT4は文章生成やカスタマイズが得意で、GPTストアから細かい調整が可能。

GPT4OMIは動画の要約や解析が得意で、翻訳や言語学習にも役立つ。

GPT4の高速化により、サービス開発においてリアルタイムでの応答が期待できる。

リアルタイム翻訳が可能になり、言語学習や海外でのコミュニケーションが容易になる。

GPT4のビジョン機能と音声入力出力が組み合わさることで、アクセシビリティが向上する。

GPT4が家庭教師代わりとして、学習のサポートを提供できる可能性。

ZOOM会議にGPT4を参加させ、会議の要約や意見提供が可能になる。

クリエイターがパソコン上で作業する際に、GPT4がリアルタイムでアドバイスを提供。

アクセシビリティの観点から、GPT4が視覚・聴覚に障害を持つ人々のサポートに役立つ。

VTuberがGPT4の音声機能を活用し、より自然な会話が可能なVTuberが登場する可能性。

GPT4の完全リリースが待たれる中で、テキスト部分とビジョン機能が利用可能。

今後、GPT4が様々な場面で活用され、新しいビジネスモデルが生まれる可能性。

Transcripts

play00:00

皆さん音声のこれまだ違いますはい

play00:04

こんにちはケツですえ今日はすねまGPT

play00:08

4Oの活用パターンを予測するっていう

play00:10

ことでえ色々とですねGPT4オニが出て

play00:13

きたからえ何ができるようになるのかなと

play00:16

いう予測をですねデモ映像を見ながらして

play00:19

いきたいと思いますえそしてですねこの

play00:22

音声のえ会話のやつえ本来ならもっと流暢

play00:26

な感じでえため息とかしたり欲用がですね

play00:30

すごい波があるような会話をしてくれる

play00:32

らしいんですけどえ先日の僕の動画でこう

play00:35

話してたやつはまだえ音声はアップデート

play00:38

されてないみたいですえYouTube

play00:40

動画とかXのポストあとはニュースとかで

play00:42

もですねこの画面のはい音声のやり取りの

play00:45

やつをですね取り上げてるものがたくさん

play00:47

ありましたけどまだ音声のやつは

play00:50

アップデートはかかってないみたいですの

play00:51

ではい皆さんですね勘違いさせてしまい

play00:54

申し訳なかったですただですねえデモ映像

play00:57

を見る感じかなりですねいい感じにてるん

play01:00

ですよまこれ音声は出さないんですけど

play01:02

こんな感じの映像でえ喋ってるデモ動画

play01:04

っていうのがたくさんありますのでこれを

play01:06

聞いていただければそのすさっていうのは

play01:09

ですね皆さん分かると思いますえただです

play01:11

ねこの流暢な声で話せるようになったこと

play01:14

自体はですね業務活用みたいなところでの

play01:18

用途ではまあんまり関係ないのかなみたい

play01:20

なところは思ってますま一部ですね翻訳と

play01:23

か言語学習とかそういう部分では役に立つ

play01:26

んだろうなとは思いますけどえその他業務

play01:29

でえ長に話せるようになったからといって

play01:31

ま何か特別変わるってことはないですが

play01:34

この親しみやすくなったっていうところが

play01:36

すごくポイントなのかなっていう風に思っ

play01:38

てますえで今回のこのGPT4Oの

play01:41

アップデートと同時にですねえ回数制限は

play01:43

あるんですけどGPT4とGPT4OMI

play01:47

が無料解放されたっていうのでよりですね

play01:49

えチャットGPTにそこまで触れてこ

play01:51

なかった人えGPT3.5のしょぼい

play01:54

バージョンしか使ってなかった人にですね

play01:56

このすさを届けることができてると思うん

play01:59

ですよねえそこと同時にこの音声の流暢に

play02:03

会話できる音声機能かなり親しみやすく

play02:06

なったえ音声機能も入ってくることによっ

play02:09

てビギナーに向けてですねえぶっさいよう

play02:12

な施策をOpenAIは取ってきたんじゃ

play02:14

ないかなって思いますマーケティングの

play02:16

狙いとしてまそんな意図があって一般的に

play02:19

見て親しみやすくなった音声の機能って

play02:22

いうものと無料解放して一般の人にも

play02:25

たくさんの人に届けるっていうのをセット

play02:27

でやったんじゃないかなとかって思って

play02:28

ますはいそしてですねこの音声が流暢に

play02:31

なることとえ他GPT4OMには高速化

play02:35

かなり高速にえ文章を生成してくれるって

play02:39

いうのとビジョン機能画像とか動画とかを

play02:42

読み込んでその内容をですね認識して解析

play02:45

してくれるっていう機能があるんですけど

play02:46

えそこの機能も向上しましたでこれがです

play02:49

ね何がすごいのかイメージ湧いてない方も

play02:51

結構いるんじゃないかなと思ったのでここ

play02:54

もですね少し触れていきたいと思いますと

play02:56

その前にいくつかですね以前の動画で質問

play02:59

をいただいてるのでそこをえ少しだけ答え

play03:02

ていきたいと思いますえまずですね有料版

play03:04

でしかこれ使えないんですすかていう風な

play03:06

質問を受けたんですけどえ現状ですね

play03:09

GPT4OMにはえ基本は有料版の人のみ

play03:13

しか使えないんですけどえ先ほど言った

play03:15

通りGPT4とGPT4オニが無料解放さ

play03:19

れて回数制限付きで誰でも使えるように

play03:21

なるみたいですえただですねえただこの

play03:24

無料解放っていうのがおそらく順次解放さ

play03:28

れてるんだと思いますえ僕もですね普通に

play03:30

有料版のChatGPT入ってる

play03:32

アカウントとその他にGoogle

play03:34

アカウントは4つか5つぐらい持ってるん

play03:36

ですけど他のアカウントで無料のチャット

play03:39

GPTを見に行ってもGPT4とGPT4

play03:42

OMにはまだえ使えてませんでしたただ

play03:45

ですねSNSとかのえ投稿を見てる感じ

play03:48

有料版に入ってないけどGPT4OMIが

play03:51

え使いましたっていうですね報告は

play03:53

たくさん上がってますなのでおそらく順次

play03:56

ですね解放されてってるんじゃないかなっ

play03:57

て思いますえそして次の質問は無料って

play04:00

どういうことでかて結構いっぱいいただき

play04:03

ましたねまこれも先ほど言った通りですね

play04:05

有料版にえ加入してなくても無料で回数

play04:08

制限付きで最新のモデルGPT4OMを何

play04:11

回か使うことができるみたいですえただ

play04:14

ですね回数制限にかかってしまったらこれ

play04:17

以上使いたかったらサブスク入ってね

play04:18

みたいのが出てくるみたいですねえただ

play04:20

それもですねえ1日かな24時間なのか数

play04:24

時間経てばその回数制限はえもう1回

play04:27

振り出しに戻りまていう感じでえ無料で

play04:30

使っていけるってものですただですねこの

play04:32

回数制限がもうイライラするえこんな待っ

play04:34

てられないって人は有料プランに入ってね

play04:37

みたいな感じになりますえで次がですね

play04:40

jemiとGPT4OMIどっちがいい

play04:42

ですすかっていう質問結構あるんですけど

play04:45

まSNSの反応とかでもそういう質問結構

play04:47

いっぱいあったんですけどま個人的にはま

play04:50

どっちもいいとこがあるっていうところな

play04:52

のでえ用途によって使い分けるかなって

play04:55

思ってますえまずですねイメージしやすい

play04:57

のはGPT4OMですねま画像の認識解析

play05:00

機能っていうのはすごく優秀なのでえ画像

play05:03

の解析機能とか使いたい時はGPT4で

play05:06

あとちょっとした文章を書いてもらいたい

play05:08

時え文章の制度とかもすごくいいので

play05:10

GPT4でいいのかなって思ってますで

play05:13

あとは画像生成ができるから画像生成も

play05:15

GPTであとですねま色々とえ

play05:18

カスタマイズされたGPTを使うことが

play05:20

できるGPTストアっていうものがあるの

play05:22

でえ細かいことをやってくれるようなもの

play05:23

を探す場合はGPTを使ってくって

play05:25

イメージですまその辺がGPT4OMを

play05:29

使うまメリットになってるのかなって思い

play05:31

ますで一方でジェミニの方はえ動画の要約

play05:34

とか動画を読み込んで解析してもらうって

play05:37

いうのはめちゃくちゃ得意なので動画は

play05:39

ジェミニ一択かなと思ってますで他にです

play05:42

ねえジェミニの場合はま100万トークン

play05:45

入れることができるで昨日アップデートさ

play05:47

れたえjemi1.5Proの最新バド方

play05:49

だと200万トークン入れれることが

play05:51

できるので超長文を入れる場合はジェミニ

play05:54

ですねまそこの違いなのでま用途によって

play05:57

使い分けるっていうところがいいのかなと

play05:59

思いますますなのでま基本的なえ軽い業務

play06:02

だったらGPT4オニだけでいいと思い

play06:05

ますただ動画とかあとはですねま

play06:07

ドキュメント本を作る方とか文章料が多く

play06:10

なればなるほどジェミニ1.5の方が優秀

play06:13

だなって感じる場面は多くなると思います

play06:16

はいえていう感じでまえ質問いくつか

play06:18

いたいてたんで答えていきましたという

play06:20

ことで次はですねまGPT4って結局で何

play06:24

がすごいのっていうところなんですけど

play06:26

色々とま考えたんですけどえますごいなっ

play06:30

ていうかま実際に実務のえ活用パターンを

play06:33

想像してみてあこれはすごいんじゃない

play06:35

のって思える部分ははいまずですねGPT

play06:38

4ってすごく回答の速度が早いんですけど

play06:41

えこの高速化されるっていう部分って

play06:43

サービス開発をする際に超重要な要素だと

play06:47

僕は思ってますていうのもまイメージして

play06:49

欲しいのはシンプルにウェブサイトの右下

play06:51

にあるチャットボットですねはいえあそこ

play06:53

のチャットボットに何かえ文章を送った時

play06:56

にま3分ぐらいなんか帰ってこない時って

play06:58

あるじゃないですか他にもまLINEの

play07:00

チャットボットとかに生成AIを生成AI

play07:03

の機能をみ組み込みましたみたいな

play07:05

チャットボットって今たくさんあると思う

play07:07

んですけど既読もつかないし12分何も

play07:10

回答が出てこないみたいなことってざに

play07:13

あってすごくストレスを感じるんですよね

play07:16

でま利用者側ユーザーからしたらそれが

play07:19

AIなのかAIじゃないのかって別にどう

play07:21

でもいいと思うのでえシンプルにチャット

play07:23

ボットからの返答に2分もかかるチャット

play07:25

ボットていう風に思われてしまうんですよ

play07:27

ねまそれはストレスがかかっってま離脱の

play07:30

原因になりますしそれが売上の軽減の原因

play07:33

にもなるのでやっぱり高速の方がですねえ

play07:36

チャットボットを開発するにははいいいん

play07:38

ですよえなのでまその点でですね高速化

play07:40

っていう部分のえメリットすさっていうの

play07:43

はえ開発側の人からしたらかなり感じれる

play07:46

んじゃないかなって思いますでもう1つ

play07:48

ですね高速化に関するメリットがあってえ

play07:52

これもま似たようなものなんですけど音声

play07:54

入力と音声出力えする時ですねえそこの

play07:57

音声が高速で返答えすぐですね返答が返っ

play08:01

てくるってところはま翻訳リアルタイム

play08:03

翻訳とか言語学習とかの分野でかなりです

play08:06

ね役に立ってくるんじゃないかなと思い

play08:08

ますえこれもさっきのチャットボットと

play08:10

同じなんですけど翻訳をお願いしてる時に

play08:13

その回答がえ2分3分ってえかかったら目

play08:16

の前にいるAさんAさんとの会話のこの3

play08:19

分の待ってめちゃくちゃうん気まずいじゃ

play08:21

ないですかんだからま基本的に使い

play08:23

づらかったんですけどこれがですね高速化

play08:26

されることによってもうすぐレスポンスが

play08:28

返ってくるならばリアルタイムで翻訳し

play08:30

ながらですねま外国人の方と喋ることが

play08:33

できるようになるんじゃないかなって思っ

play08:34

てますはいそしてですねもう1個なんです

play08:36

けどまビジョン機能と音声入力そしてこの

play08:39

高速化っていうのがうまく交じることに

play08:42

よってえこれま動画もあるんですけど

play08:44

アクセシビリティの活用としてかなり有効

play08:46

なんじゃないかなっていうのはえこれ見て

play08:49

ものすごく思いましたねていうかこの事例

play08:51

めちゃくちゃいいっすよねえこれですねえ

play08:53

盲目の方がですねえGPT4Oのビジョン

play08:56

機能でビデオを取りえそして音声機能でえ

play09:00

状況を伝えてもらうそれをえしながら盲目

play09:04

の方がですねタクシーを乗ったりま

play09:06

いろんな風景を見たりっていいうことをし

play09:07

てる映像ですはいこれですねリアルタイム

play09:10

でレスポンスが返ってこないとえタクシー

play09:13

を止めることもできないじゃないですかえ

play09:15

タクシーが来たっていうのはまチャト

play09:17

GPTが判断してえ判断するけど回答が

play09:21

ちょっと遅すぎてえ今手上げてくださいっ

play09:23

て言った頃にはえもうタクシー過ぎてる

play09:25

みたいなはいそういうことが起きてしまう

play09:27

んですけどえこうリアルタイムで高速で

play09:29

ですねえ回答が出てくるっていうことに

play09:31

よってまそういうタクシーをいい

play09:34

タイミングでえ手を上げてくださいって

play09:36

いうのを言ってくれるっていう事例になっ

play09:37

てるみたいですこういうですねまビジョン

play09:40

機能も含めてえビジョン機能と音声入力

play09:43

出力機能とえ高速化っていうのが交わると

play09:47

こういった事例がえ出てくるんだなって

play09:49

いうのを思いましたはいここがですねま

play09:51

実際のますさみたいなところに直結する

play09:54

部分なのかなって思ってますえていうのが

play09:56

GPT4Oのすごさだと思っんですけど

play10:00

じゃあですねえ他にもですねいろんなえ

play10:02

活用パターンっていうのはこれを見て予想

play10:04

はすることできるなと思ったのでえ次に

play10:06

ですねそのGPT4Oを活用したパター

play10:09

ンっていうのをま色々想像しながら予想し

play10:12

ていきたいと思いますえていうことでまず

play10:14

1つ目はですね勉強すよねはい家庭教師に

play10:17

なってもらうっていう部分ですまこれデモ

play10:20

の映像あるんでえこれは予想じゃないです

play10:22

ねえデモ映像でもありますえシンプルに

play10:24

ですねえ何でもいいと思いますえ数学の

play10:26

勉強をしてる映像をですねえビジョン機能

play10:29

で見てもらってえでここって合ってるとか

play10:32

間違ってるとかえなんで間違ってんのと

play10:34

かっていうレビューをしてもらうはい

play10:36

リアルタイムでもうチャットGPTに教え

play10:39

てもらうっていうことができると思います

play10:40

まそこのクオリティがどのぐらいかって

play10:42

いうのはえやってみないと分からない

play10:44

ところなんですけどま英語の学習とかでも

play10:46

ま使えそうですしワンチャンね漢字の学習

play10:49

とかもいけたら面白いですよねであとは

play10:51

歴史の勉強とかしてる時に常にえチャット

play10:54

GPTに見てもらうようにしたりとかま

play10:56

そういうことができるんじゃないかなと

play10:58

思いますでまここの1番分かりやすい部分

play11:00

はプログラミングの勉強ですよねはい

play11:03

プログラミングはもうGPTは

play11:04

めちゃくちゃ得意だと思いますのでえ

play11:07

プログラミングをしてる映像勉強してる

play11:09

映像をチャットGPTに見てもらって

play11:12

リアルタイムでレビューしてもらうえ

play11:14

もしくはですねま問題とかも出してもらっ

play11:15

てもいいと思いますしまなんでエラーが

play11:17

起きるのかっていうのを見てもらうとかで

play11:19

もいいと思いますまこんな感じで画面を

play11:21

映しながら勉強えもしくはレビューえ

play11:24

プログラミングのレビューなどができるん

play11:26

じゃないかなって思ってますていうのが1

play11:28

つ目ですねで2つ目はですねまさっき

play11:30

さらっと触れましたが言語学習とかえ翻訳

play11:33

とかですかねえ多言語対応してますのでえ

play11:36

英語中国語イタリア語フランス語どんな

play11:39

言語でもリアルタイムでチャットGPT1

play11:41

個まスマートフォン1個で学習することが

play11:43

できるようになるんじゃないかなって思い

play11:45

ますえイコールですねえリアルタイムの

play11:48

翻訳もえすることができるので海外に行っ

play11:50

た時はですねチャットGPTさえあれば

play11:53

もうこんな感じではいリアルタイムで翻訳

play11:55

をし合えるっていう感じになると思います

play11:57

これねめちゃくちゃ便利になるんじゃか

play11:59

なって思ってますで次はですねこれも一応

play12:02

デモの映像ではありますけどもうちょっと

play12:06

すごいことなんかできそうな気はして

play12:08

るっていうやつですこれはですねZOOM

play12:10

の会議の中にチットGPTも参加させて

play12:13

るってやつなんですけどまなんかフリー

play12:15

ディスカッションの中でチャットGPTに

play12:17

もなんか意見をもらうみたいなことが今後

play12:20

できるようになりますよねえあとはですね

play12:22

ま会議を聞いててもらって最終的にその

play12:24

会議の内容をえ文章にしてもらって要約

play12:27

するみたいなこともももしかしたらできる

play12:29

んじゃないかなとかって思ってますえあと

play12:31

他にはですねインタビュー記事とかえ作る

play12:34

場合って最近だとこうWebのZOOMと

play12:36

か使ってインタビューするっていう場面と

play12:38

かもあると思うんですけどそういう場面も

play12:40

ですねえチャットGPTに入ってもらっ

play12:42

てればえ文字起こししてくれるかもしれ

play12:44

ないですよねでこの映像がですね音声の

play12:47

機能を使ってるっていう部分しかないん

play12:49

ですけどここで音声と会話できて

play12:52

るってことは画面から出力されてる音声を

play12:55

えアプリでえ聞き取ることはできてると

play12:58

思いますのでえいわゆるデスクトップの

play13:00

音声ですねはいなのでシンプルにテキスト

play13:04

に文字起こしもいけると思いますえなので

play13:07

え今言ったですね会議を要約するみたいな

play13:09

ところも行けるんじゃないかなとかって

play13:11

思ってますはいこれですね非常に楽しみだ

play13:14

なって思ってますまこのZOOM会議に

play13:15

チットGPTを参加させるっていうのはえ

play13:18

どんな業種にもですねえ活用されてく事例

play13:20

になってくんじゃないかなとかって思って

play13:22

ますでは次ですね次はですねまえパソコン

play13:25

上でいろんな作業をしてるクリエイターの

play13:27

方々に向けてなんですですけどえチット

play13:30

GPTのビジョン機能を使ってですね常に

play13:32

パソコン内を監視してもらってまデザイン

play13:35

とかだったらこのデザインどう思うとかっ

play13:37

て聞いてあげたりえ動画のクリエイティブ

play13:40

とかだったらえこのシーンの後どういう風

play13:42

にしたら面白いと思うとかなんか意見とか

play13:44

をリアルタイムでえ作業しながら喋ってえ

play13:47

アイデアをいただけるっていうのがえ

play13:50

いけるんじゃないかなと思いますで他にも

play13:52

先ほども言った通りまプログラミングの

play13:53

レビューですかねはいまとにかくですね

play13:55

パソコン上のこう右上ありにチャット

play13:58

GPTが常ににいて今までの作業をしてる

play14:01

え黙々と作業してたところにえチャット

play14:04

GPTになんとなくえどう思うっていう風

play14:07

に質問することができるようになってくん

play14:09

じゃないかなとかって思ってますまどんな

play14:11

ことでもアドバイスをいただける

play14:13

アシスタントしてくれるっていうもう

play14:15

スーパーアシスタントていうAIがですね

play14:18

パソコンに1台え1人1台入ってくる

play14:20

みたいなイメージですかねこれですね多分

play14:23

できると思うんでえ僕もですね色々とそう

play14:25

いうのえ思い当たる部分あるんでえ

play14:28

ちょっとね色々やってたいと思いますね

play14:30

パソコンってインターネットで検索して

play14:32

解決するような悩み事みたいのもま

play14:35

たくさんありますけどインターネットの

play14:37

検索じゃあ見つからないような悩みって

play14:40

結構あると思うんですよね例えばなんす

play14:42

けどなんかよくわかんないエラー分が出て

play14:44

きたんだけどみたいなはいパソコンの

play14:46

なんか忠国みたいなやつですかねはいこれ

play14:48

何みたいな思ってもなかなか出てこない時

play14:51

ってあると思うんですよねまそういう場合

play14:53

チャットGPTにこれ何みたいなこと聞い

play14:55

てみるとすごくシームレスんですね問題が

play14:58

解決しそうだなと思いますねであとなんか

play15:00

右上に赤い黒ポチがついてんだけどこれ何

play15:03

みたいななんか色々と聞きたいことを

play15:05

聞ける状況になるんじゃないかなとかって

play15:07

思ってますあとはですねはい先ほども触れ

play15:10

ましたアクセシビリティの観点での活用

play15:12

っていうのはこれは広がってくなって思い

play15:14

ますねま耳が不自由な人に関しては今まで

play15:18

通りえ文字テキスト情報で色々とやり取り

play15:20

することができるっていうのはえあります

play15:23

で他にメが不自由な人はですねえさっき

play15:25

見せた動画のようにえビジョン機能を使い

play15:28

ながらいろんなこいろんな情報を取得する

play15:31

ことができるえそしてですね話すことが

play15:33

できないって人はですねGPTに代わりに

play15:36

話してもらうとかはいそういうことが

play15:37

できるんじゃないかなとかって思ってます

play15:39

えあとはえvtuber利用みたいのも

play15:43

まあまあ面白いのかなとかって思いました

play15:45

かねえこのり流暢な感じはいこの音声機能

play15:50

をえAPIとして活用することができるん

play15:52

だとしたらえより自然なですね会話をして

play15:55

くれるvtuberAIvtuberが

play15:58

ですねえ今後できてくるんじゃないかなと

play16:00

思いますえ現時点だとチットGPT上に

play16:03

しかこの流暢に会話してくれるような機能

play16:05

っていうのはえまだ確認してないんです

play16:07

けどおそらくすぐですねAPIとしてえ

play16:10

外部のツールにですねこのえ悠長に会話し

play16:13

てくれるような機能っていうのを組み込む

play16:15

ことができるようになると思いますのでえ

play16:16

それを使ったvtuberっていうのが

play16:18

普通に出てくると思いますえなので本当に

play16:21

自然に喋ってくれるリアルタイムで応答し

play16:24

てくれるvtuberっていうのがもう

play16:25

すぐ出てくるんだなっていう感じですって

play16:27

いう感じですかねちょっと今んとこ

play16:29

思いついたものはこんな感じになります

play16:31

どうでしょうか皆さんはですねこのGPT

play16:34

4Oのまデモ動画を見てこんなことができ

play16:37

たら面白いんじゃないかっていうアイデア

play16:38

とかありましたら是非ですね皆さん

play16:40

コメント欄とかでえ色々と意見いただけ

play16:42

たら嬉しいですままだですねえ完全

play16:45

リリースはされてませんのでえGPT4O

play16:48

のテキストの部分とあとは画像解析の

play16:51

ビジョンの部分ぐらいしか今現状だと使え

play16:53

てないんですかね音声の部分とかビデオを

play16:56

取りながら喋るあとはデスクトップとかえ

play16:59

その辺はですねまだえ使えてないので実際

play17:02

に使えるようになったらですね今回のこの

play17:04

動画の予想の答え合わせをしていきたいと

play17:06

思いますえ是非ですねチャンネル登録して

play17:08

お待ちいただければと思いますえという

play17:10

ことで今回の動画は以上になりますこの

play17:12

動画がいいと思いましたらグッドボタンと

play17:14

チャンネル登録是非お願いいたしますでは

Rate This

5.0 / 5 (0 votes)

Related Tags
GPT4デモ映像高速化ビジョン機能音声入力リアルタイム言語学習プログラミングアクセシビリティAIアシスタントマルチメディア
Do you need a summary in English?