OpenAI最新モデル!GPT-4oについて徹底解説してみた

にゃんたのAI実践チャンネル
14 May 202429:58

Summary

TLDRこの動画は、OpenAIが新たにリリースしたGPT4Oモデルについて紹介しています。GPT4Oは、テキストだけでなく画像や音声データにも高い精度で対応できる全方位型のAIモデルです。特に、音声インタラクションの性能が向上し、人間のように自然な会話が可能になった点に注目されています。また、APIの利用料金が半額に引き下げられたことで、システム統合がより手軽になりました。さらに、GPT4Oは日本語にも最適化され、処理速度が向上しています。OpenAIのCEOであるサム・アルトマンは、AIを無料で提供することで世界的にアクセスしやすくし、音声機能の向上によりコンピューターとの対話が革命的になるという視点を示しました。この動画は、AI技術に興味のある観객に強い興味を喚起することができるでしょう。

Takeaways

  • 🆕 GPT4Oという新しいモデルがリリースされたと発表された。Oはオムニの略で、テキストだけでなく画像や音声も高精度で処理できる全方位のモデルらしいです。
  • 🎉 GPT4OはGPT3.5やC3などと比較して飛躍的に性能が向上しており、特に音声のインタラクションが人間のように自然に会話できると話題です。
  • 💬 音声機能はこれまでのモデルと比べて大幅に向上しており、ラグがほとんどなく、リアルタイムで会話が可能なレベルに達しているとされています。
  • 💰 APIの利用料金が半額に引き下げられたとのことで、システムに組み込む際に費用面でも嬉しい変更となっているようです。
  • 🚀 GPT4Oは日本語にも最適化されており、処理速度が早く、実質2倍以上向上していると評価されています。
  • 🌐 GPT4Oは今後無料で使えるようになる予定で、世界中の人々がアクセスできるようにすると発表されています。これは社会的な意味でも非常に大きなことです。
  • 🔍 GPT4Oは画像認識や音声認識においても従来のモデルと比較して非常に優れており、多言語での性能も向上しています。
  • 🎯 GPT4Oは言語モデルとしての評価においても高いスコアを獲得しており、他のモデルと比較して優位に立っているとされています。
  • 🔧 GPT4Oは1つのモデルで文章、画像、音声を全て扱うことができる新しいモデル構造を持っていると説明されています。
  • 📈 GPT4Oのトークンの最適化により、文章を生成する速度が向上し、APIの利用料金も50%安くなっているため、より多くの人々に利用されることが期待されます。
  • 🌐 GPT4Oの機能が無料で公開されることで、有料版に申し込まなくても多くの機能を体験できると伝えられています。これはAI技術の普及に大きく寄与すると思われます。

Q & A

  • GPT4Oはどのようなモデルですか?

    -GPT4OはOpenAIによってリリースされた最新のモデルで、テキストだけでなく画像や音声など多種のデータに対して高精度で処理できる全方位型のAIモデルです。

  • GPT4Oのリリースでどのような機能が向上しましたか?

    -GPT4Oのリリースにより、精度の向上、音声インタラクションの改善、API利用料金の半額化、出力速度の2倍化、日本語への最適化などが実現されました。

  • GPT4Oの音声インタラクションはどのような特徴がありますか?

    -GPT4Oの音声インタラクションは、ラグがなく、人間のように自然に会話できるようになりました。これはコンピューターとの関わり方を変えるほどの重要な機能です。

  • GPT4OのAPI利用料金が半額になったことによる影響は?

    -API利用料金が半額になると、システムに組み込む際のコストが大幅に削減され、GPT4Oを利用する企業や開発者が増加する可能性があります。

  • GPT4Oはどのようにして多言語を扱うことができますか?

    -GPT4Oは新しいモデル構造を採用しており、1つのニューラルネットワークで文章、画像、音声などを同時に扱うことができます。これにより、日本語を含む多言語の処理が向上しています。

  • GPT4Oのリリースで無料ユーザーにもどのような恩恵がありますか?

    -GPT4Oのリリースにより、無料ユーザーもGPT4レベルの賢さを体験できるようになり、WEB検索、データ分析、ファイルアップロード機能などにもアクセスできるようになりました。

  • GPT4Oのモデルケイパビリティはどのように向上しましたか?

    -GPT4Oは画像認識や音声認識において従来のモデルと比較して大幅に性能が向上し、多様なデモが行われ、応用例が広がるようになりました。

  • GPT4Oの言語トカナイズエーションはどのようなものですか?

    -言語トカナイズエーションは、文字をトークンと呼ばれる単位で分割して処理することで、多くの文字を少ないトークン数で処理できる最適化技術です。GPT4Oでは特に20の言語に対してこの最適化が行われています。

  • GPT4Oのリアルタイムトランスレーション機能はどのようなものですか?

    -GPT4Oのリアルタイムトランスレーション機能では、音声機能を使ってリアルタイムで翻訳ができます。これにより、海外旅行などにおいてコミュニケーションを取りやすくなるでしょう。

  • GPT4OがリリースされてからOpenAIのCEOはどのようにコメントしましたか?

    -OpenAIのCEOであるサム・アルトマンは、高い能力を持ったAIツールを無料で提供し、新しい音声機能がコンピューターとの関わり方を大きく変えるとコメントしています。

Outlines

00:00

🌟 GPT4Oの紹介と新機能の概要

ゲントがOpenAIからリリースされた最新のモデルGPT4Oについて紹介しています。GPT4Oはテキストだけでなく画像や音声データにも高い精度で対応できるとされています。発表内容を見ると、GPT4Oは従来のモデルと比べて精度が向上し、音声のインタラクションが人間らしいものになり、APIの利用料金も半額になったとのことです。また、GPT4Oは日本語にも最適化されており、出力速度が2倍になったと報告されています。

05:00

🎤 GPT4Oの音声インタラクションの向上

GPT4Oでは音声インタラクションが強化され、従来のモデルと比べてラグがなくなり、リアルタイムでの会話が可能になったとされています。デモ動画では、GPT4Oがリアルタイムで返答し、人間と近い声で会話している様子が紹介されています。OpenAIのCEOサム・アルトマンもこの新機能に高評価を付けており、今後コンピューターとの関わり方が変わってくるとしています。

10:03

📈 GPT4Oの性能向上と多言語対応

GPT4Oは多言語に対応し、特に日本語での処理速度が向上しています。モデルの性能は様々なテストを通じて評価され、GPT4Oは他のモデルと比較して高い性能を発揮していることがわかります。音声認識においても、OpenAIが公表しているWispV3モデルと比較して高い性能を持ち、翻訳の性能もGoogleのjemモデル以上に優れているとされています。

15:04

💬 GPT4Oの無料公開と言語モデルの進化

GPT4Oは無料で公開される予定で、これにより世界中の人々がAIを利用できるようになるという社会的意義があります。言語モデルはトークンの最適化により、より多くの文字を少ないトークン数で処理できるようになり、文章生成の速度が向上しています。これにより、APIの利用料金も抑えられ、言語モデルの利用がより普及する見込みです。

20:07

🔍 GPT4Oの機能拡張とユーザーへの恩恵

GPT4Oはフリーユーザーにも多くの機能が利用可能になる予定です。これにより、有料版の人々と同じレベルの賢さを体験できるようになります。また、音声の会話機能もコンピューターから直接使用できるようになり、Macユーザーにはショートカットキーでアプリを立ち上げ、対話しながら使用することができる機能も追加されています。

25:12

📊 GPT4OのAPI利用料金の半額化と未来への期待

GPT4OのAPI利用料金が半額になったことで、他の言語モデルと比較してGPT4Oのコストパフォーマンスが非常に良いとされています。これにより、GPT4Oの利用がより普及する可能性があります。OpenAIのCEOサム・アルトマンは、新しい音声機能がコンピューターとのインターフェイスを変える技術であると評価しており、将来的にはパーソナライゼーションや情報アクセスなどの機能も追加されるとしています。

Mindmap

Keywords

💡GPT4O

GPT4Oは、OpenAIによってリリースされた最新のAIモデルです。'O'はオムニの略で、全方位の意味を持ち、テキストだけでなく画像や音声など多種のデータに対して高い精度で処理できる能力を持っています。このモデルは、以前のモデルと比べて精度が向上し、特に音声のインタラクションにおいては人間らしい自然な会話が可能になったとされています。

💡音声インタラクション

音声インタラクションとは、音声を通じて行われる人間のAIとのやり取りを指します。GPT4Oでは、これまでのモデルと比べて音声応答のラグが少なくなり、リアルタイムに近い対話が可能になったと紹介されています。これは、AIとの対話の自然さを向上させる重要な機能です。

💡APIの利用料金

APIの利用料金とは、GPT4Oをシステムに組み込む際に必要な料金のことです。GPT4Oのリリースにより、APIの利用料金が半額になったとのことです。これは、システム開発者にとって大きな利点で、より多くの人々にAI技術を利用する機会を提供する可能性があります。

💡出力速度

出力速度は、AIモデルが応答や結果を生成する速さを指します。GPT4Oでは、前モデルに比べて出力速度が2倍になったとされています。これは、ユーザーにとって迅速な応答を得られることを意味し、AIの応用範囲を広げます。

💡日本語の最適化

日本語の最適化とは、AIモデルが日本語をよりよく理解し、処理する能力を高めたことを指します。GPT4Oは日本語にも適応され、処理速度が向上したと説明されています。これにより、日本語を母国語とするユーザーに対しても、より良いサービスが提供されることになります。

💡無料公開

無料公開とは、これまで有料だったサービスを無料で提供することを意味します。GPT4Oでは、無料で使えるようになる予定とされており、これは世界中の人々がAI技術を体験し利用する機会を広げることに繋がります。

💡リアルタイムトランスレーション

リアルタイムトランスレーションとは、音声をリアルタイムで翻訳する機能です。GPT4Oでは、音声機能を使ってリアルタイム翻訳が可能になったとされています。これにより、言語の壁を越えたコミュニケーションが可能になる期待が高まります。

💡モデルケイパビリティ

モデルケイパビリティとは、AIモデルが持つ能力や機能の範囲を指します。GPT4Oでは、モデルケイパビリティが向上し、画像認識や音声認識においても優れた性能を発揮するようになったと紹介されています。

💡言語モデル

言語モデルとは、自然言語を処理し、理解するためのAIモデルのことです。GPT4Oは高水準の言語モデルであり、様々な言語での性能向上が期待されています。特に日本語における性能向上は、日本語を扱う際の利便性を高める重要なポイントです。

💡ビジョンアンダスタンディング

ビジョンアンダスタンディングとは、AIが画像を理解し、解釈する能力を指します。GPT4Oでは、ビジョンアンダスタンディングの性能が向上し、画像認識の応用が進むことが期待されています。これは、画像を用いた様々な場面でのAIの活用を促進する要因となります。

Highlights

新しいモデルGPT-4Oがリリースされ、全方位的なデータ処理能力が向上。

GPT-4Oはテキスト、画像、音声などのデータを高精度で処理可能。

精度が向上し、他のモデルを圧倒する性能を持つ。

音声インタラクションが非常に自然で、人間と話しているような体験ができる。

API利用料金が半額になり、システム組み込みがしやすくなる。

出力速度が2倍になり、日本語の処理速度も飛躍的に向上。

無料ユーザーにもGPT-4Oの機能が解放される予定。

OpenAIのCEOサム・アルトマンが音声インタラクションの重要性を強調。

GPT-4Oは画像認識と音声認識の性能も非常に高い。

プログラムをサポートするデモで、コードレビューやリアルタイム翻訳が紹介される。

コンピューターと音声で直接対話できる機能が追加され、作業効率が向上。

GPT-4Oのトークン最適化により、文章生成速度がさらに速くなる。

API利用料金が安くなり、他のモデルとの比較でコスパが非常に高い。

OpenAIが無料で高性能AIツールを提供する使命を強調。

音声の新機能により、コンピューターとのインターフェースが大きく変わる。

Transcripts

play00:00

はい皆さんこんにちはゲントですえ本日は

play00:03

GPT4Oについて紹介していきますえ

play00:06

つい先ほどえOpenAIからえ新しい

play00:09

モデルGPT4Oがリリースされましたで

play00:12

このOっていうのはえオムニの略みたいで

play00:15

全方位とかえそういった意味なんですけど

play00:17

もテキストの入力だけじゃなくてえ画像と

play00:20

か音声とかいろんなデータに対しても

play00:23

めちゃくちゃ高い精度で処理できるという

play00:25

ところでえ発表がされてましたま色々発表

play00:28

内容を見た感想とてはさすがオープAIっ

play00:31

とことでま全部持っていったなという風な

play00:33

感じがえしました最近はclod3の

play00:36

オーパスに押され気味でまチャットGPT

play00:39

から乗り換えようかなって人もいたと思う

play00:40

んですけどもま今回の発表でま圧倒的に

play00:43

ですねこのGPT4Oがですね優位に立っ

play00:46

てるのでまたしばらくはですねオーAIの

play00:49

チャットGPTを使うという人が増えるん

play00:51

じゃないかなという風に思いますで今回ま

play00:54

いろんなことがリリースされたんですけど

play00:55

もま時間がない人のためにま最初にですね

play00:58

発表のポイントについてえ簡単に紹介し

play01:00

てくとまず1番は精度が向上したってこと

play01:04

でこれまでGPT4とかク3とかえ

play01:07

ジェミニプロ1.5とかがま団子状態だっ

play01:10

たんですけどもま頭1つ飛び抜けてGPT

play01:13

4Oがえ強くなっています続いてえ音声の

play01:17

インタラクションがすごいということでえ

play01:19

こちら後ほど見てくんですけどもこれまで

play01:21

もま音声機能あったんですけども話しかけ

play01:24

てからえ返答が返ってくるまでま少しラグ

play01:27

があったんですよねまなのでま機械と話し

play01:29

ててるなっていう風な感じがしたんです

play01:31

けども今回のアップデートで本当に人

play01:33

みたいに話せるようなそういった性能に

play01:35

なってるようですただここに関してはま

play01:39

まだ一般ユーザーに公開されてなくてえ

play01:41

今後数週間のうちに公開されるという話

play01:43

でしたでOpenAのCEOのサム

play01:46

アルトマンのブログによればこの音声の

play01:49

インタラクションがまめちゃくちゃすごい

play01:51

し今後コンピューターとの関わり方がえ

play01:54

変わってくるというところで非常に押して

play01:56

いましたこれもちょっと後ほど見ていき

play01:58

ますであとはえAPIの利用料金が半額に

play02:02

なりましたよってことでこれもですねえ

play02:04

システムに組み込むという時はえかなり

play02:06

嬉しいですしまこれまでGPT3.5

play02:09

ターボ使ってた人はGPT4Oに

play02:11

乗り換えるということもできてくるんじゃ

play02:13

ないかなという風な感じがしますま続いて

play02:16

出力速度が2倍ということで計算速度が

play02:18

早くなったよという話もあるんですけども

play02:21

まもう1つですね日本語にも最適化されて

play02:24

かなり処理速度が早くなってます実質これ

play02:27

2倍以上え実はですね早くなってますここ

play02:30

ら辺も後ほど見ていきましょうで最後に

play02:32

これもですねサムアルトマンがえ今回の

play02:34

発表で重要なことという風に言ってたん

play02:36

ですけども色々と無料で使えるようになる

play02:39

というところでこれまでえGPT4とか

play02:42

GPTとかですねチャットGPTの有料版

play02:46

に申し込まないと使えなかったんですけど

play02:47

も今後ですねこれを無料ユーザーにも解放

play02:50

してくという話でしたこれもめちゃくちゃ

play02:53

インパクト大きくて世界中の人がGPT4

play02:56

にアクセスできるようにするというので

play02:58

非常に社会的的に意義のあることをやっ

play03:00

てるなっていう風な感じがしましたここら

play03:03

辺がですねえ今回の発表のポイントかなっ

play03:05

ていう風に思うので続いてですね記事とか

play03:07

デモの方見ながら詳しく解説していきます

play03:10

はいまずはですねまいきなり細かい説明に

play03:12

入るよりも一旦ですねGPT4Oがえ

play03:16

どんなものなのかというところを見ていき

play03:18

たいと思いますですでにGPT4Oは

play03:22

チャットGPTのえ有料版に加入してる人

play03:25

は使える状態になってるので

play03:27

プレイグラウンドで使ってみたいと思い

play03:28

ます左側が今回リリースされたGPT4O

play03:32

でえ右側がえこれまであったGPT4

play03:35

ターボになっていますこれ例え

play03:40

ばはい日本について1000文字で説明し

play03:43

てくださいという風にしてラをしますはい

play03:47

そうするとこんな感じでですねえGPT4

play03:50

Oめちゃくちゃ早いですよねえGPT4

play03:52

ターボが今やっと出力された時にもう

play03:56

GPT4ですねえ出力が終わってるという

play04:00

ので圧倒的な速さを誇ってるのが分かり

play04:03

ますまちょっと早すぎてよくわかんなかっ

play04:05

たなって感じもしますがちょっと一旦です

play04:08

ねもうちょっと小さくし

play04:13

てもう1回聞いてみましょうpyonの

play04:16

勉強方法について教えてくださいと指示し

play04:19

てみるとまこんな感じですねまもう速度が

play04:22

全然違いますよねGPT3.5と同じ

play04:26

くらい早いのかなっていう風な感じがし

play04:29

ますねまちょっと止まってしまったんです

play04:31

けど

play04:32

もあこれマックストークンがえ低かったの

play04:36

で止まってしまってますねこれちょっと

play04:38

あげてもう1回ちょっと更新し

play04:44

てはいプログラマに必要なこと何ですかて

play04:46

聞いてみましょうはいそうするとですね

play04:49

こんな感じでま3倍ぐらい早い気がします

play04:52

よねうんうん

play04:55

うんで出力してるものに関してはまこれ

play04:58

だけじゃ分からないので何とも言えないん

play05:00

ですけどもで速度が体感としてはGPT

play05:03

3.5のターボと同じくらい早いなという

play05:04

風な感じがしますはいということでですね

play05:07

GPT4Oのすさがえ少し分かったところ

play05:10

でもう少し細かい今回の発表についても見

play05:12

ていきますはいこちらがですねえOpen

play05:16

AIの公式のページになっていてえGPT

play05:19

4Oについてえ色々と書かれていますで

play05:23

最初にえGPT4Oのデモが紹介されてい

play05:26

ますちょっとこちら見てみましょうHey

play05:28

Howgoing

play05:41

でこれ今ですねえGPT4の新しい機能と

play05:44

してビジョン機能でまテレビ電話してる

play05:47

みたいな感じでこのチャットGPTで

play05:50

喋れるとえそういったもののデモになって

play05:52

いますなのでこれインカでですねえ自分の

play05:55

姿映しながらリアルタイムで会話できる

play05:58

ようなそういっデモがていますでポイント

play06:01

としては話しかけてからチャットGPTの

play06:04

返答までのラグが全然ないということと

play06:07

話してる声の感じがかなり人間に近いと

play06:11

いうところかなと思いますもうちょっと見

play06:12

てみましょう

play06:17

[音楽]

play06:29

これ今ですねま何やってるでしょうかって

play06:31

いう風にしてまチャットgpdに聞いてみ

play06:34

たら何か作ってるんじゃないですかって

play06:36

いう風に返答が返ってきてま会話ができ

play06:38

てるというのでこれ上にも書いてあるよう

play06:40

に1かリアルタイムってことで別に早送り

play06:43

してないんですけどもえすごい速度で返答

play06:46

が返ってきてるというのが分かるかと思い

play06:48

ますこのリアルタイムでま返答が返って

play06:51

くるというのがめちゃくちゃすごいなと

play06:53

いう風な感じがしますね

play07:02

MayWeannoun

play07:09

makeますごいですねクートも色々と

play07:12

デモがあるのでちょっとそちらでも見て

play07:14

いきますはいでちょっとキーズの方見て

play07:16

いくとここですねGPT4OMには平均的

play07:21

には320MSでえ返答を生成するてこと

play07:24

でまこれはですね人間の返答速度とかなり

play07:27

似ているという風に書かれていますまなの

play07:30

で人間みたいにですね対話ができるという

play07:32

ことですねで制度についても書かれてるん

play07:34

ですけどもで英語ではえこれまでのGPT

play07:37

4ターボに匹敵するぐらい強いという風に

play07:40

書かれていてえノンイングリッシュランジ

play07:42

ま日本語とかですねえそういった言語に

play07:44

関してはシグニフィカント

play07:46

インプルーブメントてことでま

play07:48

めちゃくちゃ性能向上しましたよという風

play07:50

に書かれていてかつですねま早くなってえ

play07:53

50%安くなりましたよというのが書かれ

play07:56

ています特に画像認識とかえ音声認識に

play07:59

対してはこれまで存在してるモデルと比較

play08:02

してめちゃくちゃいいですよという風に

play08:04

書かれていますなるほど

play08:06

とでモデルケイパビリティてことでま

play08:09

いろんなデモが行われていますはい

play08:12

ちょっとですねデモの方も見ていきたいん

play08:14

ですけどもま全部見てるとちょっと時間が

play08:16

ないのでまちょっと面白そうなやつをえ見

play08:18

ていきますこれインタビュープレップって

play08:20

ことで面接の練習という感じですかね

play08:24

How

play08:26

[音楽]

play08:43

すごい自然に会話してますよねーの

play08:46

インタビューけますよ

play08:50

[音楽]

play08:58

とこれで今自分の姿を映してふさわしい

play09:01

ですかねて感じでチャットGPに聞いてい

play09:26

ますちょっとなんかい思うんですけども

play09:29

みなりをちょっと整えたらってい風な

play09:31

アドバイスをまもらったというところで

play09:34

時間ないのでこの帽子かぶっていこうかな

play09:36

と思うんですけどどうですかという風に

play09:38

聞いて

play09:51

ますそうするとま目立つとは思うんだけど

play09:54

まちょっとねみたいな感じでちゃんと常識

play09:57

をきえたアドバイスをしてくれてるの感じ

play09:59

がしますでまなんかこれやっぱデモなので

play10:02

なんでちょっと帽子持ってんだってのは気

play10:04

になったんですけどもまおそらくです何回

play10:06

かやってま練習したんだろうなって感じが

play10:08

しますねはいはいあとはですねリアル

play10:12

タイムトランスレーションてことで音声

play10:15

機能を使ってリアルタイム翻訳をできると

play10:18

いうのでデモが行われてました

play10:24

[音楽]

play10:35

英語で喋ったらスペイン語でスペイン語で

play10:37

喋ったら英語で翻訳してくださいという風

play10:40

にして指示しています

play10:46

[音楽]

play10:56

[音楽]

play11:08

[音楽]

play11:11

はいこんな感じですねリアルタイムで翻訳

play11:13

しながら会話できてるというところでこれ

play11:16

までもこんな機会あったかなと思うんです

play11:17

けども返答速度がやっぱり早いというのと

play11:21

GPT4Oが入ってるので翻訳の性能が

play11:24

多分世界値高いというところでこれ使えば

play11:27

え海外旅行とかですねコミュニケーション

play11:29

も取れそうな感じがしますこれもすごい

play11:31

なっていう風な感じがしますねはいそして

play11:34

ですねこのトーキングファスターというの

play11:36

もすごかったのでこちらも紹介しておき

play11:38

ますでこれですね何かって言うとChat

play11:41

GPTと会話しながら返答の速度を調整さ

play11:44

せるってことで最初にえ数をカウントさせ

play11:47

た後にえもっと早くとかえもっと遅くとか

play11:51

そういう風に指示することによってえ返答

play11:53

音声の速度が変わるってことでまこれも

play11:56

どういう風な仕組みで実現できてのが

play11:59

不思議なくらいえすごかったですちょっと

play12:01

見てみ

play12:12

ましょうLittle

play12:17

slasthat

play12:20

Little

play12:27

someslowerplease

play12:29

はいこんな感じですね話す速度をえリアル

play12:33

タイムで調整できるってのは多分これまで

play12:35

なかったんじゃないかなという技術になっ

play12:38

てますこれもすごい楽しみですねはいま他

play12:41

にもですねえ色々とでもやられてるんです

play12:43

けども興味があったらですねま面白かった

play12:46

ので是非見てみてくださいなんか

play12:48

カスタマーサービスのプルーフオブコン

play12:51

セプトってことで自動化もやられてました

play12:54

ここら辺もチャットGPTによって

play12:56

置き換わってきそうな感じがすごいします

play12:58

よねはいまだ色々とあるので紹介していき

play13:01

ますで下の方にこのGPT4の音声機能が

play13:05

まなぜすごいのかというとこについて書か

play13:08

れていますこれまでもチットGPTのえ

play13:11

モバイル版を使えばえ音声入力ってできた

play13:14

んですよねまなのであまり違いが分かり

play13:17

にくいんですけどもこれまでの問題点とし

play13:19

ては3つのモデルを使ってこの音声の対話

play13:22

機能を実現してましたと聞いた音声を

play13:25

テキストにしてえそのテキストをえ言語

play13:28

モデルに入れてでえ文章を生成した後にま

play13:31

それを読み上げるというのでま3つですね

play13:34

モデルがありましたとでただこのGPT4

play13:37

は新しいモデル構造になっていて同じ

play13:40

ニューラルネットワークでえ文章画像音声

play13:43

ですねえ全てを同時に扱えるとえそういっ

play13:47

たモデル構造になってるみたいですなので

play13:49

え別々に処理するんじゃなくてま1つの

play13:52

モデルがま全て処理できるというところで

play13:54

処理速度も早くなってますし全てGPT4

play13:58

の処理でレベルで行えるのでこれまでより

play14:01

もまかなりすごいということですねうん

play14:04

ふんはいで続いてですねなんか色々応用例

play14:07

ってことで紹介されていますOpenAI

play14:10

のロゴを入れてポエムを作らせたりとか

play14:12

ですね画像生成とかもより自由度が上がっ

play14:15

た使い方ができるとか色々とですねえ応用

play14:18

例が紹介されてるのでちょっと全部理解

play14:20

できたいんですけども興味があったら見て

play14:22

みるといいと思いますはいえ次にえモデル

play14:26

エバリュエーションてことでえ性能評価

play14:28

につもまとめられていますえまずですね

play14:31

冒頭話したようにまGPT4Oは現状世界

play14:35

一え性能が高い言語モデルになっています

play14:38

こちらはえいろんなテストでえ言語モデル

play14:41

評価したえ結果になってるんですけどもえ

play14:43

このピンク色がGPT4Oですね

play14:47

はいでちょっと見にくいかもしれないん

play14:50

ですけどもえGPT4ターボとかこれまで

play14:53

ライバルとされていたクロド3のオーパス

play14:55

とか最近話題になっていたラマ3の400

play14:59

Bとかですねそういったものと比較して

play15:01

少し軍を抜いて性能が高いのかなっていう

play15:04

風に考えられますちょっと字がちっちゃい

play15:06

んですけどもこのmmlっていう評価を見

play15:09

てみると他のモデルはですね86とかでま

play15:12

結構団子状態なんですけどもえGPT4O

play15:15

ですね88.7ってことですごい性能です

play15:18

ねちゃんとえプロンプトもですねゼ

play15:20

ショットcotっていう風に書いてあるの

play15:22

でま若干プロンプトエンジニアリングして

play15:24

そうですけども正当な評価をしてるんじゃ

play15:26

ないかなと思いますはいでその他え

play15:29

オーディオですね音声認識の性能に関して

play15:31

も比較されていますこれは低いほどえ性能

play15:35

がいいってことなんですけどもえwisp

play15:37

V3ってのがOpenAIが公表している

play15:40

音声認識モデルになっていますでそれと

play15:43

比較してこのGPT4をですねかなり性能

play15:46

が高いというところで発表されてますこれ

play15:49

まで文字起こししようとしたらこのWi

play15:51

whispV3のモデルを使って文字

play15:54

起こししてとかやってたんですけども

play15:56

おそらくこのGPT4Oだけでもう音声

play15:59

認識もできるし言語も扱えるしま画像も

play16:02

扱えるという風になってくと思うのでま

play16:04

すごいなていう風な感じがしますよねはい

play16:08

音声翻訳ですかねでこれを見てみると

play16:11

GPT4Oですねえかなり性能が高くて

play16:15

Googleのjemによりも性能が高い

play16:17

という風に書かれていますGoogleは

play16:20

え音声のモデルが強いんですけどもそれと

play16:22

匹敵してるというところでここら辺も

play16:25

GPT4Oの方が強そうな感じがしますね

play16:28

今後実際試してみてどうなのかという

play16:31

ところも見ていきたいと思い

play16:33

ますはいあとはえいろんな言語でのえ性能

play16:37

評価もしていてえこですねジャパニーズと

play16:40

いう風に書かれてるんですけどもえGPT

play16:42

4からえGPT4Oになって他の言語と

play16:45

比較するとかなり飛躍的にえ精度が向上し

play16:49

てるというのが分かりますただやっぱり

play16:51

これ見ると日本語ってまだ英語のGPT4

play16:55

レベルなんだなっていうな感じがしますね

play16:58

なのでやっぱりまだ英語の方がえ圧倒的に

play17:00

強いというのが分かります最後こちらがえ

play17:04

ビジョンアンダスタンディングてことでえ

play17:06

画像性能の評価になってるんですけども

play17:08

これ見るとですねGPT4Oが圧倒的に

play17:11

高いですよねこれ

play17:13

69.16.175.10

play17:20

はえ全ての評価項目ですね軍を抜いて強い

play17:23

なという風な感じがしますちゃんと

play17:25

プロンプトもオールビジョンルザゼ

play17:28

ショットので正当に評価してまこの結果と

play17:32

いうところなのでこのGPT4を使った

play17:35

画像認識の応用も今後かなり進んできそう

play17:38

な感じがしますはいま性能がですねもう

play17:41

すごくてま若干お腹いっぱいになってるか

play17:43

もしれないですけどもまだあってですね

play17:45

ランゲージトカナゼーションてことでま

play17:47

簡単に言うと言語モデルにえ文字を入力し

play17:50

た時って文字のまま扱われるんじゃなくて

play17:53

トークンと呼ばれる単位でえ文字が分割さ

play17:56

れて入力されますAIのモデルでえ処理を

play18:00

行う時時の文字の単位のようなものですね

play18:03

それが最適化されたので多くの文字がえ

play18:06

少ないトークン数で処理できますよとえ

play18:09

そういった話になっていますでちょっと

play18:11

分かりにくいなと思ったので簡単に例を

play18:13

出しながら紹介するとこんにちは私は

play18:16

ニャンタですという風な文章を入れた時

play18:18

ですねまAIはこれ全部1個1個文字とし

play18:21

て扱うんじゃなくてまトークンとして分割

play18:23

されますまなのでこれ下の方見てもらえる

play18:26

と1つのトークンで同じ色がついんです

play18:29

けどもこれこんにちはてのはえ1つの

play18:31

トークンとして扱われてえ処理され

play18:33

るっていうことですねまなのでまAIの

play18:36

モデルとしてはこのトークン数が少ない方

play18:38

がえ計算の処理が減るのでえ文章を生成

play18:42

する速度も早くなりますこれこんにちは

play18:44

ってのは1回の予測で5文字出るという

play18:47

ことなのでトークンが最適化されることに

play18:50

よってま早くなるとAPIを使ってる場合

play18:52

はこのトークン数に応じて料金がかかって

play18:55

くるのでこの最適化されることで安くなっ

play18:58

てくということですねえ特にこの20個の

play19:01

言語に関しては最適化されてますよという

play19:04

風に書かれていてえ日本語もですね

play19:07

ジャパニーズてことで1.4かけえフア

play19:10

トークンズってことでトークンの最適化が

play19:12

されていますまなので冒頭えgptoはえ

play19:16

2倍早いという話をしたんですけども

play19:18

さらにトークンとしてもえ1.4倍え効率

play19:22

化されてるのでなのでま3倍近くえ文章を

play19:25

生成する速度が早くなってるはずですこれ

play19:28

も実はですねまめちゃくちゃすごいことな

play19:30

んですよねこれちょっとこんにちはって

play19:32

いうこの輪がえ間違っちゃってるのでこれ

play19:35

今37トークンていう風に書いてあるん

play19:37

ですけども実際はですねこれこんにちはに

play19:40

するとえ36トークになるということです

play19:42

ねこれちょっとトークナザが違うんです

play19:45

けどもこの表記はちょっとミスってますね

play19:48

はいまどうでもいいかということでえっと

play19:51

進んでいきますはいあとですねえ注目

play19:55

ポイントとしてはこのGPT4Oとモア

play19:59

ツールズがえチットGPTのフリー

play20:01

ユーザーにもえ導入されますよという風に

play20:04

書かれてますなのでえ有料版に申し込ま

play20:06

なくてもえこのGPT4Oとかですね

play20:09

いろんな機能を使えるようになるという風

play20:11

な話が書いていますこれもやっぱAIを1

play20:14

部の人だけじゃなくて世界中の人に使って

play20:17

もらいたいとえそういった思いがある

play20:19

みたいなんですけども無料で公開するって

play20:21

のはすごいことですよ

play20:23

ねで下の方見てくとですねま何が無料に

play20:26

なるのかというのが書かれていてチット

play20:28

GP10フリーユーザーはGPT4レベル

play20:31

の賢さを体験できますし今有料版の人が

play20:34

使えるWEB検索とかデータ分析とか

play20:37

ファイルアップロード機能とかですねま

play20:39

そういったものも使えるみたいですであと

play20:41

は少し前に出たGPTというオリジナルの

play20:46

チャットボットを作れるサービスですね

play20:48

こちらもですねえChatGPTの無料版

play20:50

の人にも解放されるというのでまますます

play20:54

盛り上がってきそうな感じがしますで最近

play20:56

私動画にしってるようにDFという

play20:58

オープンソースのえGPTみたいな

play21:00

サービス出てきたんですけどもこのGPT

play21:03

も負けないぞという感じで無料で使える

play21:05

ようになってさらに広がってきそうな感じ

play21:08

がします

play21:09

ねあとはですね最近でったこのメモリー

play21:12

機能に関しても無料で使えるようになる

play21:14

みたいなので無料版の人にもかなり恩恵が

play21:16

あるのかなという風に思いますはいであと

play21:19

ですねえかなり私は個人的にいいなと思っ

play21:22

たのがこれですねスリミングyour

play21:25

ワークフローてことでえなんとですね音声

play21:27

の会話機能があなたのコンピューターから

play21:30

直接使えますよという風に書かれてます

play21:33

これですねえMacのユーザーだけみたい

play21:35

なんですけどもショートカットキーを押す

play21:37

とえこのChatGPTのえアプリが

play21:40

立ち上がって会話をしながらChat

play21:43

GPTを使えるってことでこれまでは何か

play21:46

をお願いしたい時にま毎回ですね自分で

play21:49

言語化してそれをタイピングするとかえ

play21:52

やってたと思うんですけどもでショート

play21:54

カット機を押すとこのアプリが立ち上がる

play21:56

のでそのアプリがですね私が操作してる

play21:59

画面を見ながら色々対話ができるというの

play22:02

でこれめちゃくちゃすごい機能なんじゃ

play22:04

ないかなという風に思いますまただ現状

play22:07

ですねMacのユーザーに関しては

play22:08

スタートするみたいでWindowsに

play22:10

関してはですね今年中にローンチすると

play22:13

いう風な話でしたちょっとイメージ湧か

play22:15

ないという人もいると思うので

play22:17

YouTubeでのデモも見てみましょう

play22:19

はいこちらですね先ほどのChatGPと

play22:22

のアプリを立ち上げてえプログラミングを

play22:25

するとえそういったデモもやられていまし

play22:27

play22:35

はいこんな感じですねが立ち上がった状態

play22:37

でコーディングをしてる

play22:43

とandtvoiceisonright

play22:48

willbeabletohearme

play22:48

butseeanythingon

play22:50

Screenhighlightthe

play22:52

code

play23:04

これ今はチトGPTが画面見えてないので

play23:07

コードをハイライトしてチャットGPTに

play23:09

送って会話します

play23:11

play23:14

GPTGoing

play23:21

Going

play23:27

Loveこれをコーディング手伝って

play23:29

もらうというのでプログラムコードを貼っ

play23:31

てチットGPTに送って何か質問したり

play23:35

するというのが行われていますThing

play23:37

takeyour

play23:38

[音楽]

play23:41

timesoIjustshared

play23:43

someCodeWithYouYou

play23:44

GiveMeOnesent

play23:45

destionofgoingthe

play23:47

CodethisCodefetches

play23:49

DailyweatherDATAfor

play23:50

specificlocationand

play23:52

timePER

play23:59

はいこれでですねコード送ったらチャット

play24:02

GPTがどういうものかってのがま音声で

play24:05

返ってくるというところでこれもすごい

play24:07

いいですよねえアシスタントってことで私

play24:10

もそうなんですけどもえプログラムを勉強

play24:12

してるとかなりありがたい機能なんじゃ

play24:14

ないかと思いますこれ時代に関してはま

play24:16

これまでもですねコピペして貼り付ければ

play24:19

できそうだなって感じするんですけども

play24:21

画面をチャットGPTに見せてそれを元に

play24:24

会話するということもえデモで行われて

play24:27

ました

play24:50

shageはいこんな感じですね自分の

play24:53

画面を映しながらそれを元にチャットGP

play24:56

に解説してもらうというのでこれですね

play24:59

なんか言語化しにくいなみたいなところが

play25:01

あったと思うんですけどもそれも資格的に

play25:04

伝えられるのですごい体験が変わりそうだ

play25:06

なていう感じがし

play25:11

[音楽]

play25:17

ます

play25:19

theesaroundJulyand

play25:21

Augustmaum

play25:29

はい気温が最も高くなってことについて

play25:31

聞いてるんですけどもまちゃんと答えられ

play25:33

てるというところありますまだまだ簡単な

play25:35

図かなと思うので実用性に関しては実際

play25:38

使ってみるまでは何とも入れるかなって

play25:40

いう風に思うんですけどもかなり興味深い

play25:42

機能かと思いますでGPT4ですねAPI

play25:47

の利用料金が半分になりましたよという話

play25:49

だったんですけどもこれはキッGPTの

play25:53

プランが半額になったんじゃなくてAPI

play25:55

と言ってですねえプログラムを使ってえ

play25:58

言語モデルを使う時のえ料金がですね半額

play26:00

になりましたとえそういった話になって

play26:02

ますでそれがどれぐらいすごいのかという

play26:05

のがまちょっとイメージつきにくいと思う

play26:07

のでこちらのですねアーティフィシャル

play26:10

アナリシスというサイトの方でいろんな

play26:13

言語モデルの比較をしてるんですけども

play26:15

横軸が料金で縦軸がモデルの制度になって

play26:19

いますでこれを見ると左上に行けば行く

play26:21

ほどえ料金が安くてえ性能が高いので

play26:25

コスパがいいと右下は料金が高くて性能が

play26:29

低いのでコスパ悪いというものなんです

play26:30

けどもえGPT4ですねえここに位置して

play26:34

ますまなのでえ他のモデルと比較すると

play26:38

圧倒的にコスパが良くなってるというのが

play26:40

分かるかと思いますこれもすごいことで

play26:43

もうですねこのGPT4のえ右側にある

play26:46

モデルを使う理由がまなくなってきてると

play26:49

いうところでこれはすごいなという風な

play26:51

感じがしますこれに対抗してですねクド3

play26:54

のオーパスもま料金が安くなってえ性能が

play26:57

高くなっなてくるとまかなり面白いのかな

play26:59

と感じもしますねはい最後にですねえ

play27:03

GPT4OがリリースされてからOpen

play27:06

AIのCEOのサムアルトマンがブログを

play27:09

投稿してたのでえそちらについても簡単に

play27:12

紹介しておきます今回のえ発表でサム

play27:16

アルトマンが注目して欲しいこととしては

play27:18

え2つありますと1つがえ我々の

play27:21

ミッションでもある高い能力を持ったAI

play27:24

ツールを人々に無料で提供するともしくは

play27:28

ま安い値段で提供するとしかもこれをま

play27:31

広告とかえそういったものなしで提供でき

play27:34

てるというのがま注目して欲しいってこと

play27:36

で確かにですね月3000円とかかかっ

play27:39

たりしてまなかなか使えなかったりとかま

play27:42

日本だったらまだいいかもしれないです

play27:43

けども世界中でま貧しい国とか使えない国

play27:47

もあったりすると思うのでそういった人

play27:49

たちに対してもこのAIを使えるようにし

play27:51

てくというのですごい意義があることだと

play27:54

いう風に思います2つ目が新しい音声機能

play27:58

ですというので先ほど紹介したように

play28:01

ほとんどえラグがなくて人間のように

play28:04

喋れるそういった音声の機能が追加され

play28:07

ますとこれはthebestコンタ

play28:09

interfaceIEverUSという

play28:11

ことでこれまで使ってきたコンピューター

play28:13

のインターフェイスとしてザベストですよ

play28:16

ということでま最もいいですよという風に

play28:18

書かれています確かにタイピングしたりし

play28:20

なきゃいけないってのは面倒くさいんです

play28:22

けども音声でコンピューターと対話できる

play28:25

ようになるというのはこれまでの

play28:27

コンピューターとの関わり方を大きく

play28:29

変えるテクノロジーかなという風に思い

play28:33

ます今後ですねえパーソナライゼーション

play28:35

とかえあなたの情報にアクセスしたりとか

play28:39

何かを行動する能力が追加されたりとか

play28:41

そういったところも出てくるみたいなので

play28:43

エキサイティングなま将来がですね待って

play28:45

ますよという風に書かれてますはいという

play28:47

ことですねちょっと想定よりも喋りすぎ

play28:50

ちゃったんですけども料金が安くなってえ

play28:52

音声の新しい機能が追加されるとえこの2

play28:55

つがですね是非理解して欲しいま今回の

play28:58

発表だったというところで動画の方も

play29:00

終わりたいと思います今後どれぐらい

play29:03

使えるのかというとこに関しては私も触っ

play29:05

てみて検証していきたいと思います皆さん

play29:08

も感想とかあったらコメントの方お願いし

play29:10

ますはい最後にですね最近ですねえ公式

play29:13

LINEの方え始めましてそこでえ最近

play29:16

話題のDFの使い方とかえチットGPTと

play29:20

かchod3とかのえプロンプトをまとめ

play29:22

た資料をプレゼントしてるので概要欄の方

play29:25

から友達登録の方してもらってプレゼント

play29:28

というキーワードを入力してもらえれば

play29:30

自動で受け取れるようにしてるので興味が

play29:32

ある人は是非見てみてくださいはい以上で

play29:35

本日の動画を終了したいと思いますえこの

play29:37

動画良かったなってう人は高評価コメント

play29:39

チャンネル登録の方よろしくお願いします

play29:40

ユーデミーという教材も販売してますので

play29:43

是非興味がある人は概要欄の方から見てみ

play29:46

てくださいはいそれではまた次回の動画で

play29:47

お会いしましょうバイ

play29:52

[音楽]

play29:57

バイJA

Rate This

5.0 / 5 (0 votes)

الوسوم ذات الصلة
AI技術GPT4O音声認識リアルタイム翻訳画像認識API料金割引OpenAIサムアルトマンプロンプトエンジニアリング
هل تحتاج إلى تلخيص باللغة الإنجليزية؟