【総集編】GPT-4oの教科書【使い方、活用方法を解説!】

ChatGPT活用チャンネル -杉田海地-
14 May 202429:00

Summary

TLDRこの動画では、OpenAIが発表した最新の言語モデルGPT-4 Omniについて詳しく解説しています。GPT-4 Omniは音声、テキスト、画像を統合的に処理できる多機能性と、従来のモデルに比べて飛躍的な性能向上を誇ります。ビジネスでの活用方法にも焦点を当て、リアルタイム翻訳、ストーリー作成、ポスター作成など、多様な仕事における応用例を紹介。また、現在の限界や弱点も提及し、ビジネス利用における注意点を提示。最後に、AIのビジネス活用に関する講座やコンサルティングサービスを提供していることも紹介しています。

Takeaways

  • 😲 GPT4OMは多言語翻訳、音声認識、画像認識など、マルチモーダルな機能が強化され、より高速で正確な応答が可能になった。
  • 🤖 GPT4OMはリアルタイム翻訳やキャラクターデザイン、ポスター作成など、さまざまな創造的なタスクに対応できる。
  • 🎓 GPT4OMは教育分野でも活用が可能で、数学問題の解き方や物語作りなど、学びのサポートに役立つ。
  • 🚀 GPT4OMはビジネス領域での利用拡大が見込まれ、アプリ開発やデスクトップアプリのリリースが進む可能性がある。
  • 👥 GPT4OMは会議参加やプレゼンテーション支援など、ビジネスシーンでの活用が進んでいく。
  • 👨‍🏫 GPT4OMは教育者やビジネスマン向けに、具体的な活用アイデアが提供され、業務効率化につながる。
  • 🔍 GPT4OMは画像や音声の解析能力が向上し、ヒートマップ分析やノーデータ解析など、複雑なタスクにも対応できる。
  • 🌐 GPT4OMはWebやアプリから利用可能で、マルチデバイスでの柔軟な活用が期待される。
  • 📈 GPT4OMは今後、リアルタイムデータ処理や分析を通じて、ビジネスや日常生活におけるサービスの速効性を高める。
  • 👂 GPT4OMの音声認識と活用が進展し、会議の疑似録音作成やリアルタイム通訳など、ビジネスシーンでの役割が拡大する。

Q & A

  • GPT4OMはどのような機能が強化されたのですか?

    -GPT4OMは従来のモデルと比較して、動画認識、音声認識、画像認識の性能が向上し、マルチモーダル機能が強化されています。これにより、音声や画像の読み込みや出力の性能が向上しています。

  • GPT4OMのビジネス活用における魅力は何ですか?

    -GPT4OMのビジネス活用における魅力は、Webやアプリからの利用可能性、マルチモーダル機能の強化、高速な思考速度と回答速度、向上した音声機能、そしてGPT4OM2のAPIがより高速で低コストであることです。

  • GPT4OMはどのような限界や弱点がありますか?

    -GPT4OMにもハルシネーションが存在するため、時には事実に反する情報を生成する可能性があります。また、複雑な文脈やニュアンスの理解においても他のモデルと比較して一定の限界があるとされています。

  • GPT4OMを使ってどのような仕事活用アイデアがありますか?

    -GPT4OMを使っての実用的な活用アイデアとしては、リアルタイム翻訳、物語ストーリー作成、ポスター制作、手書きフォントの作成、音声の再現、複数画像合成などがあります。

  • GPT4OMは今後どのような発展が予想されますか?

    -GPT4OMはビジネス領域の拡大、現実世界との認知能力の向上、音声認識と活用の進歩などがあると予想されており、ビジネスや日常生活におけるサービスの質と応答速度の向上が期待されています。

  • GPT4OMはどのようにしてリアルタイム翻訳を提供するのですか?

    -GPT4OMはリアルタイム翻訳を提供する機能を備えており、例えば英語とイタリア語の同時通訳をリアルタイムで行うことができます。

  • GPT4OMを使ってキャラクターデザインを一貫性を持たせた動きを生成することはできますか?

    -はい、GPT4OMを使ってキャラクターデザインを入力し、そのキャラクターが行うべき一連の動きを生成することができます。

  • GPT4OMはどのような形でポスターを作成することができますか?

    -GPT4OMは顔画像を入力すると、それに基づいて映画のポスターを作成することができます。また、表情や文字の指定も行うことができます。

  • GPT4OMを使って手書きフォントを作成することはできますか?

    -はい、GPT4OMを使って手書きのフォントを作成することができます。手書きのサンプルを画像で出力し、それをもとにフォントを作成するプロセスが行えます。

  • GPT4OMはどのようにして音声認識を向上させているのですか?

    -GPT4OMは音声認識の性能を向上させており、感情を含む自然な音声を認識して、より自然な会話を実現することができます。

  • GPT4OMは今後どのようなビジネスシーンで活用されることが予想されますか?

    -GPT4OMは会議の疑似録音作成、リアルタイム通訳、プレゼンテーション支援など、ビジネスシーンでの活用が予想されており、ビジネスの効率化と質の向上に貢献するでしょう。

Outlines

00:00

🤖 GPT4のビジネス活用と性能概要

この段落では、GPT4-OMのビジネス活用方法とその機能について解説しています。GPT4-OMは音声、テキスト、画像などのマルチモーダルな入力を処理できる能力を持っており、従来のモデルと比較して高速かつ高精度な応答が可能であると話題となっています。チャンネルはビジネスマンや会社員向けに、エンジニアの知識がない方でも分かりやすく解説するものとされています。GPT4-OMの概要や使い方、仕事への活用方法について紹介する予定であり、生産性向上に役立つアイデアを提供します。

05:02

🔍 GPT4-OMの魅力と機能の向上

第2段落ではGPT4-OMの魅力と機能向上について説明されています。GPT4-OMはWebやアプリから利用可能で、マルチモーダル機能が強化されています。手書きの文字も認識可能で、思考速度と回答速度が早く、音声機能も向上しています。APIも提供されており、GPT4-TURBOよりも高速で利用料金も半額とコストパフォーマンスが良くなっています。

10:03

🚫 GPT4-OMの限界と弱点

3段落ではGPT4-OMの限界と弱点について触れています。ハルシネーションが存在する場合、事実に忠実ではない情報や誤った情報を提供する可能性があると警告されています。また、複雑な文脈やニュアンスの理解においても他のモデルと比べて若干劣ることがあると指摘されています。動画解析においても、テキストからではなく、動画をテキストに変換する必要があるという制約もあります。

15:04

🛠️ 28の仕事活用アイデア

4段落ではGPT4-OMを活用する28のアイデアが紹介されています。リアルタイム翻訳、物語ストーリー作成、ポスター作成、キャラクターデザインからの一貫性のある動きの生成、手書きフォントの作成、複雑な音声の再現など、多岐にわたる応用方法が提案されています。これにより、ビジネスプロセスやクリエイティブな活動に役立てることができます。

20:05

🔮 GPT4-OMの未来展望

5段落ではGPT4-OMの今後の展望について語られています。ビジネス領域の拡大、現実世界との認知、音声認識と活用の進歩が見込まれています。OpenAIはアプリケーション領域を拡大し、より多くのビジネスシーンでGPT4-OMの能力を発揮する可能性があると予想されています。

25:07

📢 講座紹介とコンサルティングサービスの提供

最後の段落では、講師自身が提供している初心者向けのチャットGPT講座と法人向けのAI導入支援コンサルティングサービスについて紹介しています。講座は全12動画で、アカウント作成からビジネス活用まで学べる内容となっており、コンサルティングサービスではAI導入の方法や活用場所について相談を受けています。

Mindmap

Keywords

💡GPT4OM

GPT4OMは、OpenAIによって発表された最新のAIモデルを指し、音声、テキスト、画像など、多様な入力を一体化して処理することができる機能を持つ。このモデルは、ビジネスでの活用が話題で、ビデオではその性能やビジネスでの活用方法が解説されている。例えば、GPT4OMはリアルタイム翻訳やポスター作成、キャラクターデザインなど、多岐にわたるビジネスシーンで応用が可能であると紹介されている。

💡マルチモーダル機能

マルチモーダル機能とは、音声や画像、テキストなど、複数の入力タイプを一度に処理する能力を指す。ビデオでは、GPT4OMがこの機能を通じて、手書きの文字を認識したり、画像から直接情報を引き出すことができると説明されている。これにより、ビジネスにおける情報の取り扱いがより柔軟になり、多様なデータから洞察を得ることができる。

💡ビジネス活用

ビジネス活用は、ビデオの中心となるテーマの一つであり、GPT4OMがビジネスプロセスや製品開発においてどのように役立つかを探求する。ビデオでは、リアルタイム翻訳、ポスター作成、キャラクターデザイン、手書きフォントの作成など、GPT4OMを活用した多様なビジネスアイデアが提案されている。これにより、ビジネスマンはAI技術を活用して、仕事の効率化や創造性の向上を目指することができる。

💡性能比較

ビデオではGPT4OMと従来のモデルとの性能比較が行われており、その結果、GPT4OMが他モデルに比べて高い性能を持っていることが強調されている。特に、テキストの理解能力、数学的な問題解決能力、多言語翻訳機能などが上げられており、これらの性能はビジネスでの応用に直結する。

💡リアルタイム翻訳

リアルタイム翻訳は、GPT4OMの機能の一つで、ビデオの中でも具体的なビジネス活用例として紹介されている。これにより、ビジネスコミュニケーションにおいて言語の壁を超え、即時の翻訳を提供することができる。ビデオでは、英語とイタリア語の同時通訳が実現された例が挙げられており、これはグローバルビジネスにおいて非常に重要な機能と言える。

💡キャラクターデザイン

キャラクターデザインは、GPT4OMを活用して創造的なプロセスを実行する例としてビデオに登場する。キャラクターのデザインを作成した後、そのキャラクターが行うであろう動作や物語をGPT4OMに入力することで、一貫性のあるストーリーが生成される。ビジネスにおいては、ブランドキャラクターの開発やマーケティング戦略において重要な役割を果たす可能性がある。

💡ポスター作成

ポスター作成は、GPT4OMの創造性と多機能性を示すもう一つのビジネス活用例として触れられている。ビデオでは、顔画像を入力して自動的にポスターが作成されるデモンストレーションがある。これは、マーケティングやイベントプロモーションにおいて、時間と労力を節約しながら効果的なビジュアルコンテンツを作成する手段として利用できる。

💡手書きフォントの作成

手書きフォントの作成は、GPT4OMが理解力と創造性を兼ね備えていることを示す活用例のひとつ。ビデオでは、手書きの文字を画像として入力し、GPT4OMがそれを解釈してフォントに変換するプロセスが紹介されている。これは、デザイナーやアーティストが独自のスタイルを持つフォントを作成する際に、時間と労力を大幅に削減できる可能性を示唆している。

💡アニメーション画像

アニメーション画像は、GPT4OMの画像認識と創造力を応用したビジネス活用の例としてビデオで説明されている。静止画の画像に対して、GPT4OMにアニメーションを加えるように指示すると、自動的に変化や動きを加えた新しい画像が生成される。これにより、マーケティングや広告において、より魅力的なビジュアルコンテンツを作成することが可能になる。

💡会議参加

会議参加は、GPT4OMがビジネスシーンで活用される際の一例としてビデオに登場する。GPT4OMは会議に参加し、音声認識によって議論内容を文字起こししたり、リアルタイムで通訳やプレゼンテーションのサポートを行うことができる。これは、遠隔地にいるチームメンバーを含む会議や、多言語でのコミュニケーションを円滑に行うための重要な機能として位置づけられる。

Highlights

GPT4-OMが発表され、ビジネス活用に話題を集めている。

GPT4-OMの機能を解説し、ビジネスでの活用方法を紹介する。

チャンネルはビジネスマン向けに有用な情報を提供している。

GPT4-OMは音声、テキスト、画像など全ての入力を同時に処理できる。

GPT4-OMは従来のモデルと比較して高速応答が可能。

GPT4-OMは多言語翻訳や図形の読み取りなど、マルチモーダルな性能が向上。

GPT4-OMは数学問題の解き方まで理解し、答えることができる。

GPT4-OMは動画認識、音声認識、画像認識の性能が向上。

GPT4-OMはWebやアプリから利用可能で、マルチモーダル機能が強化されている。

GPT4-OMは音声機能が向上し、感情を含む自然な音声が再現可能に。

GPT4-OMのAPIはGPT4ターボよりも高速で、より費用対効果が高い。

GPT4-OMにはまだハルシネーションが存在する可能性がある。

GPT4-OMは複雑な文脈やニュアンスを正確に理解することが難しい場合がある。

GPT4-OMは動画解析が難しく、正確な出力には限界がある。

28の仕事活用アイデアが提案され、ビジネスにおける幅広い応用が示されている。

リアルタイム翻訳や物語ストーリー作成、ポスター作成など、多様な創造性活動が可能に。

GPT4-OMは手書きフォントの作成、複雑な音声の再現など、多彩な機能を提供している。

GPT4-OMは画像から3Dプリントデータの生成、企業ロゴの生成など、多岐にわたる応用が示されている。

ビジネス領域の拡大、現実世界の認知、音声認識の活用がGPT4-OMの今後の展望として示されている。

Transcripts

play00:00

カですたった1動画で全て分かるGPT4

play00:03

OMのビジネス活用体制についてお話しし

play00:05

ますでOpenAIが発表したGPT4

play00:09

OMの機能がすごいと話題になっており

play00:11

ますいきなりですがこんな疑問ありません

play00:14

かということでGPT4オニの機能は

play00:16

分かるけどどう活用したらいいのだったり

play00:19

結局GPT4OMにって仕事に使えるのと

play00:22

いう悩みがあげられますまこの1動画で

play00:24

ですねGPT4OMの仕事活用方法全て

play00:28

解説いたしますあ改めてですがチャンネル

play00:31

概要をごご紹介いたしますチャットGPT

play00:33

やCIについて業務効率化をしたい事業者

play00:36

や会社員向けにエンジニアの知識がない方

play00:39

でもスライドで分かりやすく解説する

play00:41

チャンネルとなっております現在私はです

play00:43

ね研修事業コンサルティング事業の2つの

play00:46

授業を行っておりますはいでこの動画です

play00:48

がどんな人向けの動画かについてお話し

play00:51

すると1点目がChatGPTの新モデル

play00:54

GPTフーム2の機能や使い方がいまい

play00:57

分かっていない方2点目がGPTフーム2

play00:59

は知っているが仕事の活用方法が分から

play01:02

ない方こちらの2点になりますはい発信

play01:05

カテゴリーですが私の発信はですね

play01:07

ビジネスマンかつ実用的というところに

play01:10

動画の視聴者層を合わせて撮影しており

play01:12

ますこんな風に思っていませんかという

play01:15

ことでGPT4オムニの機能は分かるけど

play01:17

どう活用したらいいか分からないだったり

play01:19

具体的なGPT4オムニの仕事活用方法が

play01:23

いまい分からないという方がま

play01:25

いらっしゃいますでそれらの疑問を解消

play01:27

するためにですね私はま紹介内容としてで

play01:30

この動画ではGPTformにの機能や

play01:32

基本的な使い方をえまとめたものとあとは

play01:35

GPTformにのビジネス活用方法の

play01:38

まとめについてお話ししていきますでこの

play01:40

1動画でですねGPTフームにの概要だっ

play01:43

たり使い方仕事活用全て解説し既に行って

play01:47

いる業務の生産性向上ができるようになり

play01:49

ますはいで私ですね現在家族の動画をご

play01:52

用意しておりますモラ的に学べるChat

play01:55

GPTCIの動画をえ用意しているのでま

play01:58

是非あの気になるタイトルがあれば違う

play02:00

動画もご覧くださいはいで今後も生成の

play02:03

動画を発信していきますのでチャンネル

play02:05

登録をよろしくお願いいたしますで目次

play02:08

ですが1章から5章まで流れ以下の通りに

play02:10

なっております1章が概要2章がえGPT

play02:13

フームにの魅力3章が限界と弱点え4章が

play02:17

28の仕事活用アイデアで最後5章が3つ

play02:20

の展望についてお話ししていきますまずは

play02:23

1章からです1章概要です1章で解説する

play02:26

ことは以下の3つがございます1つ目が

play02:28

GPT4とは2つ目がGPT4オニの性能

play02:32

3つ目が機能になりますでまずそもそもな

play02:35

んですけどGPT4オニとはえOの部分

play02:38

ですねえどういう意味かというと全てと

play02:40

いう意味が含まれていてですねえ音声資格

play02:43

テキストなどの処理を統合しているという

play02:46

イメージで理解するといいんじゃないかな

play02:48

という風に思います従来のモデルとのえ

play02:51

GPT4オ2の比較をしてみると今までは

play02:54

ですねそれぞれの入力を個別に処理してい

play02:57

たえでそのためですね音声また画像入力

play03:00

から応答までに時間を用していたに対して

play03:03

GPT4オムニアですねえ全ての入力を

play03:06

同時に処理することができるのでま高速

play03:09

オトが可能になっておりますはいで性能

play03:11

ですがえクラウ3オーパスと比較しても

play03:15

圧倒的な性能が話題になっているという

play03:17

ところで従来までのモデルGPT4ターボ

play03:20

と比較しても性能が高いと言われていたり

play03:23

しますGPT4にはテキスト水論

play03:26

コーディングに関してえGPT4ターボの

play03:29

レベルのえパフォーマンスを達成している

play03:31

もしくは上回っているというのがあげられ

play03:33

ますはいでGPT4OM2の性能比較の図

play03:37

になるんですがえこちらですねOpen

play03:39

AIのえ公式ページではえGPT4オムニ

play03:43

がピンクなところになっていて他のですね

play03:45

GPT4ターボだったりえCloud3

play03:47

OPPASSだったりjemiPro

play03:49

1.5の性能をえ上回ってるところが多い

play03:52

のかなっていう風に思いますあとはですね

play03:55

音声翻訳のパフォーマンスというところで

play03:57

えOpenAIのgpd方ホムにはえ他の

play04:01

性能他のモデルよりもえ抜きに出てえ性能

play04:05

が高いえ左から2番目の緑のところですね

play04:07

えGPT4オムニを表しておりますであと

play04:10

はですねゼロショットえ結果ということで

play04:13

こちらですね多言語と四角の性能評価を

play04:17

表した図になっていてですねえ多言語のま

play04:20

翻訳機能だったり多言語をどういう風にえ

play04:22

読み取るかっていう能力が高かったりです

play04:25

ねえあとはえ四角からこう多こ読み取っ

play04:28

たりとかM3エムというものがですね多元

play04:31

語とあとは資格の性能になっておりますで

play04:34

ここでですねえ水色がGPT4になってい

play04:37

て緑がGPT4オムニになるんですがま

play04:39

ほとんどの性能でGPT4オムニがえ従来

play04:42

のモデルよりも上回ってることが分かり

play04:44

ますで先ほどのですねM3エムベンチ

play04:47

マークは多言語と資格の両方の評価とえ

play04:50

述べられておりますでですねえ他の国の

play04:53

標準化されたテストからの選択問題で構成

play04:57

されていてや図表が含まれる場合でもを

play04:59

どういう風に読み取れるかとかえ他言語を

play05:02

どういう風に出力するかっていう性能が

play05:04

高いかなっていう風に思っておりますあと

play05:07

はえGPT4OMには他のえモデルと比べ

play05:10

てもえ大学レベルの知識だったり数学的な

play05:13

水論力あとは図の理解と回答あとグラフの

play05:16

読み取りだって画像の水論力あのテキスト

play05:19

ではなくてですね他の画像とかグラフ図と

play05:23

かこういうですねマルチモーダルな

play05:25

読み取りという性能が格段に上がってい

play05:27

るっていうのがえ現状GPT4ニの性能に

play05:30

なりますであとはですねこちらのツイート

play05:33

が話題になっているんですがGPT4オニ

play05:36

ですねえ東大数学2024年の問題を画像

play05:40

から解けるようになったりとかしており

play05:42

ますでですねここで見ていただきたいのが

play05:44

え2024年の問題ということでえ今まで

play05:48

ですねえこGPT4オムニはですね

play05:50

2023年までのデータを学習しているん

play05:53

ですが2024年のデータで学習してい

play05:56

ないですねってことはですねここのえ

play05:58

先ほどございました数学的な水論力という

play06:02

ところでここの水論能力が高いからえ最新

play06:05

問題でも解けるっていう風になっており

play06:08

ますで実際に数値で見てもGPT4ターボ

play06:11

とかだったりあとjmi1.5Proだ

play06:13

はかにえ10以上の数値を上回る結果が

play06:17

GPT4オニでは出ているということが

play06:19

分かっておりますえこの中でも特にえ着目

play06:22

したい点としてはここの数学的な水論力に

play06:25

なります続いてはですねGPT42の機能

play06:28

になりますで機能ですが前提としては昨日

play06:31

は従来のモデルにえ特別追加されたりとか

play06:34

え特別特徴的になったわけではございませ

play06:36

んえポイントとしては従来のモデルと比較

play06:39

して特定の性能が上がっているっていう

play06:41

ところ着目していただきたいですで

play06:44

ポイントとしては以下の3つがございまし

play06:46

て1点目が動画認識の性能向上2点目が

play06:49

音声認識の性能が向上したえ3つ目が画像

play06:52

認識の性能向上ですねえこれらによってね

play06:55

テテキストっていうよりマルチモーダル

play06:57

機能画像だったり音声どがの読み込み

play07:00

だっったり出力の性能が向上していること

play07:03

がポイントになりますでまとめたものが

play07:05

書きになるんですが動画認識ではホーム

play07:07

ページのところでは45分の講義動画の

play07:10

要約も実現したりとか音声認識では感情を

play07:14

理解できたと言われておりますただ音声

play07:16

認識のところでは人間の感情を理解したと

play07:19

いうわけではなくてあくまでデータからえ

play07:21

推論していくえ音声がどういう風な感情に

play07:24

なっているかっていうのを推測してえ論理

play07:27

的に数値を出しているっていところになり

play07:30

ますなので人間の感情を理解したとまでは

play07:32

え言いきれないところがえ正直なところに

play07:35

なりますであとは画像認識ですね特に文字

play07:38

の読み取り機能がえ格段に上がっており

play07:40

ますえ他言語のえ文字の読み取り機能が

play07:43

GPT42では向上しています続いては2

play07:47

章のGPT4オムニの魅力についてお話し

play07:49

していきます第2章です5つの魅力が上げ

play07:52

られます1つ目はWebやアプリから利用

play07:55

可能というところ2つ目はマルチモーダル

play07:57

機能の強化3つ目は行速度と回答速度がえ

play08:01

格段に早いというところ4つ目が音声機能

play08:04

が向上したという点5つ目がGPTホーム

play08:07

2のAPIの話になりますで以下のえ5つ

play08:10

が先ほど上げられていたんですが1つ目が

play08:12

Webアプリから利用可能になっていてえ

play08:15

スマホからでもパソコンからでもGPT4

play08:17

ムにっていうのが使えるようになっており

play08:19

ますで2つ目はですねマルチモデル機能に

play08:22

より手書きでも認識可能ということで紙に

play08:25

手書きでえ文字を書いただけでもえ雑な字

play08:28

であっても読み取りに認識が可能になって

play08:30

おりますで3つ目が思考速度と回答速度が

play08:33

早いっていうところで実際に検証した動画

play08:35

もあるので続いて見ていきます4つ目は

play08:38

歌ったりロボットのような声あの音声の

play08:41

バリエーションが格段に増えたりとか音声

play08:43

の出力の精度が上がっているっていう

play08:45

ところが4つ目になっておりますで5つ目

play08:48

はAPIがえGPT4ターボよりもですね

play08:50

え2倍高速で半額でさらに利用できると

play08:53

いった点が上げられていますえWebや

play08:56

アプリから利用可能になっているという

play08:57

ことでま先日のアップデートでChat

play09:00

GPTのデスクトップアプリが追加されて

play09:02

実際に私試したんですが@GPT4OMが

play09:05

追加されていたりとかえ以下の画面でえ

play09:08

GPT4OMIとChatGPT4と

play09:11

3.5がえそれぞれでえモデルが選択可能

play09:14

になっていたりとかえそういう風な形で

play09:16

Webアプリから利用可能になっており

play09:18

ますはいこちらがアプリ版になるんですが

play09:20

えGPT4OM2とえGPT4とえGPT

play09:24

3.5えそれぞれのモデルが選択できる

play09:26

ようになっておりますでさらに見て

play09:28

いただきのがアプリからでもですね音声

play09:31

入力だったりとかえファイルの入力え画像

play09:34

のアップロードだったり写真をその場で

play09:36

取ってアップロードするみたいな形で利用

play09:39

可能になっておりますであとはですね

play09:41

マルチモーダル機能によって手書きでも

play09:43

認識可能というところがポイントになって

play09:46

おります画像認識能力だったりえ理解力

play09:49

っていうところがあればどんだけ雑な文字

play09:52

とかでもですねえ綺麗に書き起こして

play09:54

もらったりとかあのUIに反映させてコド

play09:57

を書いてもらったりとかそういう実例も出

play09:59

ております以下の通り文字に対してコドを

play10:02

書いてもらってえ実際にえUIとして

play10:05

成り立つようなプログラミングをえチャト

play10:08

GPT4オニではできたりしますあとは

play10:11

ですね回答速度が比較的早くてストレスが

play10:14

格段に減るといった形でここをあくまで

play10:17

目安にしていただきたいんですが従来の

play10:19

モデルを1倍とした時にGPT4オムニの

play10:22

回答速度はですね1.5倍とかま2倍以上

play10:25

の出力が出ているなという風に感じており

play10:27

ますで実際にですですねえ以下スピード

play10:30

検修をさせていただきましたので実際に

play10:32

回答スピード見ていきましょうはいこちら

play10:35

の通りですねまずはチットGPT4の出力

play10:38

をしておりますで適当な文章全く同じ文章

play10:41

をGPT4とえGPT4オムニで全く同じ

play10:44

文章を出力してとえ指示を出しているここ

play10:47

ではですねえ回答速度だけえ検証している

play10:50

といった形になりますで以下の通りですね

play10:53

え大体の回答速の方を見ていただきたいな

play10:56

ていう風に思いますはいこんな感じでです

play10:58

ね配当速度でややえ遅かったりとかGPT

play11:02

4では見られるんですがオムニの方を検証

play11:05

していくとえ先ほどのGPT4よりもです

play11:08

ねえやや早くえ出力されていることが

play11:11

分かるかと思いますでこれ見ていくとです

play11:13

ね大体1.5倍からま2倍以上の出力がえ

play11:16

出力スピードがえ果たせているえ達成でき

play11:20

ているなっていう風に感じております続い

play11:22

てはですね4つ目の歌にロボットのような

play11:24

声が出力可能にというところをご紹介

play11:26

いたしますはいではこちらのニュースえ

play11:29

実際にOpenAIが発表したデモ動画を

play11:32

一緒に見ていきましょうこちらですね音声

play11:34

がより自然になっております感情を込め

play11:37

たりとかですねChatGPT4オムニは

play11:40

ですねえ会話しながらだったりとか4

play11:43

オムニに対してえこういう感情で話して

play11:45

欲しいというとですねそれに基づいて話し

play11:47

てくれたりとかそういうことが実現できて

play11:50

おります続いては3章のえ限界と弱点に

play11:52

ついてお話していきますえ先ほど魅力を

play11:55

解説したので続いては限界と弱点について

play11:58

ですはい3つのデメリットがGPT4

play12:00

オムニではございます1つ目は

play12:02

ハルシネーションがまだあるというところ

play12:04

2つ目はテキストの水論能力3つ目が動画

play12:07

の解析になりますでGPT4オムニはです

play12:10

ね万能になったわけではないということに

play12:12

注意しておいてくださいでまず

play12:14

ハルシネーションの実例を見ていきたいん

play12:16

ですがチットGPTなどの言語モデルがま

play12:19

実際には存在しない情報やえ事実を生成し

play12:23

てしまう現象のことをハルシネーションと

play12:25

言っておりますポイントとしては情報を

play12:27

チャットGPTに問い合わせた際にえ

play12:30

ChatGPTが存在しない機能だという

play12:32

説明することもあったりとかまそういった

play12:35

問題が上げられますはいで私ですね実際に

play12:38

Microsoftのえホームページから

play12:40

こちらの2つのプランmicrosoft

play12:42

365のえファミリーとパーソナルえ

play12:45

それぞれのプランについて表を作成して

play12:47

くださいという風にプロンプトで指示をし

play12:50

ましたはい以下の通りですね以下のURL

play12:52

からmicrosoft365ファミリー

play12:54

とえパーソナルの比較表具体的に作成して

play12:57

と指示をしておりますでそうすると

play13:00

ハルシネーションなしの場合では正しく

play13:02

金額だったりとかあとはユーザー数あと

play13:04

同時サインイン可能なデバイス数とか表に

play13:07

出してくれているのが分かるかと思います

play13:10

で先ほどの単純なえ比較2つの比較とかで

play13:13

あればこのようにハルシネーションなしで

play13:15

正しく出力ができるんですが続いて

play13:18

ハルシネーションRIの場合検証していき

play13:20

ます先ほどの同じページから今度は

play13:22

マイクロソフトの法人向けのプラン4つの

play13:25

プランがあるんですがえこちら4つの

play13:27

プランのそれぞれの較格表を作成してと

play13:30

言いました多少難易度が上がっているか

play13:32

なっていう風に思っておりますはいで一般

play13:35

法人向けの表も作成してと指示をしました

play13:37

えこちら出力結果になります先ほどの

play13:40

URLを検索して読み込んではくれました

play13:43

ただですねえ見ていただきたいのが右が

play13:46

画像になるんですがビジネスプレミアムと

play13:49

えフォビジネスプラン3298と1236

play13:53

と書いてあるんですが表ではですねえ価格

play13:56

が全然違っていたりとかこの辺も少しり

play13:59

だったりとかややハルシネーションえ実際

play14:02

にありもしないえ現実とは違う数値だっ

play14:05

たり回答っていうのを出力しておりますえ

play14:08

このようにですね表とかが読み込むえ

play14:10

URLが少し難しかったりすると

play14:12

ハルシネーションが起きやすくなっており

play14:14

ます続いてはテキストの水論能力です

play14:17

GPT4オムニはですね複雑な文脈だっ

play14:20

たりニュアンスを正確に理解することが他

play14:22

のえ一部のモデルよりも取りますでこれに

play14:25

よって想定される事態としてはですね重要

play14:28

な法的ニアスの見逃しだったり顧客からの

play14:30

複雑な要求への対応不足などが上げられ

play14:33

ますこちらドロップというところでえ文字

play14:36

水論能力そちらはクラウド3オーパスの方

play14:39

がやや上というところでえ1番右のところ

play14:42

見ていただきたいんですがこの緑の

play14:44

クラウド3オーパスのえところよりも

play14:47

ピンクの方がやや性能が下がっていると

play14:50

いうところになりますただですねあくまで

play14:52

誤差になるのでそこまで気にしなくては

play14:54

いいのかなっていう風に個人的には思って

play14:56

おりますであとは動画解析のところで強弱

play14:59

動画の解析がなかなか難しくて1度動画を

play15:02

テキストにしてからそこからプロンプト

play15:04

書かないと正確には出力されません

play15:07

ポイントとしては動画ファイルを送る際は

play15:09

分割だったりとかあのできるだけ短い尺に

play15:12

した上でえその後で送るというところが

play15:15

ポイントになりますで実際にですの

play15:18

ミーティングの疑似録を記載してと50分

play15:20

ぐらいのミーティングをチャトGPTに

play15:22

入力したんですがま動画をテキストに変換

play15:25

する作業を行いますのでえお待ちください

play15:27

と言ってからなかなか出力されなかったり

play15:30

とかえ出力にエラが出たりとかそういった

play15:33

ことがあげられますで続いては4章の28

play15:36

の仕事活用アイデアについてお話しして

play15:38

いきますGPT4主に仕事活用アイデア

play15:41

28戦ですまずはリアルタイム翻訳から

play15:44

ですこちらがですね英語とイタリア語のえ

play15:48

同時通訳リアルタイム翻訳ですこちら英語

play15:51

ですねイタリア語に翻訳して欲しいと言っ

play15:54

ていますこれはイタリア語ですねはいこの

play15:57

ようにリアルタイム翻訳がえできており

play15:59

ます続いては物語ストーリー作成でこちら

play16:03

えチャトGPTOpenAIのホーム

play16:05

ページからえ引用させていただいたんです

play16:07

がえこちらの通りまずえ画像を作成する

play16:10

ように入力してえ出力結果ができており

play16:13

ますまずはタイプライターでタイプして

play16:15

いるロボットのえ画像を生成したとで

play16:18

さらにえ次から注目していただきたいのが

play16:21

破ろうとするえ出力え入力をするとえ実際

play16:25

に破っているえ先ほどの出力した画像から

play16:28

タイプライターがが出たりとかこの

play16:29

ストーリーを作成できる画像を1回出力し

play16:33

てその画像を元に入力を追加していくと

play16:35

ストーリーとか物語りが出来上がるって

play16:38

いうのがここのGPT4オムニの特徴に

play16:40

なります画像の読み込みとか文字の認識

play16:43

文字の出力というのは格段に精度が上がっ

play16:45

ているのでこのようにタイプライターとか

play16:47

えこの文字で実際に画像にえ入れ

play16:49

るっていうところもえ精度が上がっており

play16:51

ますであとはまこちら実際に人物のえ

play16:54

キャラクターデザインというものを作った

play16:56

後にこの人物がえどういう風にこうして

play16:59

いくのかていう入力をすると出力も同じ

play17:02

ように出てきますえ郵便配達員のサリー

play17:05

ですとえ添付ファイルをえ先ほど画像出力

play17:09

されたと思うのでダウウンロードして一緒

play17:10

に添付して入力しておりますでそうすると

play17:13

ですね入力することでえストーリーが作れ

play17:16

たりとかえ犬に追われてるシーンとかあ

play17:19

サリーがつまづいたというだけつまづいた

play17:21

仮想を提供してくれたりとかまた車に乗っ

play17:24

てるシーンだったり1回キャラクター

play17:26

デザインを作り際すればですねいろんな

play17:29

ストーリーがえできる一貫したストーリー

play17:31

も作成できます続いてはポスター制作に

play17:34

なりますまこちらもオーAIからのホーム

play17:36

ページを利用させていただいたんですが

play17:38

まずは2人の画像顔画像を入力するとで

play17:42

その後に映画のポスター2人の映画の

play17:45

ポスターを作成して欲しいと指示をしまし

play17:47

たはいこのように探偵のえ最後のポスター

play17:49

を作って欲しいと2人の大きな顔が目立つ

play17:52

ように書かれていますと指示をしており

play17:54

ますで彼らの表情はえ真剣で決意がありと

play17:58

か表情の指敵だったりとかですねあとは

play18:00

文字の指定などもあります実際に出力され

play18:03

たのは以下の通りになっていて少し怖い

play18:05

画像になっているんですが文字を入れ込ん

play18:07

だりとかですねえ画像に色をつけたり

play18:09

ポスター制作というものが可能になって

play18:12

おります実際にダウンロードとかもでき

play18:13

たりしますであとはキャラクターデザイン

play18:15

から一貫性を持った動きを生成するという

play18:18

ことでま一旦このようにえロボットをえ

play18:21

入力して画像を出力してもらってから

play18:23

さらに追加でクリスビーを取ってる様子

play18:26

だったり自転車に乗ってる様子あとは

play18:28

プログラミングしてる様子だったりえ

play18:30

キッチンで料理をしてる様子っていうもの

play18:32

え一貫したキャラクターデザインから生成

play18:35

することが可能ですであとはですね手書き

play18:37

フォントの作成変換ということで以下の死

play18:40

のようなものを手書きフォントで作成して

play18:43

とでそれを画像で出力してと指示をして

play18:45

おりますでそうするとえ次のように出力が

play18:48

ま手書きっぽい手紙のようなものをえ出力

play18:52

しているのが分かるかと思いますはいあと

play18:54

は複雑な音声の再現ということでえこちら

play18:57

金属でコインのカチャを鳴らすという入力

play19:00

に対して出力を音声で出してくれたりとか

play19:03

あとは複数画像合成とか2枚以上の添付

play19:06

ファイルを持ちてそれをえ合成して

play19:08

くださいとかえ複数の画像を元にえ1つの

play19:11

画像を作成してくださいとかという形も例

play19:14

としてあげられますであと自分で撮った

play19:16

写真を顔絵にしたりとか絵にしたりという

play19:18

ことも可能ですあとはテキストから

play19:21

フォント変換添付ファイルから違う

play19:23

フォントに変えてと言うと違うフォントに

play19:25

え画像を読み込んでえ変えてくれたりとか

play19:28

ですねあとは画像から3Dプリント用の

play19:30

データを生成してくれるなどの例もあげ

play19:33

られますOpenAIを含むロゴのリアル

play19:36

な3Dレタリングをえ生成してと言うと

play19:39

実際にこれ動画で出力されているんですが

play19:41

これを回転して3D合成というものができ

play19:44

ていますアカの画像とかもえ同じように3

play19:47

D合成が出力されておりますあとはですね

play19:51

ブランドの生成ということで2つのえ写真

play19:54

からブランドとしてくっつけたりロゴを

play19:57

入れたりとかあとは画像に複数文字の挿入

play19:59

ということでえ以下の文字を画像に入れて

play20:01

くださいと言うとあの文字の認識機能と

play20:04

あと画像に反映する機能が格段に精度が

play20:07

上がっているということでえ以下のような

play20:09

細かい文字でもしっかり正確に入れてくれ

play20:12

ますでホームページでは音声データから

play20:14

和式別し文字起しするという例も上げられ

play20:17

ていますこのオーディオにはスピーカーが

play20:19

なんだやって何が起こったのでしょうかと

play20:22

オーディオを入れるとチットGPTはそれ

play20:24

を読み込んでくれてこういったことが行わ

play20:26

れていますと出力していますであとは

play20:29

こちらは私試したんですがなかなか難しく

play20:31

てですねえホームページでは45分の講義

play20:34

動画の要約ができておりますえ45分の

play20:37

動画を挿入してプレゼンテーションの

play20:39

ビデオですと詳細な概要を教えてください

play20:41

とえ入力するとえ以下のようにま45分の

play20:45

プレゼンテーションでもね一発でこのよう

play20:47

に要約が出ているという形になっており

play20:49

ますはいであとは会議にチャットGPTを

play20:53

え参加させてえその場で文字を作成させて

play20:56

音声でえ何かアイデアを出してと会議中に

play20:59

言うとChatGPTが会議で参加して

play21:01

くれたりとかえそういったこともあげられ

play21:03

ておりますはいであとはですねツイートで

play21:06

話題になってるところ紹介させていただき

play21:08

たいんですが写真から領収書の仕分けとか

play21:11

えそういう形もできますもこちらの左の

play21:14

レシートに対して仕訳の詳細ということで

play21:17

読み取って数値だったり文字というものを

play21:19

正確に反映しておりますあと先ほど紹介さ

play21:23

せていただいたんですがイラストで書かれ

play21:25

たUIをコドに変換するということもでき

play21:27

ますえイラストとか手書きでこういう風に

play21:30

書いて欲しいというとですね行動を書いて

play21:32

くれてえさらにそこからえUIとして実際

play21:35

に使える画面を作れたりしますあとは画像

play21:39

から岐阜画像作成できたりとか適当な風景

play21:42

の画像まずチャッGPTえダリでえ画像

play21:45

生成するとでその後にアニメーションを

play21:47

加えたいですかという形でアニメーション

play21:50

画像を作れたりとかもしますでこのように

play21:52

指示としてはえ光の移動だって風景の変化

play21:55

動物の動き全て加えながらアニメーション

play21:58

の動画を作成してくださいと言いました

play22:01

そうするとChatGPTの画面で

play22:02

アニメーションの動画をダウンロードする

play22:05

リンクが与えられてそこをクリックすると

play22:08

アニメーションの動画というのが

play22:09

ダウンロードできたりしますで実際に画像

play22:12

が並んであると思うんですが光の加減が

play22:15

変化するような画像えアニメーション動画

play22:18

というものをチットGPTは生成してくれ

play22:20

ていますであとはこちらのツイートでえ

play22:22

ノーデータを解析するということが上げ

play22:25

られておりますノーデータ解析を試してい

play22:28

て速度と精度はえかなり向上していると

play22:30

いう声があったりとか複雑なカオスマップ

play22:33

を文字起こしするなども可能ですえ人間が

play22:36

見ると少し字が細かくて読みにくいカオス

play22:38

マップの画像でも文字起ししてくれており

play22:41

ますえカテゴリ別にえどの企業があるの

play22:44

かっていうのをえ出力してくれております

play22:47

ヒートマップ分析なども画像の読み込み

play22:50

から可能です以下のヒートマップを分析し

play22:52

て最も反応が多い部分を特定して欲しいと

play22:55

いうとえここのえヒートマップえここのの

play22:58

分析結果上げられますといった形で

play23:01

ChatGPTは提案してくれますあとは

play23:03

ですね5分でスカゲームのようなものが

play23:05

作成できたりとかえそういった形でも

play23:08

Chatgpd4オリが使われていたりと

play23:10

かしますでさらに本のページ先ほど文字の

play23:14

認識が向上したとえ言ったんですが本の

play23:17

ページとか手書きのえ本とかま写真で撮る

play23:20

だけでその写真の文字がえどういう風に

play23:22

書いてあるのかとか文字を出力してさらに

play23:25

要約だったり書き起こしというものがえ

play23:27

制度が上がっておりますであとはこちらの

play23:30

企業ロゴからこう出力生成したりとかそう

play23:33

いった事例もあげられます企業名を羅列し

play23:35

てというとえ企業ロゴを見ただけで

play23:38

いろんな企業をあげているかと思います

play23:40

書き殴り文章の文字越しなども可能です

play23:43

こちらの海外のツトではま手紙のような

play23:46

ものを書くとそれを写真としてチット

play23:48

GPTにアップロードして入力するとその

play23:51

まま文字起こししてくれたりとか要約し

play23:54

たりとかそういったことも可能ですと

play23:56

こちらのツイートになるんですが

play23:57

ウェブサイトの作成なども可能ですGPT

play24:00

4オ2でウブサイトが誰でも作れるとこう

play24:03

いった形で実際の画面を作成したり行動

play24:06

生成してくれたりとか逆に修正したりとか

play24:09

そういったことも可能ですあとですね

play24:11

OpenAIのデモ動画ではGPT4

play24:14

オムニ同士で会話するといったこともえ

play24:16

あげられておりますでこれで何ができるか

play24:19

と言うとGPT4オムニ同士でですね

play24:22

アイデアを出し合ったりとか議論し合っ

play24:24

たりまそういったことが可能だったりし

play24:26

ますはい続いては5章の今後の3つの展望

play24:29

です第5章です5章の内容ではえ以下の3

play24:33

つのことについてお話ししますビジネス

play24:35

領域の拡大現実世界の認知音声認識と活用

play24:39

ですまずはビジネス領域の拡大です

play24:41

OpenAIは今後アプリケーション領域

play24:44

まで拡大していくとえ予想しておりますえ

play24:47

今後のポイントとしてはですね今までは

play24:49

チットGPTというオOpenAIはです

play24:51

ね言語モデルの基盤というものを整えてい

play24:54

てえその状態があったところからま

play24:57

いろんなスタートアップとかベンチャー

play24:59

企業というのがChatGPTを使った

play25:01

アプリをどんど出していたんですが今後は

play25:04

OpenAIがアプリ開発を行ったりとか

play25:06

OpenAIがChatGPTの

play25:08

デスクトップアプリ版をリリースしたと

play25:10

いうニュースがあるのでまそういった形で

play25:13

どんどんそのアプリケーション領域まで

play25:15

入っていくという可能性もございますで

play25:17

続いてはですね数秒単位で現実世界がえ

play25:21

認知できるようになってくるといった予想

play25:23

もございます@GPTは今後現実世界を

play25:26

認識して即座に反応する能力をえ持つよう

play25:29

になるのではないかとえ思っていてですね

play25:31

ポイントとしてはリアルタイムデータの

play25:33

処理だったり分析っていうのを可能にして

play25:36

ビジネスとか日常生活において速効性の

play25:39

高いサービスを提供できるようになります

play25:41

えこちらの実際OpenAIの

play25:43

YouTubeあの見ていただきたいん

play25:45

ですがここの現実世界とのえ融合だったり

play25:48

現実世界とのま掛け合わせをえ見て

play25:51

いただきたいですこれはChatGPT4

play25:54

オニを活用した動画になっております

play26:01

こちら建物を撮影して説明を促しています

play26:07

あとはですねタクシーが来たらえ合図して

play26:09

くれ

play26:17

ますこのようにですねえタクシーが来たら

play26:20

合図するタイミングというものをとGPT

play26:22

4オニが教えてくれたりそれを会話レベル

play26:26

でえ回答速度と回答制度向上しているので

play26:29

そちらのようなえ活用方法も実現できてい

play26:32

たりとかします現実世界の融合建物の説明

play26:35

をしたりとかタクシーが来たらえそれを

play26:38

教えて欲しいとかそういった形でえ目の

play26:41

役割をしてくれるとか目が見えない方でも

play26:44

チャットGPTがその役割を担ってくれる

play26:47

といった活用方法ができております続いて

play26:50

音声認識と音声活用が進んでいく特にここ

play26:52

の音声というところ着目していただきたい

play26:55

んですが翻訳能力の向上始めですね音声に

play26:58

意識だったり音声出力の制度が向上すると

play27:01

予想しますポイントとしては会議の疑似力

play27:04

作成だったりリアルタイムの通訳

play27:06

プレゼンテーションの支援などより多くの

play27:08

ビジネスシーの場面でまその能力を発揮

play27:11

するのではないかと思っております実際に

play27:13

チャットGPT4オムニがミーティングに

play27:16

参加している様子を見ていき

play27:26

ますこのようにですねとCPTがあの1人

play27:29

の人間のような形でえ音声をどんどんこう

play27:32

入力してえ文字起こししてくれたりとか

play27:35

こう会話に入ってくれたりそういったこと

play27:37

も可能になってきています最後にまとめ

play27:40

です以下の内容を解説しました1章が概要

play27:43

2章がえjatGPT4オムニの魅力3章

play27:46

が限界と弱点4章が仕事活用のアイデア5

play27:49

章が3つの展望ですはい私ですね現在初心

play27:53

者向けのチャットGPTの講座というもの

play27:55

を全12動画あげておりますのでこちら

play27:58

アカウント作成の段階から基本的な

play28:01

ビジネス活用ができる動画になっており

play28:03

ますので是非ご覧くださいあはですね現在

play28:06

数の動画をご用意しておりますえ仕事の

play28:08

時短課業務効率化につながる動画がござい

play28:11

ますので是非ご覧くださいで最後に大事な

play28:14

お知らせがございます私ですね現在法人

play28:17

向けの生成のえ投入支援の

play28:19

コンサルティングと車内研修を行っており

play28:21

ますご相談内容としてはssaiを自社で

play28:24

導入する方法が分からないという方だって

play28:26

具体的にどこで活用できるかが分からない

play28:28

という方いらっしゃいますのでまこれらの

play28:30

お悩みがございましたら是非ご相談

play28:32

くださいで下期のような内容をご相談

play28:34

できるといった形でえ意外と定正AI導入

play28:37

までロードマップがかなり長かったりもし

play28:40

ますどういう風に導入していくかえお

play28:42

問い合わせくださいお申し込みは概要欄の

play28:44

リンクから可能ですえ1番上に導入支援の

play28:47

ご相談のフームをえ記載しておりますので

play28:50

えこちらから必要事項の記入とお手数です

play28:52

が行っていただけますと幸いです最後に

play28:55

なりますがチャンネル登録高評価コメント

play28:57

よろしくお願いいたしますでは次回の動画

play28:59

でお会いしましょう

Rate This

5.0 / 5 (0 votes)

Ähnliche Tags
GPT4ビジネス活用マルチモーダルリアルタイム翻訳未来展望AI技術翻訳機能ポスター作成ストーリー生成音声認識
Benötigen Sie eine Zusammenfassung auf Englisch?