【総集編】GPT-4oの教科書【使い方、活用方法を解説!】
Summary
TLDRこの動画では、OpenAIが発表した最新の言語モデルGPT-4 Omniについて詳しく解説しています。GPT-4 Omniは音声、テキスト、画像を統合的に処理できる多機能性と、従来のモデルに比べて飛躍的な性能向上を誇ります。ビジネスでの活用方法にも焦点を当て、リアルタイム翻訳、ストーリー作成、ポスター作成など、多様な仕事における応用例を紹介。また、現在の限界や弱点も提及し、ビジネス利用における注意点を提示。最後に、AIのビジネス活用に関する講座やコンサルティングサービスを提供していることも紹介しています。
Takeaways
- 😲 GPT4OMは多言語翻訳、音声認識、画像認識など、マルチモーダルな機能が強化され、より高速で正確な応答が可能になった。
- 🤖 GPT4OMはリアルタイム翻訳やキャラクターデザイン、ポスター作成など、さまざまな創造的なタスクに対応できる。
- 🎓 GPT4OMは教育分野でも活用が可能で、数学問題の解き方や物語作りなど、学びのサポートに役立つ。
- 🚀 GPT4OMはビジネス領域での利用拡大が見込まれ、アプリ開発やデスクトップアプリのリリースが進む可能性がある。
- 👥 GPT4OMは会議参加やプレゼンテーション支援など、ビジネスシーンでの活用が進んでいく。
- 👨🏫 GPT4OMは教育者やビジネスマン向けに、具体的な活用アイデアが提供され、業務効率化につながる。
- 🔍 GPT4OMは画像や音声の解析能力が向上し、ヒートマップ分析やノーデータ解析など、複雑なタスクにも対応できる。
- 🌐 GPT4OMはWebやアプリから利用可能で、マルチデバイスでの柔軟な活用が期待される。
- 📈 GPT4OMは今後、リアルタイムデータ処理や分析を通じて、ビジネスや日常生活におけるサービスの速効性を高める。
- 👂 GPT4OMの音声認識と活用が進展し、会議の疑似録音作成やリアルタイム通訳など、ビジネスシーンでの役割が拡大する。
Q & A
GPT4OMはどのような機能が強化されたのですか?
-GPT4OMは従来のモデルと比較して、動画認識、音声認識、画像認識の性能が向上し、マルチモーダル機能が強化されています。これにより、音声や画像の読み込みや出力の性能が向上しています。
GPT4OMのビジネス活用における魅力は何ですか?
-GPT4OMのビジネス活用における魅力は、Webやアプリからの利用可能性、マルチモーダル機能の強化、高速な思考速度と回答速度、向上した音声機能、そしてGPT4OM2のAPIがより高速で低コストであることです。
GPT4OMはどのような限界や弱点がありますか?
-GPT4OMにもハルシネーションが存在するため、時には事実に反する情報を生成する可能性があります。また、複雑な文脈やニュアンスの理解においても他のモデルと比較して一定の限界があるとされています。
GPT4OMを使ってどのような仕事活用アイデアがありますか?
-GPT4OMを使っての実用的な活用アイデアとしては、リアルタイム翻訳、物語ストーリー作成、ポスター制作、手書きフォントの作成、音声の再現、複数画像合成などがあります。
GPT4OMは今後どのような発展が予想されますか?
-GPT4OMはビジネス領域の拡大、現実世界との認知能力の向上、音声認識と活用の進歩などがあると予想されており、ビジネスや日常生活におけるサービスの質と応答速度の向上が期待されています。
GPT4OMはどのようにしてリアルタイム翻訳を提供するのですか?
-GPT4OMはリアルタイム翻訳を提供する機能を備えており、例えば英語とイタリア語の同時通訳をリアルタイムで行うことができます。
GPT4OMを使ってキャラクターデザインを一貫性を持たせた動きを生成することはできますか?
-はい、GPT4OMを使ってキャラクターデザインを入力し、そのキャラクターが行うべき一連の動きを生成することができます。
GPT4OMはどのような形でポスターを作成することができますか?
-GPT4OMは顔画像を入力すると、それに基づいて映画のポスターを作成することができます。また、表情や文字の指定も行うことができます。
GPT4OMを使って手書きフォントを作成することはできますか?
-はい、GPT4OMを使って手書きのフォントを作成することができます。手書きのサンプルを画像で出力し、それをもとにフォントを作成するプロセスが行えます。
GPT4OMはどのようにして音声認識を向上させているのですか?
-GPT4OMは音声認識の性能を向上させており、感情を含む自然な音声を認識して、より自然な会話を実現することができます。
GPT4OMは今後どのようなビジネスシーンで活用されることが予想されますか?
-GPT4OMは会議の疑似録音作成、リアルタイム通訳、プレゼンテーション支援など、ビジネスシーンでの活用が予想されており、ビジネスの効率化と質の向上に貢献するでしょう。
Outlines
🤖 GPT4のビジネス活用と性能概要
この段落では、GPT4-OMのビジネス活用方法とその機能について解説しています。GPT4-OMは音声、テキスト、画像などのマルチモーダルな入力を処理できる能力を持っており、従来のモデルと比較して高速かつ高精度な応答が可能であると話題となっています。チャンネルはビジネスマンや会社員向けに、エンジニアの知識がない方でも分かりやすく解説するものとされています。GPT4-OMの概要や使い方、仕事への活用方法について紹介する予定であり、生産性向上に役立つアイデアを提供します。
🔍 GPT4-OMの魅力と機能の向上
第2段落ではGPT4-OMの魅力と機能向上について説明されています。GPT4-OMはWebやアプリから利用可能で、マルチモーダル機能が強化されています。手書きの文字も認識可能で、思考速度と回答速度が早く、音声機能も向上しています。APIも提供されており、GPT4-TURBOよりも高速で利用料金も半額とコストパフォーマンスが良くなっています。
🚫 GPT4-OMの限界と弱点
3段落ではGPT4-OMの限界と弱点について触れています。ハルシネーションが存在する場合、事実に忠実ではない情報や誤った情報を提供する可能性があると警告されています。また、複雑な文脈やニュアンスの理解においても他のモデルと比べて若干劣ることがあると指摘されています。動画解析においても、テキストからではなく、動画をテキストに変換する必要があるという制約もあります。
🛠️ 28の仕事活用アイデア
4段落ではGPT4-OMを活用する28のアイデアが紹介されています。リアルタイム翻訳、物語ストーリー作成、ポスター作成、キャラクターデザインからの一貫性のある動きの生成、手書きフォントの作成、複雑な音声の再現など、多岐にわたる応用方法が提案されています。これにより、ビジネスプロセスやクリエイティブな活動に役立てることができます。
🔮 GPT4-OMの未来展望
5段落ではGPT4-OMの今後の展望について語られています。ビジネス領域の拡大、現実世界との認知、音声認識と活用の進歩が見込まれています。OpenAIはアプリケーション領域を拡大し、より多くのビジネスシーンでGPT4-OMの能力を発揮する可能性があると予想されています。
📢 講座紹介とコンサルティングサービスの提供
最後の段落では、講師自身が提供している初心者向けのチャットGPT講座と法人向けのAI導入支援コンサルティングサービスについて紹介しています。講座は全12動画で、アカウント作成からビジネス活用まで学べる内容となっており、コンサルティングサービスではAI導入の方法や活用場所について相談を受けています。
Mindmap
Keywords
💡GPT4OM
💡マルチモーダル機能
💡ビジネス活用
💡性能比較
💡リアルタイム翻訳
💡キャラクターデザイン
💡ポスター作成
💡手書きフォントの作成
💡アニメーション画像
💡会議参加
Highlights
GPT4-OMが発表され、ビジネス活用に話題を集めている。
GPT4-OMの機能を解説し、ビジネスでの活用方法を紹介する。
チャンネルはビジネスマン向けに有用な情報を提供している。
GPT4-OMは音声、テキスト、画像など全ての入力を同時に処理できる。
GPT4-OMは従来のモデルと比較して高速応答が可能。
GPT4-OMは多言語翻訳や図形の読み取りなど、マルチモーダルな性能が向上。
GPT4-OMは数学問題の解き方まで理解し、答えることができる。
GPT4-OMは動画認識、音声認識、画像認識の性能が向上。
GPT4-OMはWebやアプリから利用可能で、マルチモーダル機能が強化されている。
GPT4-OMは音声機能が向上し、感情を含む自然な音声が再現可能に。
GPT4-OMのAPIはGPT4ターボよりも高速で、より費用対効果が高い。
GPT4-OMにはまだハルシネーションが存在する可能性がある。
GPT4-OMは複雑な文脈やニュアンスを正確に理解することが難しい場合がある。
GPT4-OMは動画解析が難しく、正確な出力には限界がある。
28の仕事活用アイデアが提案され、ビジネスにおける幅広い応用が示されている。
リアルタイム翻訳や物語ストーリー作成、ポスター作成など、多様な創造性活動が可能に。
GPT4-OMは手書きフォントの作成、複雑な音声の再現など、多彩な機能を提供している。
GPT4-OMは画像から3Dプリントデータの生成、企業ロゴの生成など、多岐にわたる応用が示されている。
ビジネス領域の拡大、現実世界の認知、音声認識の活用がGPT4-OMの今後の展望として示されている。
Transcripts
カですたった1動画で全て分かるGPT4
OMのビジネス活用体制についてお話しし
ますでOpenAIが発表したGPT4
OMの機能がすごいと話題になっており
ますいきなりですがこんな疑問ありません
かということでGPT4オニの機能は
分かるけどどう活用したらいいのだったり
結局GPT4OMにって仕事に使えるのと
いう悩みがあげられますまこの1動画で
ですねGPT4OMの仕事活用方法全て
解説いたしますあ改めてですがチャンネル
概要をごご紹介いたしますチャットGPT
やCIについて業務効率化をしたい事業者
や会社員向けにエンジニアの知識がない方
でもスライドで分かりやすく解説する
チャンネルとなっております現在私はです
ね研修事業コンサルティング事業の2つの
授業を行っておりますはいでこの動画です
がどんな人向けの動画かについてお話し
すると1点目がChatGPTの新モデル
GPTフーム2の機能や使い方がいまい
分かっていない方2点目がGPTフーム2
は知っているが仕事の活用方法が分から
ない方こちらの2点になりますはい発信
カテゴリーですが私の発信はですね
ビジネスマンかつ実用的というところに
動画の視聴者層を合わせて撮影しており
ますこんな風に思っていませんかという
ことでGPT4オムニの機能は分かるけど
どう活用したらいいか分からないだったり
具体的なGPT4オムニの仕事活用方法が
いまい分からないという方がま
いらっしゃいますでそれらの疑問を解消
するためにですね私はま紹介内容としてで
この動画ではGPTformにの機能や
基本的な使い方をえまとめたものとあとは
GPTformにのビジネス活用方法の
まとめについてお話ししていきますでこの
1動画でですねGPTフームにの概要だっ
たり使い方仕事活用全て解説し既に行って
いる業務の生産性向上ができるようになり
ますはいで私ですね現在家族の動画をご
用意しておりますモラ的に学べるChat
GPTCIの動画をえ用意しているのでま
是非あの気になるタイトルがあれば違う
動画もご覧くださいはいで今後も生成の
動画を発信していきますのでチャンネル
登録をよろしくお願いいたしますで目次
ですが1章から5章まで流れ以下の通りに
なっております1章が概要2章がえGPT
フームにの魅力3章が限界と弱点え4章が
28の仕事活用アイデアで最後5章が3つ
の展望についてお話ししていきますまずは
1章からです1章概要です1章で解説する
ことは以下の3つがございます1つ目が
GPT4とは2つ目がGPT4オニの性能
3つ目が機能になりますでまずそもそもな
んですけどGPT4オニとはえOの部分
ですねえどういう意味かというと全てと
いう意味が含まれていてですねえ音声資格
テキストなどの処理を統合しているという
イメージで理解するといいんじゃないかな
という風に思います従来のモデルとのえ
GPT4オ2の比較をしてみると今までは
ですねそれぞれの入力を個別に処理してい
たえでそのためですね音声また画像入力
から応答までに時間を用していたに対して
GPT4オムニアですねえ全ての入力を
同時に処理することができるのでま高速
オトが可能になっておりますはいで性能
ですがえクラウ3オーパスと比較しても
圧倒的な性能が話題になっているという
ところで従来までのモデルGPT4ターボ
と比較しても性能が高いと言われていたり
しますGPT4にはテキスト水論
コーディングに関してえGPT4ターボの
レベルのえパフォーマンスを達成している
もしくは上回っているというのがあげられ
ますはいでGPT4OM2の性能比較の図
になるんですがえこちらですねOpen
AIのえ公式ページではえGPT4オムニ
がピンクなところになっていて他のですね
GPT4ターボだったりえCloud3
OPPASSだったりjemiPro
1.5の性能をえ上回ってるところが多い
のかなっていう風に思いますあとはですね
音声翻訳のパフォーマンスというところで
えOpenAIのgpd方ホムにはえ他の
性能他のモデルよりもえ抜きに出てえ性能
が高いえ左から2番目の緑のところですね
えGPT4オムニを表しておりますであと
はですねゼロショットえ結果ということで
こちらですね多言語と四角の性能評価を
表した図になっていてですねえ多言語のま
翻訳機能だったり多言語をどういう風にえ
読み取るかっていう能力が高かったりです
ねえあとはえ四角からこう多こ読み取っ
たりとかM3エムというものがですね多元
語とあとは資格の性能になっておりますで
ここでですねえ水色がGPT4になってい
て緑がGPT4オムニになるんですがま
ほとんどの性能でGPT4オムニがえ従来
のモデルよりも上回ってることが分かり
ますで先ほどのですねM3エムベンチ
マークは多言語と資格の両方の評価とえ
述べられておりますでですねえ他の国の
標準化されたテストからの選択問題で構成
されていてや図表が含まれる場合でもを
どういう風に読み取れるかとかえ他言語を
どういう風に出力するかっていう性能が
高いかなっていう風に思っておりますあと
はえGPT4OMには他のえモデルと比べ
てもえ大学レベルの知識だったり数学的な
水論力あとは図の理解と回答あとグラフの
読み取りだって画像の水論力あのテキスト
ではなくてですね他の画像とかグラフ図と
かこういうですねマルチモーダルな
読み取りという性能が格段に上がってい
るっていうのがえ現状GPT4ニの性能に
なりますであとはですねこちらのツイート
が話題になっているんですがGPT4オニ
ですねえ東大数学2024年の問題を画像
から解けるようになったりとかしており
ますでですねここで見ていただきたいのが
え2024年の問題ということでえ今まで
ですねえこGPT4オムニはですね
2023年までのデータを学習しているん
ですが2024年のデータで学習してい
ないですねってことはですねここのえ
先ほどございました数学的な水論力という
ところでここの水論能力が高いからえ最新
問題でも解けるっていう風になっており
ますで実際に数値で見てもGPT4ターボ
とかだったりあとjmi1.5Proだ
はかにえ10以上の数値を上回る結果が
GPT4オニでは出ているということが
分かっておりますえこの中でも特にえ着目
したい点としてはここの数学的な水論力に
なります続いてはですねGPT42の機能
になりますで機能ですが前提としては昨日
は従来のモデルにえ特別追加されたりとか
え特別特徴的になったわけではございませ
んえポイントとしては従来のモデルと比較
して特定の性能が上がっているっていう
ところ着目していただきたいですで
ポイントとしては以下の3つがございまし
て1点目が動画認識の性能向上2点目が
音声認識の性能が向上したえ3つ目が画像
認識の性能向上ですねえこれらによってね
テテキストっていうよりマルチモーダル
機能画像だったり音声どがの読み込み
だっったり出力の性能が向上していること
がポイントになりますでまとめたものが
書きになるんですが動画認識ではホーム
ページのところでは45分の講義動画の
要約も実現したりとか音声認識では感情を
理解できたと言われておりますただ音声
認識のところでは人間の感情を理解したと
いうわけではなくてあくまでデータからえ
推論していくえ音声がどういう風な感情に
なっているかっていうのを推測してえ論理
的に数値を出しているっていところになり
ますなので人間の感情を理解したとまでは
え言いきれないところがえ正直なところに
なりますであとは画像認識ですね特に文字
の読み取り機能がえ格段に上がっており
ますえ他言語のえ文字の読み取り機能が
GPT42では向上しています続いては2
章のGPT4オムニの魅力についてお話し
していきます第2章です5つの魅力が上げ
られます1つ目はWebやアプリから利用
可能というところ2つ目はマルチモーダル
機能の強化3つ目は行速度と回答速度がえ
格段に早いというところ4つ目が音声機能
が向上したという点5つ目がGPTホーム
2のAPIの話になりますで以下のえ5つ
が先ほど上げられていたんですが1つ目が
Webアプリから利用可能になっていてえ
スマホからでもパソコンからでもGPT4
ムにっていうのが使えるようになっており
ますで2つ目はですねマルチモデル機能に
より手書きでも認識可能ということで紙に
手書きでえ文字を書いただけでもえ雑な字
であっても読み取りに認識が可能になって
おりますで3つ目が思考速度と回答速度が
早いっていうところで実際に検証した動画
もあるので続いて見ていきます4つ目は
歌ったりロボットのような声あの音声の
バリエーションが格段に増えたりとか音声
の出力の精度が上がっているっていう
ところが4つ目になっておりますで5つ目
はAPIがえGPT4ターボよりもですね
え2倍高速で半額でさらに利用できると
いった点が上げられていますえWebや
アプリから利用可能になっているという
ことでま先日のアップデートでChat
GPTのデスクトップアプリが追加されて
実際に私試したんですが@GPT4OMが
追加されていたりとかえ以下の画面でえ
GPT4OMIとChatGPT4と
3.5がえそれぞれでえモデルが選択可能
になっていたりとかえそういう風な形で
Webアプリから利用可能になっており
ますはいこちらがアプリ版になるんですが
えGPT4OM2とえGPT4とえGPT
3.5えそれぞれのモデルが選択できる
ようになっておりますでさらに見て
いただきのがアプリからでもですね音声
入力だったりとかえファイルの入力え画像
のアップロードだったり写真をその場で
取ってアップロードするみたいな形で利用
可能になっておりますであとはですね
マルチモーダル機能によって手書きでも
認識可能というところがポイントになって
おります画像認識能力だったりえ理解力
っていうところがあればどんだけ雑な文字
とかでもですねえ綺麗に書き起こして
もらったりとかあのUIに反映させてコド
を書いてもらったりとかそういう実例も出
ております以下の通り文字に対してコドを
書いてもらってえ実際にえUIとして
成り立つようなプログラミングをえチャト
GPT4オニではできたりしますあとは
ですね回答速度が比較的早くてストレスが
格段に減るといった形でここをあくまで
目安にしていただきたいんですが従来の
モデルを1倍とした時にGPT4オムニの
回答速度はですね1.5倍とかま2倍以上
の出力が出ているなという風に感じており
ますで実際にですですねえ以下スピード
検修をさせていただきましたので実際に
回答スピード見ていきましょうはいこちら
の通りですねまずはチットGPT4の出力
をしておりますで適当な文章全く同じ文章
をGPT4とえGPT4オムニで全く同じ
文章を出力してとえ指示を出しているここ
ではですねえ回答速度だけえ検証している
といった形になりますで以下の通りですね
え大体の回答速の方を見ていただきたいな
ていう風に思いますはいこんな感じでです
ね配当速度でややえ遅かったりとかGPT
4では見られるんですがオムニの方を検証
していくとえ先ほどのGPT4よりもです
ねえやや早くえ出力されていることが
分かるかと思いますでこれ見ていくとです
ね大体1.5倍からま2倍以上の出力がえ
出力スピードがえ果たせているえ達成でき
ているなっていう風に感じております続い
てはですね4つ目の歌にロボットのような
声が出力可能にというところをご紹介
いたしますはいではこちらのニュースえ
実際にOpenAIが発表したデモ動画を
一緒に見ていきましょうこちらですね音声
がより自然になっております感情を込め
たりとかですねChatGPT4オムニは
ですねえ会話しながらだったりとか4
オムニに対してえこういう感情で話して
欲しいというとですねそれに基づいて話し
てくれたりとかそういうことが実現できて
おります続いては3章のえ限界と弱点に
ついてお話していきますえ先ほど魅力を
解説したので続いては限界と弱点について
ですはい3つのデメリットがGPT4
オムニではございます1つ目は
ハルシネーションがまだあるというところ
2つ目はテキストの水論能力3つ目が動画
の解析になりますでGPT4オムニはです
ね万能になったわけではないということに
注意しておいてくださいでまず
ハルシネーションの実例を見ていきたいん
ですがチットGPTなどの言語モデルがま
実際には存在しない情報やえ事実を生成し
てしまう現象のことをハルシネーションと
言っておりますポイントとしては情報を
チャットGPTに問い合わせた際にえ
ChatGPTが存在しない機能だという
説明することもあったりとかまそういった
問題が上げられますはいで私ですね実際に
Microsoftのえホームページから
こちらの2つのプランmicrosoft
365のえファミリーとパーソナルえ
それぞれのプランについて表を作成して
くださいという風にプロンプトで指示をし
ましたはい以下の通りですね以下のURL
からmicrosoft365ファミリー
とえパーソナルの比較表具体的に作成して
と指示をしておりますでそうすると
ハルシネーションなしの場合では正しく
金額だったりとかあとはユーザー数あと
同時サインイン可能なデバイス数とか表に
出してくれているのが分かるかと思います
で先ほどの単純なえ比較2つの比較とかで
あればこのようにハルシネーションなしで
正しく出力ができるんですが続いて
ハルシネーションRIの場合検証していき
ます先ほどの同じページから今度は
マイクロソフトの法人向けのプラン4つの
プランがあるんですがえこちら4つの
プランのそれぞれの較格表を作成してと
言いました多少難易度が上がっているか
なっていう風に思っておりますはいで一般
法人向けの表も作成してと指示をしました
えこちら出力結果になります先ほどの
URLを検索して読み込んではくれました
ただですねえ見ていただきたいのが右が
画像になるんですがビジネスプレミアムと
えフォビジネスプラン3298と1236
と書いてあるんですが表ではですねえ価格
が全然違っていたりとかこの辺も少しり
だったりとかややハルシネーションえ実際
にありもしないえ現実とは違う数値だっ
たり回答っていうのを出力しておりますえ
このようにですね表とかが読み込むえ
URLが少し難しかったりすると
ハルシネーションが起きやすくなっており
ます続いてはテキストの水論能力です
GPT4オムニはですね複雑な文脈だっ
たりニュアンスを正確に理解することが他
のえ一部のモデルよりも取りますでこれに
よって想定される事態としてはですね重要
な法的ニアスの見逃しだったり顧客からの
複雑な要求への対応不足などが上げられ
ますこちらドロップというところでえ文字
水論能力そちらはクラウド3オーパスの方
がやや上というところでえ1番右のところ
見ていただきたいんですがこの緑の
クラウド3オーパスのえところよりも
ピンクの方がやや性能が下がっていると
いうところになりますただですねあくまで
誤差になるのでそこまで気にしなくては
いいのかなっていう風に個人的には思って
おりますであとは動画解析のところで強弱
動画の解析がなかなか難しくて1度動画を
テキストにしてからそこからプロンプト
書かないと正確には出力されません
ポイントとしては動画ファイルを送る際は
分割だったりとかあのできるだけ短い尺に
した上でえその後で送るというところが
ポイントになりますで実際にですの
ミーティングの疑似録を記載してと50分
ぐらいのミーティングをチャトGPTに
入力したんですがま動画をテキストに変換
する作業を行いますのでえお待ちください
と言ってからなかなか出力されなかったり
とかえ出力にエラが出たりとかそういった
ことがあげられますで続いては4章の28
の仕事活用アイデアについてお話しして
いきますGPT4主に仕事活用アイデア
28戦ですまずはリアルタイム翻訳から
ですこちらがですね英語とイタリア語のえ
同時通訳リアルタイム翻訳ですこちら英語
ですねイタリア語に翻訳して欲しいと言っ
ていますこれはイタリア語ですねはいこの
ようにリアルタイム翻訳がえできており
ます続いては物語ストーリー作成でこちら
えチャトGPTOpenAIのホーム
ページからえ引用させていただいたんです
がえこちらの通りまずえ画像を作成する
ように入力してえ出力結果ができており
ますまずはタイプライターでタイプして
いるロボットのえ画像を生成したとで
さらにえ次から注目していただきたいのが
破ろうとするえ出力え入力をするとえ実際
に破っているえ先ほどの出力した画像から
タイプライターがが出たりとかこの
ストーリーを作成できる画像を1回出力し
てその画像を元に入力を追加していくと
ストーリーとか物語りが出来上がるって
いうのがここのGPT4オムニの特徴に
なります画像の読み込みとか文字の認識
文字の出力というのは格段に精度が上がっ
ているのでこのようにタイプライターとか
えこの文字で実際に画像にえ入れ
るっていうところもえ精度が上がっており
ますであとはまこちら実際に人物のえ
キャラクターデザインというものを作った
後にこの人物がえどういう風にこうして
いくのかていう入力をすると出力も同じ
ように出てきますえ郵便配達員のサリー
ですとえ添付ファイルをえ先ほど画像出力
されたと思うのでダウウンロードして一緒
に添付して入力しておりますでそうすると
ですね入力することでえストーリーが作れ
たりとかえ犬に追われてるシーンとかあ
サリーがつまづいたというだけつまづいた
仮想を提供してくれたりとかまた車に乗っ
てるシーンだったり1回キャラクター
デザインを作り際すればですねいろんな
ストーリーがえできる一貫したストーリー
も作成できます続いてはポスター制作に
なりますまこちらもオーAIからのホーム
ページを利用させていただいたんですが
まずは2人の画像顔画像を入力するとで
その後に映画のポスター2人の映画の
ポスターを作成して欲しいと指示をしまし
たはいこのように探偵のえ最後のポスター
を作って欲しいと2人の大きな顔が目立つ
ように書かれていますと指示をしており
ますで彼らの表情はえ真剣で決意がありと
か表情の指敵だったりとかですねあとは
文字の指定などもあります実際に出力され
たのは以下の通りになっていて少し怖い
画像になっているんですが文字を入れ込ん
だりとかですねえ画像に色をつけたり
ポスター制作というものが可能になって
おります実際にダウンロードとかもでき
たりしますであとはキャラクターデザイン
から一貫性を持った動きを生成するという
ことでま一旦このようにえロボットをえ
入力して画像を出力してもらってから
さらに追加でクリスビーを取ってる様子
だったり自転車に乗ってる様子あとは
プログラミングしてる様子だったりえ
キッチンで料理をしてる様子っていうもの
え一貫したキャラクターデザインから生成
することが可能ですであとはですね手書き
フォントの作成変換ということで以下の死
のようなものを手書きフォントで作成して
とでそれを画像で出力してと指示をして
おりますでそうするとえ次のように出力が
ま手書きっぽい手紙のようなものをえ出力
しているのが分かるかと思いますはいあと
は複雑な音声の再現ということでえこちら
金属でコインのカチャを鳴らすという入力
に対して出力を音声で出してくれたりとか
あとは複数画像合成とか2枚以上の添付
ファイルを持ちてそれをえ合成して
くださいとかえ複数の画像を元にえ1つの
画像を作成してくださいとかという形も例
としてあげられますであと自分で撮った
写真を顔絵にしたりとか絵にしたりという
ことも可能ですあとはテキストから
フォント変換添付ファイルから違う
フォントに変えてと言うと違うフォントに
え画像を読み込んでえ変えてくれたりとか
ですねあとは画像から3Dプリント用の
データを生成してくれるなどの例もあげ
られますOpenAIを含むロゴのリアル
な3Dレタリングをえ生成してと言うと
実際にこれ動画で出力されているんですが
これを回転して3D合成というものができ
ていますアカの画像とかもえ同じように3
D合成が出力されておりますあとはですね
ブランドの生成ということで2つのえ写真
からブランドとしてくっつけたりロゴを
入れたりとかあとは画像に複数文字の挿入
ということでえ以下の文字を画像に入れて
くださいと言うとあの文字の認識機能と
あと画像に反映する機能が格段に精度が
上がっているということでえ以下のような
細かい文字でもしっかり正確に入れてくれ
ますでホームページでは音声データから
和式別し文字起しするという例も上げられ
ていますこのオーディオにはスピーカーが
なんだやって何が起こったのでしょうかと
オーディオを入れるとチットGPTはそれ
を読み込んでくれてこういったことが行わ
れていますと出力していますであとは
こちらは私試したんですがなかなか難しく
てですねえホームページでは45分の講義
動画の要約ができておりますえ45分の
動画を挿入してプレゼンテーションの
ビデオですと詳細な概要を教えてください
とえ入力するとえ以下のようにま45分の
プレゼンテーションでもね一発でこのよう
に要約が出ているという形になっており
ますはいであとは会議にチャットGPTを
え参加させてえその場で文字を作成させて
音声でえ何かアイデアを出してと会議中に
言うとChatGPTが会議で参加して
くれたりとかえそういったこともあげられ
ておりますはいであとはですねツイートで
話題になってるところ紹介させていただき
たいんですが写真から領収書の仕分けとか
えそういう形もできますもこちらの左の
レシートに対して仕訳の詳細ということで
読み取って数値だったり文字というものを
正確に反映しておりますあと先ほど紹介さ
せていただいたんですがイラストで書かれ
たUIをコドに変換するということもでき
ますえイラストとか手書きでこういう風に
書いて欲しいというとですね行動を書いて
くれてえさらにそこからえUIとして実際
に使える画面を作れたりしますあとは画像
から岐阜画像作成できたりとか適当な風景
の画像まずチャッGPTえダリでえ画像
生成するとでその後にアニメーションを
加えたいですかという形でアニメーション
画像を作れたりとかもしますでこのように
指示としてはえ光の移動だって風景の変化
動物の動き全て加えながらアニメーション
の動画を作成してくださいと言いました
そうするとChatGPTの画面で
アニメーションの動画をダウンロードする
リンクが与えられてそこをクリックすると
アニメーションの動画というのが
ダウンロードできたりしますで実際に画像
が並んであると思うんですが光の加減が
変化するような画像えアニメーション動画
というものをチットGPTは生成してくれ
ていますであとはこちらのツイートでえ
ノーデータを解析するということが上げ
られておりますノーデータ解析を試してい
て速度と精度はえかなり向上していると
いう声があったりとか複雑なカオスマップ
を文字起こしするなども可能ですえ人間が
見ると少し字が細かくて読みにくいカオス
マップの画像でも文字起ししてくれており
ますえカテゴリ別にえどの企業があるの
かっていうのをえ出力してくれております
ヒートマップ分析なども画像の読み込み
から可能です以下のヒートマップを分析し
て最も反応が多い部分を特定して欲しいと
いうとえここのえヒートマップえここのの
分析結果上げられますといった形で
ChatGPTは提案してくれますあとは
ですね5分でスカゲームのようなものが
作成できたりとかえそういった形でも
Chatgpd4オリが使われていたりと
かしますでさらに本のページ先ほど文字の
認識が向上したとえ言ったんですが本の
ページとか手書きのえ本とかま写真で撮る
だけでその写真の文字がえどういう風に
書いてあるのかとか文字を出力してさらに
要約だったり書き起こしというものがえ
制度が上がっておりますであとはこちらの
企業ロゴからこう出力生成したりとかそう
いった事例もあげられます企業名を羅列し
てというとえ企業ロゴを見ただけで
いろんな企業をあげているかと思います
書き殴り文章の文字越しなども可能です
こちらの海外のツトではま手紙のような
ものを書くとそれを写真としてチット
GPTにアップロードして入力するとその
まま文字起こししてくれたりとか要約し
たりとかそういったことも可能ですと
こちらのツイートになるんですが
ウェブサイトの作成なども可能ですGPT
4オ2でウブサイトが誰でも作れるとこう
いった形で実際の画面を作成したり行動
生成してくれたりとか逆に修正したりとか
そういったことも可能ですあとですね
OpenAIのデモ動画ではGPT4
オムニ同士で会話するといったこともえ
あげられておりますでこれで何ができるか
と言うとGPT4オムニ同士でですね
アイデアを出し合ったりとか議論し合っ
たりまそういったことが可能だったりし
ますはい続いては5章の今後の3つの展望
です第5章です5章の内容ではえ以下の3
つのことについてお話ししますビジネス
領域の拡大現実世界の認知音声認識と活用
ですまずはビジネス領域の拡大です
OpenAIは今後アプリケーション領域
まで拡大していくとえ予想しておりますえ
今後のポイントとしてはですね今までは
チットGPTというオOpenAIはです
ね言語モデルの基盤というものを整えてい
てえその状態があったところからま
いろんなスタートアップとかベンチャー
企業というのがChatGPTを使った
アプリをどんど出していたんですが今後は
OpenAIがアプリ開発を行ったりとか
OpenAIがChatGPTの
デスクトップアプリ版をリリースしたと
いうニュースがあるのでまそういった形で
どんどんそのアプリケーション領域まで
入っていくという可能性もございますで
続いてはですね数秒単位で現実世界がえ
認知できるようになってくるといった予想
もございます@GPTは今後現実世界を
認識して即座に反応する能力をえ持つよう
になるのではないかとえ思っていてですね
ポイントとしてはリアルタイムデータの
処理だったり分析っていうのを可能にして
ビジネスとか日常生活において速効性の
高いサービスを提供できるようになります
えこちらの実際OpenAIの
YouTubeあの見ていただきたいん
ですがここの現実世界とのえ融合だったり
現実世界とのま掛け合わせをえ見て
いただきたいですこれはChatGPT4
オニを活用した動画になっております
こちら建物を撮影して説明を促しています
あとはですねタクシーが来たらえ合図して
くれ
ますこのようにですねえタクシーが来たら
合図するタイミングというものをとGPT
4オニが教えてくれたりそれを会話レベル
でえ回答速度と回答制度向上しているので
そちらのようなえ活用方法も実現できてい
たりとかします現実世界の融合建物の説明
をしたりとかタクシーが来たらえそれを
教えて欲しいとかそういった形でえ目の
役割をしてくれるとか目が見えない方でも
チャットGPTがその役割を担ってくれる
といった活用方法ができております続いて
音声認識と音声活用が進んでいく特にここ
の音声というところ着目していただきたい
んですが翻訳能力の向上始めですね音声に
意識だったり音声出力の制度が向上すると
予想しますポイントとしては会議の疑似力
作成だったりリアルタイムの通訳
プレゼンテーションの支援などより多くの
ビジネスシーの場面でまその能力を発揮
するのではないかと思っております実際に
チャットGPT4オムニがミーティングに
参加している様子を見ていき
ますこのようにですねとCPTがあの1人
の人間のような形でえ音声をどんどんこう
入力してえ文字起こししてくれたりとか
こう会話に入ってくれたりそういったこと
も可能になってきています最後にまとめ
です以下の内容を解説しました1章が概要
2章がえjatGPT4オムニの魅力3章
が限界と弱点4章が仕事活用のアイデア5
章が3つの展望ですはい私ですね現在初心
者向けのチャットGPTの講座というもの
を全12動画あげておりますのでこちら
アカウント作成の段階から基本的な
ビジネス活用ができる動画になっており
ますので是非ご覧くださいあはですね現在
数の動画をご用意しておりますえ仕事の
時短課業務効率化につながる動画がござい
ますので是非ご覧くださいで最後に大事な
お知らせがございます私ですね現在法人
向けの生成のえ投入支援の
コンサルティングと車内研修を行っており
ますご相談内容としてはssaiを自社で
導入する方法が分からないという方だって
具体的にどこで活用できるかが分からない
という方いらっしゃいますのでまこれらの
お悩みがございましたら是非ご相談
くださいで下期のような内容をご相談
できるといった形でえ意外と定正AI導入
までロードマップがかなり長かったりもし
ますどういう風に導入していくかえお
問い合わせくださいお申し込みは概要欄の
リンクから可能ですえ1番上に導入支援の
ご相談のフームをえ記載しておりますので
えこちらから必要事項の記入とお手数です
が行っていただけますと幸いです最後に
なりますがチャンネル登録高評価コメント
よろしくお願いいたしますでは次回の動画
でお会いしましょう
5.0 / 5 (0 votes)