ついにGPT-4を超えた!? 話題のClaude3を実践プロンプトで試した印象

リモートワーク研究所【リモ研】
5 Mar 202420:59

Summary

TLDRこのビデオスクリプトは、OpenAIのGPT-4に匹敵するとされる新しいAI言語モデル「Claude」の紹介と実演を行っています。Claude開発企業AnthropicのAIモデルの概要、ベンチマークでのGPT-4を上回る優れた性能、さらにコストパフォーマンスの優位性などが解説されています。実際にYouTubeチャンネルの企画アイデア出しや、アンケート分析などの課題において、GTP-4と並ぶ、あるいは一部で上回るようなパフォーマンスを示すClaudeの実力が生の実演を交えながら紹介されています。

Takeaways

  • 🤖 Claude AI (クロード3) は、OpenAI の GPT-4 に匹敵するか、それ以上のパフォーマンスを発揮し、ベンチマークでも GPT-4 を上回っていることが報告されている。
  • 💰 コスト面では、Claude の中級モデル「Sonnet」は GPT-4 Turbo の半額以下で、トークン数も多くなっている。
  • 🔍 実際の使用例から、Claude は要件の理解とアウトプット形式を守る点で GPT-4 と同等のパフォーマンスを見せた。
  • 📈 Claude は、特にアイデア出しや評価、分類などの作業において、GPT-4 に匹敵するクオリティを発揮した。
  • ⚖️ 一方で、より複雑な要件については、Claude の上位モデル「Opus」を使う必要があり、その場合 GPT-4 Turbo より高コストになる。
  • 🌐 Claude は AWS の Bedrock サービス上で提供されており、AWS ユーザーにとっては導入が容易である。
  • 🔀 OpenAI に依存するリスクを避けるため、有力な選択肢として Claude を持っておくことが推奨される。
  • 📢 4月9日に生成AIサミットが開催され、生成AIの最新ビジネス活用法などが紹介される予定。
  • 🎓 チャットGPTの活用研修やプロンプト作成支援なども行われている。
  • 📰 LINE公式アカウントやYouTubeチャンネルでも、生成AI関連の最新情報が発信されている。

Q & A

  • クロード3とは何ですか?

    -クロード3は、AntropicというAIベンチャー企業が開発したGPTのようなAIモデルの名前です。GPT-4に比べて優れたパフォーマンスを発揮するとベンチマークで高い評価を得ています。

  • クロード3の長所は何ですか?

    -クロード3の長所は、GPT-4に匹敵するパフォーマンスを発揮しながら、コストが半額以下と安価である点です。また、トークン数も多く、複雑な要件にも対応できることが期待されています。

  • クロード3をGPT-4と比較した場合の印象はどうでしたか?

    -実際に試してみた結果、クロード3はGPT-4と同等レベルのパフォーマンスを発揮していました。要件の反映やアウトプットのフォーマットを守る点でも優れており、GPT-4に十分代替できるモデルだと感じました。

  • クロード3の課題や懸念点はありますか?

    -最上位モデル(OPS)の場合、コストがGPT-4ターボよりも高くなるため、利用が限定的になる可能性があります。ただし、ミドルレンジのソネットモデルであれば、GPT-4ターボの半額以下でGPT-4に匹敵する性能が得られます。

  • クロード3を実際の業務で活用する場合、どのようなメリットがありますか?

    -AWSのベッドロックサービス上で提供されているため、AWSを使っている企業であればスムーズに導入できます。また、OpenAIに依存するリスクを分散できるというメリットもあります。

  • クロード3の今後の展望はどうですか?

    -クロード3は今回の評価を受けて、今後利用者が増えていくことが予想されます。GPT-4と併せて選択肢の一つとして活用されていく可能性が高いでしょう。

  • 4月9日のイベントについて教えてください。

    -4月9日には、生成AIサミットというオンラインイベントが開催される予定です。生成AIの最新動向やビジネスでの活用方法などが紹介される無料のイベントで、アーカイブの共有も予定されています。

  • チャットGPTの活用研修について詳しく教えてください。

    -チャットGPTの活用研修では、単なる使い方の研修だけでなく、実際にプロンプトを作成して提供するケースが増えています。これにより、より実践的な支援が可能になっています。

  • LINE公式アカウントではどのようなサービスを提供していますか?

    -LINE公式アカウントでは、ニュースのPDFやイベント情報の配信を行っています。チャットGPT活用に関する最新情報なども提供されています。

  • YouTubeチャンネルではどのようなコンテンツを提供していますか?

    -YouTubeチャンネルでは、チャットGPTの活用に関する動画をはじめ、リモートワークに役立つツールの使い方やノウハウを発信しています。再生リストも用意されているので、関心のあるトピックを集中して視聴できます。

Outlines

00:00

🔑 クロード3 (Claude 3) とは? OpenAIの新しいライバルAIの紹介

この段落ではAnthropicという企業によって開発された新しい言語モデルAI「クロード3」の概要が説明されています。クロード3はベンチマークテストでGPT-4を大きく上回る性能を発揮したことが報告され、大きな注目を集めていることが述べられています。クロード3の提供会社AnthropicはOpenAIに次ぐAI企業として注目されており、AWSのサービスでも提供されていることが紹介されています。

05:01

🚀 クロード3の性能とコストのGPT-4との比較

この段落ではクロード3の性能とコストについて、GPT-4との比較が行われています。ベンチマークでGPT-4を上回るクロード3の様々なモデルバリエーションと価格が示され、中位のモデル「ソネット」はGPT-4ターボよりもはるかに安価であることが説明されています。トークン数の違いやコスト面での優位性が述べられ、GPT-4に代わる選択肢としての可能性が示唆されています。

10:08

⚡️ クロード3とGPT-4の実践的な比較とデモ

この部分では実際に様々な課題をクロード3とGPT-4に与え、その出力を比較しながらデモが行われています。YouTube企画のアイデア出し、ビジネスアイディア案の作成、アンケートデータの分類と分析など、複数の課題でクロード3の出力が確認されます。クロード3は要件を十分に理解し、フォーマットを守った出力を行うことが示され、中位モデルのソネットでもGPT-4に匹敵する品質があることがわかります。

15:09

💰 クロード3の実用性と今後の展望

この段落ではクロード3の実用性と今後の展望について述べられています。クロード3はGPT-4と同等の品質を持ちながら、中位モデルのソネットではGPT-4ターボよりも安価であることから、実務での採用が期待されます。また、AWSとの連携により導入が容易になるメリットも指摘されています。OpenAIに依存するリスクを避けるためにも、クロード3は有力な代替手段として注目されることが予想されます。

20:10

📢 最後に関連イベントと情報の告知

最後の部分では、講師自身が主催する「生成AIサミット」などのイベント情報やAI活用に関する研修サービス、YouTube動画チャンネルやLINE公式アカウントなどの情報発信チャンネルが紹介されています。また、クロード3の実務での活用を開始したことが報告され、今後の新しい情報発信に対する期待が示されています。

Mindmap

Keywords

💡GPT-4

GPT-4はOpenAIが開発した最新の大規模言語モデルで、この動画では主にGPT-4の性能を他のAIモデルと比較しています。例えば「GPT4に比べて非常にクオリティが高い」などの記述から、この動画ではGPT-4を一つの基準として扱っていることが分かります。

💡クロード3

クロード3はAnthropicという企業が開発した大規模言語モデルで、動画の主な焦点となっています。クロード3は「GPT4に比べて非常にクオリティが高い」と評価されており、動画ではGPT-4とクロード3を実際に使って比較しています。「クロード3はGPT4水準」といった記述から、クロード3がGPT-4に匹敵する性能を持つと考えられていることが分かります。

💡ジェミナイ

ジェミナイは別の大規模言語モデルで、動画ではクロード3の性能をジェミナイと比較する際の参考として言及されています。「ジェミナイもそうだったんですけど、実際使ってみるとどうかなみたいな結構複雑な要件を出してみるとgpd4ターボはうまく機能するけど実際にはちょっと厳しいよね」といった記述から、ジェミナイはGPT-4やクロード3ほど要件を満たせないことが示唆されています。

💡ベンチマーク

ベンチマークとは、様々な側面から言語モデルの性能を評価する指標のことです。動画では「このようなベンチマークにおいてジミ内も当然勝ってますし、GPT4にまさっている」など、クロード3がベンチマークでGPT-4を上回ったことが強調されています。つまり、ベンチマークはAIモデルの性能を比較する上で重要な役割を果たしていることが分かります。

💡プロンプト

プロンプトとは、言語モデルに与える入力の指示や質問のことです。動画では「特にこう最近ネット基なかも上がってるんですけどやっぱりこのGPT4の進化っていうのは要件であったり指示がかなりちゃんとした時にそこを満たすかどうか重要」など、適切なプロンプトを与えることがGPT-4の性能を発揮する上で重要であることが示唆されています。実際に動画ではGPT-4とクロード3に同じプロンプトを与えて比較しています。

💡トークン

トークンとは、言語モデルの入出力を構成する最小単位のことです。動画では「100万トークン0.25なのがソネットだとインプットえ3ドル」など、トークン数とコストの関係が言及されており、クロード3のトークン数が多くコストが安いことが利点として挙げられています。つまり、トークン数は言語モデルの性能とコストを決める重要な要素であることが分かります。

💡アイデア出し

アイデア出しとは、新しいアイデアやコンセプトを生み出すプロセスのことです。動画では「アイデア出しでえYouTubeの企画を考えていきましょう」など、GPT-4やクロード3にアイデア出しのタスクを与え、その出力を比較しています。アイデア出しは創造性が求められる作業なので、言語モデルの性能を評価する良い題材となっていることが分かります。

💡要件

要件とは、ある課題を解決するために満たすべき条件や制約のことです。動画では「GPT4の進化っていうのは要件であったり指示がかなりちゃんとした時にそこを満たすかどうか重要」など、要件をうまく満たせるかどうかが言語モデルの実用性を決める重要な要素として強調されています。実際の例として「アウトプットフォーマットに考えてね」といった具体的な要件が示されています。

💡アウトプットフォーマット

アウトプットフォーマットとは、言語モデルに出力を求める際の形式や体裁を指します。動画では「アウトプットフォーマに考えてね」など、GPT-4やクロード3にアウトプットフォーマットを課した上で、それを適切に守れているかどうかを評価する様子が見られます。要件を満たすことと並んで、アウトプットフォーマットを守ることも言語モデルの実用性を左右する重要な要素であることが示唆されています。

Highlights

最近発表されたClaude 3が、ベンチマークでGPT-4を大幅に上回り、非常に優れているということでニュースになっている。

Claude 3を開発したAnthropicは、時価総額150億ドルから180億ドルの注目されているAIベンチャー企業。

Claude 3のベンチマークでは、Gpt-4に比べて高いクオリティを示していた。

Claude 3には3つのモデルがあり、Sophoraが中程度で費用対効果が良い。

GPT-4ターボと比較すると、Claude 3のSophoraはトークン数が多く、インプットコストが1/3、アウトプットコストが半額と安価。

YouTube企画アイデアの出しでは、Claude 3の方がGPT-4よりも魅力的なタイトルを提案していた。

ビジネスアイデア出しでは、Claude 3とGPT-4はどちらも妥当な案を出せていた。

アンケートデータの分析では、Claude 3はGPT-4レベルで要件を満たす回答ができていた。

Sophoraのミドルレンジモデルでも、GPT-4ターボレベルでクオリティが高く、コストも安価だった。

総合的にみると、Claude 3はGPT-4レベルの性能があり、選択肢の1つとしてありうると評価している。

4月9日に「生成AIサミット」を開催し、自社データ活用など最新の生成AI情報を無料で提供する予定。

研修と同時にプロンプト作成支援サービスを提供し、より実践的な活用を支援している。

LINE公式アカウントでニュース配信、YouTubeでチャットGPT活用動画を発信している。

OpenAIだけに依存するリスクを避けるため、複数の選択肢を持つことが重要と考えている。

今後もClaude 3の新しい情報やユースケースを発信していく予定。

Transcripts

play00:00

リモト研究所えどです今回はオーAIだけ

play00:03

じゃないGPT4をとうと超えたクド3の

play00:06

パワーということでクードというですね

play00:09

GPTのようなAIがありましてこの3が

play00:13

昨ぐらいに発表されたんですねでこれが

play00:16

ベンチマークで大幅にGPT4上回って

play00:19

おり非常に優れているということで

play00:21

ニュースになっていまして実はこれ

play00:23

ジェミナイの時にも同じような話があって

play00:25

ちょっと前場だったんですねまなんか

play00:27

ベンチマークでは超えてるけど実際体感と

play00:30

して使ってる限りではそこまで言ってない

play00:32

んじゃないのと実際ジェミナも今んところ

play00:35

はですねあの特にプロに関して言うと

play00:38

やっぱり対応の速さであったりとか回答で

play00:41

いいところもあるんですけどGPT4に

play00:43

比べて要件の理解とかアウトプットの規定

play00:46

とかこういうのガンガンむしってくるので

play00:48

なかなか実部では使えないなってところが

play00:51

実際の印象だったんじゃないかなと思うん

play00:52

ですね僕もそうでしたCL3は使ってみ

play00:56

たら普通に結構良かったです実際も結論と

play00:58

してはク3はGPT4に十分代替しるし

play01:03

いくつかモデルがあるんですけどGPT4

play01:05

の半額以下でできるケースもあるという

play01:08

こともあって実際これ使うケースは増えて

play01:10

くるんじゃないかなと思ったのでちょっと

play01:12

特集で取り上げさせてもらって実際比較を

play01:14

しながらどれぐらいの回答制度が上がって

play01:16

くるのかみたいなことを考えていきたいと

play01:18

思いますえこのチャンネルではAI

play01:20

リモート主体に必要なツールノハ最新情報

play01:22

をビジネスの支でお届けてるので

play01:24

チャンネル登録をよろしくお願いします

play01:26

また今年の4月9日生成AIサミットを

play01:29

実行します非常にいい生成ア

play01:31

インフルエンサーの方とか企業の方に来て

play01:33

いただいて最新のビジネスにおける生成ア

play01:36

の活用方法であったりノウハウティップス

play01:38

ご紹介したいと思うので無料ですので是非

play01:40

登録をよろしくお願いしますさてCL3の

play01:43

まず概要をお伝えした上で実際にGPT4

play01:46

後せっかくなんでジェミナイアドバンスも

play01:48

比べていきながら同じプロンプトを与えた

play01:50

場合にどうなるのか見ていきたいと思い

play01:52

ます特にこう最近ネット基なかも上がっ

play01:54

てるんですけどやっぱりこのGPT4の

play01:56

進化っていうのは要件であったり指示が

play01:59

かなりちゃんとした時にそこを満たすか

play02:01

どうか重要なんでそれなりにしっかりした

play02:03

プロンプトでどのぐらいの精度になるのか

play02:05

というところをジェミナも加えて見ていき

play02:08

たいと思いますまずはですねclod3の

play02:10

概要どういうサービスかクウドっていうの

play02:12

はまGPTと同じようなAIのモデルの

play02:15

名前ですでこれ出しているのはアスロピッ

play02:17

クって会社でして今時価総額がですねえ

play02:20

150億ドルから180ドルま日本円で

play02:23

2兆円ぐらいですかねぐらいでオプAIに

play02:26

継ぐ今こういったLMを開発して会社とし

play02:28

て注目されてるんですねオAIアスロック

play02:31

あとコヒアというのがまAIベンチャーの

play02:35

3挙頭みたいな感じになっていて2位の

play02:37

会社ですでAmazonなんかもがっつり

play02:39

提携していてAmazonベッロックと

play02:41

いう生成使うプラットフォームがあるん

play02:43

ですけどこのベッドロック上ではこういう

play02:45

クロードが提供されていて要はAWSで

play02:48

繋いでAPIを使うことによってま安心な

play02:51

環境で安定的に利用できるよみたいな風に

play02:54

提供されておりま非常に注目されている

play02:56

AIベンチャー企業でございますでこのク

play02:59

3というのがが昨日ぐらいに出まして最近

play03:01

出たんですけれどもこれジミナの時にも

play03:04

よく見るベンチマークシートかなと思うん

play03:06

ですけどこの出たクロード3というのが

play03:08

GPT4に比べて非常にクオリティが高い

play03:11

とま左側にジェミナイの結果も書いてある

play03:13

んですけれどもこのような様々なベンチ

play03:14

マークにおいてジミ内も当然勝ってますし

play03:17

GPT4にまさっているとでこれ3

play03:20

パターンあるんですけどOPS多分

play03:22

ソネットハクというものがあってソネット

play03:24

であっても結構GPT4買ってるケースが

play03:27

ちょいちょいあるんですねそう言うと

play03:29

こんな感じで結構まさってるところがある

play03:31

とで今回の比較動画でもご紹介するんです

play03:34

けどこのソネットが個人的には結構いいと

play03:36

思っていて費用も安いしクオリティも

play03:39

かなり高いので実際に現場で利用してるな

play03:41

と思っていてもう実際案件でですね昨日

play03:44

なんかもクロー3にしますかみたいな感じ

play03:46

で議論しているぐらい本当に実務で使える

play03:49

なという風に思ってるのでご紹介したいん

play03:51

ですけれどもこういうのが出ていますさて

play03:53

サプラありましてハクソネットオプスとま

play03:56

ジェミナもですねジェミナのnanoが

play03:58

あってプロがあってアドバンスという感じ

play04:00

でレベルが変わってるわけなんですけれど

play04:02

もまこれによって当然できることは変わっ

play04:04

てくるとレベル感違うって話ですねで結構

play04:07

コストが違いましてハイクっていうものは

play04:09

これMトークンって100万トークンに

play04:11

なるんですけれども100万トークン

play04:13

0.25なのがソネットだとインプットえ

play04:16

3ドルこれがオプスになると15という

play04:19

感じにな15$になりまして金額になると

play04:21

でGPT4と比べると分かりやすいので

play04:24

GPT4ターボと比べてどう違うのかと

play04:26

いう話になるんですけどもまずコスト面で

play04:28

言うとクロド3ですねま特にあのこの

play04:30

ソネットとオスに関して言うとgpd4

play04:33

ターボは100万トークン1ミリン

play04:36

トークンで言うとインプットが10ドルで

play04:38

アウトプットが30$なんですね加えて

play04:41

対してクロド3はえソネットというミドル

play04:44

モデルだと3$これがオプスだと15$

play04:47

ですねアウトプットだとえソネットだっ

play04:50

たら15$でオプスだったら75$という

play04:53

ことで実はこの最上位モデルはえGPT4

play04:56

ターボよりも高いんですけれどもこの

play04:58

真ん中のミノルモデルはGPT4ターボに

play05:01

比べてま半額いかぐらいとインプットは

play05:03

1/3ぐらいアウトプットは半額なんで

play05:05

結構安いとで対応するトークン量はGPT

play05:09

4ターボが128Kまつまり12万13万

play05:12

トークンぐらいに関してこちは20万

play05:14

トークンなんでトク量も多いよという

play05:17

ところが主なパフォーマンスとの違いです

play05:19

さてまベンチマークを比べてもGPT4

play05:21

ターボ水準もしくはそれを超えていてかつ

play05:24

コスト感に関しても特に緑側に関しては

play05:26

安く対応トークも多いよという話なんです

play05:29

けどジェミないもそうだったんですけど

play05:31

実際使ってみるとどうかなみたいな結構

play05:33

複雑な要件を出してみるとgpd4ターボ

play05:36

はうまく機能するけど実際にはちょっと

play05:38

厳しいよねてことがジェミナではあったん

play05:41

ですけどじゃCL3はどうかというところ

play05:43

で比較していきたいと思いますえまちに

play05:45

クロの登録はですねサイトに行ってもらっ

play05:47

て普通にメアドで登録できてま無料版だと

play05:49

えっとソレントていうミルモデルが使え

play05:52

ますし有料版月2度払うとオスという最上

play05:55

モデルが使えるのでまずはこの登録をやっ

play05:57

てみてくださいえそれではここから実際に

play05:59

ロ3とGPT4を実際画面を見ながら同じ

play06:02

プロンプトで比較してみたいと思いますで

play06:04

GPT4あの試す時にはGPT4のメリッ

play06:07

トってちゃんとした要件とかアウトプット

play06:10

フォーマットがちゃんと指示されて守って

play06:12

くれるのかこれがすごい重要なんですね

play06:14

あのジミ内なんかも反応の内容は結構

play06:17

良かったりいい回答返ってくるんですけど

play06:19

やっぱ要件をちゃんと理解したりとか

play06:21

アウトプットフォーマットを揃え

play06:22

るっていうところに結構弱みがあって

play06:24

なかなか実践では使えないという印象が

play06:26

あるんですけれどもこれがCL3だとどう

play06:29

なっのかととかも注目しながらちょっと

play06:31

複雑というか要件が多いプロンプトで試し

play06:34

ていきたいと思いますさて最初に試すのは

play06:36

アイデア出しでえYouTubeの企画を

play06:38

考えていきましょうとただこれもですね

play06:40

単なるアイデアではなくて前提と要件を

play06:42

踏まえた上でアウトプットフォーマットに

play06:44

考えてねというプロンプトにしていきたい

play06:46

と思います前提としてはYouTube

play06:48

チャンネルがどういうもので視聴者がどう

play06:50

いう人か要件としてどういうタイトルにし

play06:53

たいのかま提供価値を出してねとか20重

play06:55

文制度の文章にしてねチャットGPT生成

play06:58

って文字を入れてねみたいな感じで指示を

play07:00

した上で良いタイトルで過去に良かった

play07:02

タイトル例を入れておりまた良くない

play07:05

タイトルとして特定の企業が入っちゃうと

play07:07

ちょっと比較使いにくいのでそういうの

play07:09

やめてねていうのを入れた上で

play07:10

アウトプットフォーマットとしてタイトル

play07:13

対象タイトル対象として欲しいという感じ

play07:16

の指示を求めていますこれを使って左が

play07:19

GPT4右がclod3で行きたいと思い

play07:21

ますGPT4に行って入れますCL3に

play07:24

入れていき

play07:28

ます

play07:34

た両方ともこんな感じでいい感じで

play07:36

アウトプットを出してげてますねスピード

play07:39

感としてはちょっとこ送るタイミングに

play07:41

よるんですけどGPT4ターボクロード3

play07:43

ま同じぐらいかクロード3の方が早い

play07:46

ケースが多い印象はあるんですがま今回と

play07:48

GPT4ターボの方が出方一瞬早いかなっ

play07:51

て感じですか

play07:53

[音楽]

play07:55

ねさてGPT4ターボ終わりまして続いて

play07:59

でこちら右がCL3で頑張ってくれてるん

play08:02

ですけれどもまず両方ともちゃんと要件は

play08:04

把握しててる感じがしてま出力の

play08:06

フォーマットも鍵かこをつけて対象という

play08:09

感じでいい感じになっておりこれ

play08:11

ジェミナイでやると結構ジェミナイ

play08:12

アドバンスでも同じような感じだけど

play08:15

ちょっとフォーマットが違うみたいなこと

play08:16

がよくあるんですねまこういったところに

play08:18

おいてこのチットGPT4クラスで

play08:21

clod3はちゃんとやってくれてると

play08:23

いう印象がありますで出てきたこの文章と

play08:26

か内容を見てみるとこれは好みがあるかな

play08:28

と思うんですけど左が右側どうですか皆

play08:30

さん個人的にはクロード3の方が魅力的な

play08:34

ものが多いかなって印象があってチャット

play08:36

GPT車内DX8割の時間を削減で5つの

play08:39

活用法みたいなものすごいいいかなと思い

play08:41

え制裁売上げ2倍マーケティング活用7つ

play08:44

のコツに対して左側の方がちょっとAI

play08:47

っぽいっていうか少し弱めなタイトルが

play08:49

多い印象があるかなと思っていてま

play08:50

それぞれ要件満たしてくれているので悪く

play08:53

はないんですけれども個人的にはこの

play08:55

クロー3の方がパッと見て魅力的な

play08:58

タイトルが多いななと思ったんですねま

play09:00

これは人によって好きであるかなと思うん

play09:02

ですけどこの辺を色々試した結果クロド3

play09:05

いいなという風に思ってるのでまずこんな

play09:07

感じでそこそこ要件が多いアイデア出しの

play09:09

場合にはこんな感じになっていますえ続け

play09:12

てまたアイデア出しで今度はビジネス

play09:14

アイデアを考えてもらいましょう以下の

play09:15

前提を踏まえて制裁使った新サービス案を

play09:18

アウトプットフォーマに考えてくださいと

play09:20

また考えたら5個の選択肢を出してねと

play09:22

あと5個考えるもっとクリエイティブなを

play09:24

考えるもっと堅実なを考えるという感じで

play09:27

前提として自社の状況を書いていてま

play09:30

新しく生成支援領域で格を開拓すれたのは

play09:33

申請考えたいですと要件としてできるだけ

play09:36

開発は行わない小人数でも提供できる

play09:38

YouTubeでの走るか生きるものに

play09:40

するえこういった要望を踏まえた上でまた

play09:43

GPT4とクロトにお願いしていましょう

play09:45

新しいウンド立ち上げましてGPT4CL

play09:49

3とおい

play09:54

とGPT4もだいぶ早くなりましたね前に

play09:57

比べると

play10:08

うんせ活用セミナーなるほど

play10:12

play10:17

うんガイドラインね車内業務効率化

play10:27

うんうん

play10:31

なるほど

play10:32

ね選択肢のところはうまくいくケースも

play10:35

あるんですけど今回あんまいかないですね

play10:37

GPT4は行っていてクロード3の方は

play10:40

どうかな行けるか

play10:42

な今度はもっとクリエイティブな案を考え

play10:45

てねと出してますか行けますね新しい

play10:47

サービスに繋がる

play10:50

とうんGPT4の場合の左側クドの右側

play10:55

ですねま両結構いい線行ってますよねいい

play10:58

内容っていうか普通にできそうであり得る

play11:00

かなという感じがありましてまこれなんか

play11:03

は別に好き嫌いというか絶対どっちが優れ

play11:06

てるという感じじゃはなくアイデア出しな

play11:07

んで別にま両方使ってもいいと思いますし

play11:10

下選択してもいいかなと思うんですけれど

play11:12

もあのGPT4バに結構ピンとくるものが

play11:16

多いなっていうま場合にだったらGPT4

play11:19

よりもいいものが出そうなんでやっぱり

play11:21

こういったアイデア出しにおいてはさっき

play11:23

の例そうでしたけれどもクオリティが高い

play11:25

なという印象がありますえ続けて分類系

play11:28

ですですねマーケ担当として公演の

play11:31

アンケート回答データを要件に基づいて

play11:33

分析して役立つ内容をアウトプット

play11:36

フォーマットのようにピックアップしてね

play11:37

と要件としては目的としてこれは今後の

play11:40

公演より良くしたいですよとで

play11:42

ピックアップしなくてもいいアンケートは

play11:44

もうこの辺基地の情報に入ってのいらない

play11:46

よと改善とかに繋がらなかったり繋がる

play11:49

けれども既に知ってるものはいらないです

play11:50

よと例えば実際の業務にどう活用できるか

play11:53

とか自社業務にどう勝るわかんなかった

play11:55

こういうコメントはま一般向けの講演やっ

play11:58

てるんで参加参加者が分かんないで

play11:59

当たり前とまそれは参加者向けの個別の

play12:01

講演したらいいのでこういうコメントは

play12:03

抜かなくてもいいですよてことで

play12:05

アウトプットフォーマットアンケートの

play12:07

コメント全文に対しこれがどう役出しそう

play12:09

かて考察しねとで具体的なデータとして

play12:12

これ本当にこの前やったやつをバゴと持っ

play12:14

てきたんですけどあのExcelを

play12:15

貼り付けましてまから業があるのは空ない

play12:17

やつもあったからなんで自由回とバンと

play12:19

貼って1行に1個まExcelなんでこう

play12:22

鍵ダブルコーテーションでこう複数業の

play12:24

やつが入ったりもしますけれどもこんな

play12:26

感じでデータを入れた上でこれをどんな風

play12:28

に分類してくれるのかというのやってみ

play12:30

たいと思いますGPT4とジェミナイあ

play12:32

ごめんさえクド3

play12:40

とGPT4だとこういうちょっとしたこう

play12:43

説明みたいなやつが最初に入るケースが

play12:45

多いんですがCL3の方がアウトプット

play12:47

フォーマットに沿ってそれだけ出すみたい

play12:49

な感じがえあるケースはある印象があり

play12:52

ますか

play12:57

play13:11

うんだピックアップねほとんど一緒ですよ

play13:14

ねこんな感じで大体同じものを

play13:15

ピックアップしてくれていていらなそうな

play13:17

ものは覗いてくれて必要なものはやって

play13:19

くれた上で解説として何が今後参考になる

play13:22

のかっていうコメントもつけてくれてやっ

play13:24

てくれとでコメントの内容も結構似てるか

play13:27

なと思うんですけれどもこういうのも

play13:28

GPT3.5とかだと全然ダメなんです

play13:30

けどGPT4ならではの仕事かなと思うん

play13:33

ですがCL3でも同様のレベルでこれやっ

play13:36

てくれるなという印象があり非常にいいな

play13:38

という風に思っており

play13:40

ますさてさっきまではえオスとですね高い

play13:44

バージョンでやったんですけど実際業務で

play13:46

はオプスは高いんで多分使えないと

play13:48

ソネットトってミドルモデルだとGPT4

play13:50

ターボの半額以下なんでこっちがいいかな

play13:52

と思っていてこっちでやるとどうなるのか

play13:55

ま最初のYouTubeの企画出しですね

play13:57

これをオプスじゃなくてソネットという

play13:59

ですねえリーズナブルなバージョンでやっ

play14:01

てみるとどうなるの

play14:04

かこっちは早いんですね実際あのちょっと

play14:08

ミドルレンジの方が安い高いっていうのは

play14:10

まどのモデルでもGPT3でもそうです

play14:12

けどもスピードがありますしこれ見て

play14:14

もらって分かるように結構いいタイトルが

play14:16

まGPT4レベルだなと思うものがピンと

play14:19

来てくれてちゃんと要件も満たしてくれて

play14:21

いい内容があるなという印象があってこれ

play14:24

非常にいいなと思いましたさて同様にです

play14:26

play14:27

えビジネスコンサル的なやつでアイデアを

play14:31

考えてもらうこれもソネットでやってみ

play14:35

[音楽]

play14:37

ましょうまニーズ提供価値必要最小限の

play14:40

機能という感じであげてくれていてまそ

play14:43

行動にねなってなくてもいいんですけど

play14:45

コンテンツ制作支援まいいすよね普通に

play14:47

あるかもしんないアイデア発送支援あるか

play14:49

もしんない

play14:50

うん

play14:52

うんうんフォーマットもあってるし内容も

play14:56

妥当そうで結構普通に参考になるなGPT

play14:59

4倍で来るなって感じがしますよね餌に

play15:01

戻ってみましてさっきの分類ですねこの

play15:06

分類までいくとねちょっとさすがにGPT

play15:08

4ターボに比べると若干厳しいかなって

play15:10

印象があり

play15:13

ますこの自社業務のねイメージっていうの

play15:16

は正直いらないという話があったんです

play15:18

けどこの上ピックアップしちゃってると

play15:19

あと完全に要件満たしてるかって言うと

play15:21

ちょっと抜けるところはあるなって印象が

play15:23

ありますかねさっきのオプスの方がこの

play15:26

要件に沿って元々知ってるは抜いてくれて

play15:29

ちゃんとやってくれてる印象があるんです

play15:31

がまとはいえちゃんと持ってきてくれて

play15:33

コメントも妥当なのですごく悪くはないな

play15:35

というな印象でしてまそれットでもですね

play15:38

特にアイデア出しとかあとは一定の評価と

play15:40

かですねそういったものに関しては実際

play15:42

やってみたんですけども十分デオにたの

play15:44

レベルかなと思っていますちょっと今回お

play15:46

見せできなかったデムで作っていてもう

play15:48

ちょっとちゃんと分類するとか採点すると

play15:50

かそういうものもやってみたんですけど

play15:52

GPT4レベルでできるケースが多いなと

play15:55

いう印象がありまして画面見てもらっても

play15:57

分かるように結構クオリティが高いという

play15:59

ところがclod3でございましたさてま

play16:02

比較した印象なんですけれどもclow3

play16:04

GPT4レベルだなという風に感じました

play16:06

えジビ内に関してはいろんなベンチマーク

play16:09

とかではいいのかもしれないけれども実際

play16:11

実部で使おうと思った場合には要件の反映

play16:14

度だったりアウトプットのフォーマットの

play16:16

守り方が弱かったりしてちょっと厳しいな

play16:19

とま少なくともアドバンスのAPI使え

play16:21

ない現状においては思っていたんです

play16:22

けれどもCL3であればソネットという

play16:25

ミドルレンジでも十分GPT4水準で

play16:27

使えるがありそうでしかもトークン数も

play16:30

多いし安いと使えそうだなとでオプスを

play16:33

使うとより高精度な処理もできるので

play16:35

GPT4が何らかでこけたりとか使えない

play16:37

場合には大体候補として持っておくといい

play16:40

んじゃないかなと思いやっぱり多くの企業

play16:42

がOpenAIに依存していいのかなと

play16:44

いう風に思ってると思うのでそういう時の

play16:46

有力な候補としていけるレベルのA出てき

play16:49

てよかったなという風に思っていますまだ

play16:51

OPSの場合にはGPT4ターボよりも今

play16:53

んところ高いとGPT4ターボの方が安い

play16:56

んでま活用は限定されるかなと思うんです

play16:58

けどけもそういう大体手段があるという

play17:00

ことは生活用した何かの事業を展開する上

play17:03

でも有用かなと思いますしまたCL3は

play17:06

AWS書でですねベッドロックという

play17:08

サービス書で提供されているのでそっちを

play17:10

使うことによってAWSでサービスを作っ

play17:13

てる人がAWS上でさらに生成合サービス

play17:16

を作るという風にアドもしやすいとGPT

play17:19

4だとどうしてもアジール使わなくちゃ

play17:21

いけなくてちょっとこれまで使ってなくて

play17:22

ハードルが高いというケースもあるかなと

play17:24

思うんですがそういう意味でも使いやすさ

play17:26

としてもクド3というのは今後あり得るか

play17:29

なと思っていて非常にいいなと思ったので

play17:31

まこれからもいろんな情報がどんどん出て

play17:33

くると思うので注目できればなと思うん

play17:35

ですけどこれは普通に今後ですねまこれは

play17:37

ね正直GPT4一択でいろんなのがある

play17:40

けど見てるだけみたいな感じだったのが

play17:42

clow3は普通に選択肢に入ったなと

play17:45

いう印象があるのでこれから使う人増えて

play17:47

くると思いますし実際自分自身も用途に

play17:49

よってはトークン数とかコストで選んで

play17:52

クロード数を選択するということをやり

play17:54

ながらやっていこうかなと思っています

play17:55

また新しい情報が入りましたらニュースで

play17:57

あったり特集してご紹介したいと思ってい

play17:59

ますえということで本日は以上になりまし

play18:01

て最後に簡単に告知をさせてくださいえ

play18:04

まずですねオンラインイベント4月の9日

play18:06

に生成サミットやりますもし当日時間が

play18:08

合わなくても応募いただければ可能な限り

play18:11

アーカイブ共有しますので是非よろしくお

play18:12

願いします先日もご東大な企業と話したん

play18:15

ですけれもやっぱり非常にですね魅力的な

play18:17

内容がありそうで今話題の自社データを

play18:20

使ってどうやって生成AIに活用していく

play18:22

のかであったりとかAIがどんどん自立的

play18:25

に考えるようなプログラムっていうのは

play18:27

現状どうなのかこんな最新の情報を実際の

play18:30

実体験と共に私がファシリテーターとして

play18:32

聞き出しながら話し聞きたいと思いまして

play18:34

完全無料ですので是非登録をよろしくお

play18:36

願いしますこれ第1回で成功したら

play18:39

バンバンやろうと思ってるんですけど

play18:40

あんまり来ないと第2回がないかもしん

play18:42

ないんで是非よろしくお願いしますさて

play18:44

続いて制裁ビジネス支援ですねチャット

play18:46

GPTの活用研修であったりとか導入支援

play18:48

バンバンやっています特に最近はただ研修

play18:51

をするだけではなく一緒にプロンプトを

play18:53

作って渡すというケースが増えています

play18:55

例えるならばこれまでは釣り方を研修とし

play18:57

てお伝えしてたんですけれどもやっぱり

play19:00

釣り方を教えてもまずはお魚食べたいんだ

play19:02

けどと美味しい刺身をくれというケースが

play19:04

多いかなと思うので研修しながら実際

play19:07

プロモートもいくつか作るつまり釣りの

play19:09

仕方を話しながら釣った魚をそのまで

play19:11

さばいてバンバン渡していきこれ

play19:13

めちゃくちゃうまいねと言いながら実際

play19:16

釣り方も教えていくというスタイルの方が

play19:18

いいかなと思って実際作っちゃうケースを

play19:20

増やしてるのでより実践的なご提供できる

play19:22

かなと思いもしよければご相談いただけば

play19:25

幸いですまたLINEの公式アカウントで

play19:27

はニュースのPDFや様々なイベントのご

play19:29

案内情報配信してるのでよろしくお願いし

play19:32

ますYouTube動画日々発信しており

play19:33

ましてチットGPT活用を最初に見て

play19:36

欲しい動画というところでま体型的であっ

play19:38

たり1番骨になる部分特集したりしてるの

play19:40

でもし全部はちょっと見れないなとま

play19:42

ほとんど見れないと思うんですけどそう

play19:44

いう方はこの是非再生リスト行ってもらっ

play19:46

てこれを見てもらうといいんじゃないかな

play19:47

と思っていますということで本日は以上に

play19:49

なりますもうclod3はね昨日実際使っ

play19:52

てみて私あの最初はあのUIはクロドじゃ

play19:55

なくてAmazonのベッドロックで1回

play19:57

使ってみたんですけどクオリティ高いなと

play19:59

こジェミナイ使ってる時はま面白いけど

play20:02

ちょっとまだ利用じゃないんだよねって

play20:03

感じだったんですけど本当クロード3は

play20:05

いけるなと思ったんで案件でも提案は始め

play20:07

ていますし是非知っていていただけると

play20:09

いいんじゃないかなとまたやっぱり一教

play20:11

っていうのはね非常にリスクが高いんで

play20:13

以前もサムアルトマンが退任されるとで

play20:16

チームメンバーが8割やめるみたいなそう

play20:18

いう怖さもあったようにやっぱりいくつか

play20:20

有力な選択肢は持っておいた方がこちらと

play20:22

しても選択肢があって何かあってもこっち

play20:24

使えばいいやという感じになるのでまそう

play20:26

いった意味でも今回の動画っていうのは

play20:28

参考になると嬉しいなと思っていますまた

play20:30

最新情報であったりとか色んなユース

play20:32

ケースであったり情報があったら随時発信

play20:34

していこうと思うのでよろしくお願いし

play20:36

ますそれではまたお会いし

play20:39

ましょうリモートワーク研究所では

play20:42

リモート時代に活躍して稼ぐためのツール

play20:46

の使い方やノウハウをどんどんご紹介して

play20:49

いきます是非チャンネル登録していただい

play20:51

て私と一緒に学んでいき

play20:57

ましょうV

Rate This

5.0 / 5 (0 votes)

Related Tags
AI生成AIOpenAIGPT-4クロード3ベンチマークプロンプトAI分析コスト比較
Do you need a summary in English?