まさかのGPT4超えモデルが登場!Claude3について解説してみた
Summary
TLDRこの動画では、OpenAIによるGPT-4を超えたとされる新しい大規模言語モデル「Claude 3」が紹介されています。開発元のAnthropicによると、Claude 3にはハイク、ソネット、オプスの3つのモデルがリリースされ、オプスが最も高性能です。オプスはGPT-4を上回る精度と、画像認識能力の高さが特徴的です。ただし、最上位モデルの利用には月額3,000円の課金が必要となります。動画の後半では、実際にClaudeのデモが行われ、その性能の高さが示されています。
Takeaways
- 😮 AnthropicによってGPT-4を超えると主張される新たな大規模言語モデル「Claude」が登場した。
- 🤖 Claudeには3つのモデル「Opus」「Sonnet」「Haiku」があり、OPUSが最も高性能である。
- 💰 OPUSモデルを利用するには月額3000円程度の課金が必要。
- ⚡ Claudeモデルは画像認識能力が高く、GPT-4のビジョンよりも性能が良い。
- 🌐 SonnetモデルはGPT-3.5ターボより無料で使え、性能も上回る。
- ✏️ HaikuモデルはGPT-3.5ターボよりコストパフォーマンスが良い。
- 📖 Claudeモデルは20万トークンの長文にも対応可能。
- ⌛ Claudeモデルの応答速度は従来モデルの2倍以上と主張されている。
- 👍 不適切な応答を拒否する割合が従来モデルより減少している。
- 🔑 Claudeモデルは2023年8月までのデータで学習されている。
Q & A
クロード3とは何ですか?
-クロード3はAnthropicと呼ばれる会社によって開発された大規模言語モデルです。OpenAIがGPT-4を開発したように、Anthropicはクロードというモデルを開発しています。
クロード3には何種類のモデルがあるでしょうか?
-クロード3には3種類のモデルがリリースされました。クロード3ハイク、クロード3ソネット、クロード3オプスです。オプスが最も高性能で、ハイクが最も低コストのモデルとなっています。
クロード3の特徴は何でしょうか?
-クロード3の主な特徴は、高い言語処理能力、高速な処理速度、そして優れた画像認識能力です。画像認識能力はGPT-4を上回るとされています。
クロード3のモデルはすでに使用可能でしょうか?
-はい、クロード3ハイクとクロード3ソネットのモデルはすでにAPIで利用可能です。クロード3オプスはプレミアムプランに加入した場合のみ利用できます。
クロード3のコストはどのくらいでしょうか?
-クロード3ハイクは比較的低コストですが、最上位のクロード3オプスを利用するには月額3000円程度のプレミアムプランに加入する必要があります。GPT-4ターボよりもコストが高くなります。
Anthropicはどのようなバックグラウンドの会社でしょうか?
-AnthropicはDario Amodei氏が設立した会社で、Amodei氏はOpenAI出身の研究者です。OpenAIと同様に、強力な技術力を持つ会社とされています。
現在のGPT-3.5ターボユーザーはクロード3に乗り換える選択肢があるでしょうか?
-はい、クロード3ハイクがGPT-3.5ターボよりも低コストで高い性能を持つため、GPT-3.5ターボのユーザーはクロード3ハイクに乗り換えるのが良い選択肢となる可能性があります。
クロード3はどの程度の学習データを使用しているのでしょうか?
-クロード3は2023年8月までのデータを使用して学習されているようです。将来的にはさらに最新のデータで再学習される可能性があります。
動画ではクロード3を実際に使ってみましたか? その結果はどうでしたか?
-はい、動画ではクロード3オプスモデルを実際に使ってみました。言語処理能力と画像認識能力が高いことが確認され、将来有望なモデルだと感じられました。
クロード3の今後の展望や課題は何でしょうか?
-動画では触れられていませんが、クロード3の課題としてはコスト、公平性と倫理的側面、継続的な学習とアップデートなどが考えられます。今後の展開が注目されます。
Outlines
🤖 クロードとアンソロピックの紹介
この段落では、新しい大規模言語モデル「クロード」とその開発企業「アンソロピック」の概要が紹介されています。アンソロピックはOpenAIの元従業員によって設立された会社で、クロードはOpenAIのGPT-4に匹敵する性能を持つと主張されています。クロードの開発者の経歴や、アンソロピックの設立経緯が説明されています。
🔬 クロード3のモデルと性能評価
この段落では、新しくリリースされたクロード3のモデルについて詳しく説明されています。3つのモデル(オプス、ソネット、俳句)の違いや、各モデルの性能評価結果がGPT-4やGoogleのジェミニウルトラと比較されています。特に画像認識能力が高いことが強調されており、実際の出力例も示されています。さらに、各モデルのAPIの利用可能性と料金体系についても言及されています。
🧪 クロード3の実演と今後の展望
この段落では、クロード3のオプスモデルを実際に使用してみた様子が紹介されています。言語生成や画像認識の出力例が示され、GPT-4との比較も行われています。また、クロード3の面白い回答例も紹介されています。最後に、今後このクロード3のAPIの使い方を解説したり、実際に使用した感想を動画で紹介することが示唆されています。
Mindmap
Keywords
💡GPT-4
💡Claude 3
💡Anthropic
💡言語モデル
💡画像認識
💡API
💡プロンプト
💡コスパ
💡課金
💡評価テスト
Highlights
ついにOpenAIのGPT4を超えたと呼ばれるモデルが登場した。
Googleも少し前にGPT4を超えたということでジェミニウルトラというモデルを公表していたが、評価の仕方が異なり信憑性に欠けていた。
今回紹介するクロード3のモデルに関しては、かなり信憑性が高い評価になっている。
クロード3には3つのモデルがあり、GPT4を超えたと言われるハイグレードのモデルを使用するには課金が必要。
クロードはアンソロピック社が開発した大規模言語モデル。創業者のダリオ・アディは元OpenAI社員。
クロード3のモデルは、GPT4を上回る性能評価結果が示されている。
無料で使えるクロード3のソネットモデルは、GPT3.5を全ての項目で上回る性能。
クロード3のモデルには画像認識機能が追加され、GPT4のビジョンよりも性能が高い。
クロード3は不要な回答拒否の割合が減り、ロングコンテキストを有効活用できる。
クロード3のオプスモデルはGPT4ターボよりも高い料金設定だが、性能が高ければ妥当。
GPT3.5ターボを使っている人は、クロード3の俳句に乗り換えるのも選択肢。
実演でクロード3のオプスモデルを使い、自然な対話と画像認識能力の高さを確認。
クロード3のモデルは2023年8月までのデータで学習されている。
今後もクロード3のAPIの使い方や長期的な感想を動画で紹介予定。
興味があれば視聴者もクロード3を使ってみるとよい。
Transcripts
GPT3.5ターボを使ってる人はクロド
3の俳句に乗り換えるという選択肢はあり
なのかもしれません画像認識の能力が高い
というところだったのでそちらも少し見て
いきたいと思いますはいどうなるかはい皆
さんこんにちはAIバネットです本日は
clod3について紹介してきたいと思い
ますついにOpenAIのGPT4を超え
たと呼ばれるモデルが登場しましたGPT
4を超えたっていう宣伝文句きは来たぞと
いう風に思った人もいると思いますで
Googleも少し前にえPT4を超えた
ということでジェミニウルトラという
モデルを公表してたんですけども実際は
評価の仕方がC的であまり信憑性が高く
ありませんでしたしかし今回紹介するえ
CL3のモデルに関しては私が見た限りだ
とえそこそこ信憑性が高い評価になってい
てモデルも一緒に公開されたのですでに
使える状態になっていますえただえ今回え
3つのモデルが公開されたんですけども
GPT4を超えたと言われるハイグレード
のモデルを使用するには課金する必要が出
てきますで月3000円くらいするのでま
ちょっと気軽には申し込めないなという
感じですよねそこで今回は私の方で課金し
てみてえGPT4と少し比較してみたいと
思いますでそもそもえクロードって何って
人もたくさんいると思うので本日はクロド
のこととえ新しくリリースされたモデルに
ついて解説していきます最新の大規模言語
モデルについて知りたいという人は是非見
ていってもらえればと思いますそれでは
早速やっていき
[音楽]
ましょうはいそもそもえクドって何だと
いう話になりますクロドドっていうのはえ
アンソロピックと呼ばれる会社で開発され
ている大規模言語モデルの名前になってい
ますオープンAIがGPT4と呼ばれる
モデルを開発てるようにえアンソロピック
という会社がクロドと呼ばれるモデルを
開発するというわけですねでこのアンソロ
ピックと言われる会社はこちらのえダリオ
アディさんと言われる人が設立した会社に
なっていますでこのアディさんはえ元々え
バドで働き始めてえその後Googleに
行ってその後OpenAに行ってえ
2021年にアンソロpiicという会社
を起業していますByDo行って
Google行ってOpenAIに行って
起業というなんかすごいキャリアですよね
でアンソロピックっていう会社はえ元々
オーAIで一緒に働いてた人とえ共同で
設立してるようですなのでOpen
OpenAIと同じようにめちゃくちゃ
技術力が高そうな会社というのが分かり
ますで前回の動画でミスタラージという
モデルを紹介したんですけどもその時にえ
CH2を上回ってるという結果になってい
ましたで今回出たのはこちらのclod2
の次のモデルということでえclod3と
いうものが出ていますclow2から3に
なって精度がどういう風に上がってるのか
というのがえ注目ポイントになっています
それではサイトの方に行って今回リリース
されたえク3のモデルについて解説して
いきますはいこちらが今回公開されたえ
clod3のモデルについて書かれたえ
公式のページになっていますで今回え
clod3のモデルはえ3つ公開されまし
たえclod3のハクというものとえ
クロド3のソネットえクド3のオプスと
いうものですねで横軸がコストで縦軸がえ
モデルの賢さになってるんですけども右上
に行くほどえ高くて賢いとまつまりハイ
グレードなモデルということになりますな
のでこのCL3のオプスというモデルが
1番強そうなモデルになっていますで1番
お手軽なモデルはえクロード3のハイクと
いうことになっていてまなんかハクって
いうことで日本人に対しても
ターゲッティングしてくれてるのかなって
いう風な感じが少ししますよねはいで下の
方に行くとえクロードのモデルとえGPT
とえGoogleのjemiのモデルの
比較結果が載っていますでいろんなテスト
で評価してるんですけども1番強いえCL
3のオプスというモデルですねえ軒並みえ
GPT4と比較して精度が高いということ
が分かりますこれ結構すごいですよねで
ちゃんと見ないといけないのはこの制度の
下に書いてあるえプロンプトの条件なん
ですけどもGoogleのジェミニ
ウルトラの場合はこのプロンプトの条件が
違うもので比較してたんですけどもこの
CL3の評価に関しては大体同じ同ような
プロンプトの設定で評価してるようです
一部違ったりするんですけどもGPT4の
方がえ有利なプロンプト設定にしても精度
が超えてるという風にも見えるのでこの
clow3のオプスに関してはかなり強
そうだなというところが分かりますで
真ん中のえクロド3のソネットという
モデルは現在無料で使用することができる
んですけどもGPT3.5と比較して全て
の項目で制度が高いので無料で言語モデル
を使うというのであれば現状こちらのクド
3のソネットというモデルを使った方がい
いいかもしれませんで1番下のえクロド3
の俳句に関してもえ全てのテストでGPT
3.5を超えてるのでクロド3の配の方が
安ければこちらを使っていくという風に
なってくかもしれませんねえただえこう
いった評価テストは英語で行われてると
いうところだったりとかえ実際に使って
みると少し返りしてるなというところも
あったりするので注意が必要になります
はいで各モデルのアピールポイントが書か
れてますね一番下の俳句のモデルに関して
は市場で最もコスパがいいモデルになって
いますという風に書かれてますえ3秒未満
で約1万文字の論文を読めるというところ
が主張されていますでその他え真ん中の
ソネットのモデルに関してはこれまであっ
たえクロド2やクド2.1のえ2倍以上
早いとで最も精度が高いOPSのモデルに
関してはCL2と2.1とえ同じスピード
という風に書かれてますはいそしてえ注目
するべき点としてえストロングビジョン
ケイパビリティということでCL3の
モデルにえ画像認識機能が追加されました
しかもえかなり精度が高いですこちら評価
結果になっていてclod3のOPSの
モデルに関してはえGPT4のビジョン
よりも全てのテスト結果でえ性能を上回っ
ていますGoogleのjemiウルトラ
もえ画像認識の精度高いんですけれども
まだAPIで使えなかったりとか日本語に
最適化されてなかったりとかちょっと使え
ない部分があると思うので現状仕事でえ
画像とかを扱うというのであればこちらの
clod3のモデルが有望だなという風に
思いますでclod3のソネットでも
GPT4のビジョンを上回ってたりするの
でこのこのクロドのモデルのえ画像認識の
能力ってのはえかなり期待できそうですよ
ねはいあとはえこれまでのモデルと比較し
てえ不要に回答を拒否するようなえ割合が
減りましたよとかあとはロング
コンテキストアニアPerfect
リコールというものでクド3のモデルは
20万トークン入れたとしてもちゃんと
全ての入力をえ有効活用できますよという
ところが主張されていますで3つのモデル
がリリースされたんですけども1番上の
OPUSと2番目のソネットに関しては
今日からAPIを使ってえ利用することが
できます俳句に関してはえまだAPIでは
使えないようですでこちらのアスピックの
ウェブサイトではソネットのモデルをえ
無料で使うことができますで冒頭話した
ように1番精度が高いOPSのモデルに
関しては有料版を申し込んだ人しか使え
ないようですで気になる料金なんですけど
もえこちらのアーティフィシャル
アナリシスと言われるサイトでえ各モデル
を使用した時の入力と出力にかかるえ料金
がまとめられていますでこの紫が入力に
かかるお金で青が出力にかかるお金になっ
ていますでこういう風に見るとえclod
3のオプスに関してはGPT4ターボより
もかなり高いなと特に出力に関してはえ2
倍以上高いという料金になっていますで
料金高いのでまなんだよという風に思った
人もいると思うんですけどもちゃんと
モデルの性能が高いんだったら確かに自信
を持ってえGPT4ターボよりも高い値段
で設定しても問題ないのかなという風に
個人的には思いますで他のモデルを見て
いくとえGPT3.5ターボよりも今回出
たクロード3の俳句の方がえ入力力ともに
え値段が安いというのが分かるかと思い
ますで先ほど見たようにclod3のハク
のモデルの方が評価結果は良かったので
GPT3.のターボを使ってる人はクロド
3の俳句に乗り換えるという選択肢はあり
なのかもしれませんはいそれでは大体重要
な点ははモーラできたと思いますので実際
に使ってみたいと思い
ますはいこちらがえクロドのモデルが
使えるえページになっていますえ概要欄の
方にリンクを貼っておきますフォントが
すごくおしゃれな感じになってますねで
こちらにチャットを打っていきます
こんにちはとでそうするとここでモデルが
選択できます私はすでに有料版に申し込ん
でいるのでえクロ3のオプスというモデル
が出てきますこちら打ってみ
ましょうはいそうするとこんな感じですね
速度としてはえGPT4ターボとま同じ
くらいなのかなという風な感じがしますね
うんふん
ふんはいであなたはいつまでのデータで
学習されていますかと聞いてみましょう
はいそうすると2023年のえ8月までの
データを使ってま学習してるようですね
なるほどなるほどはいpyonの勉強方法
について中学生に分かるように300文字
以内で押してくださいという風に指示して
み
ますはいそうすると300文字を守れるの
かというところなんですけれど
も守れていないような感じもします
ね守れているのかこれ
は30070文字でま若干超えてしまっ
てるんですけどもいい感じに指示に従って
くれてるようですねあとはプロゲートとか
おそらくこれって日本語用のサイトかなと
思うのでこちらですねちゃんと日本人って
いうことを認識して良い感じの回答を生成
してくれてるような感じがしますでここら
辺の言語モデルに関しては普段から
たくさん触ってみないと何とも言えなかっ
たりするので今後色々触ってみてまた動画
の方でどうなのかというのは紹介していき
たいと思いますで今回のク3のモデルに
関してはえ画像認識の能力が高いという
ところだったのでそちらも少し見ていき
たいと思いますジミニーウルトラの論文の
こちらの図を貼ってみて正しく出力できる
のかというのを見てみますはいこちらを
貼り付けてでプロンプトの方もこちらを
使ってみ
ますはいどうなる
かはいこんな感じでえグラフを読み取って
え表を出力してくれましたえジェミニ
ウルトラの出力に関してはこちらになって
いますしてちょっと小さいんですけどもえ
両方とも正しく抽出できてるというのが
分かりますでジェミニウルトラの方に関し
てはうまくいった例を載せてるという可能
性もあるんですけどもこのclod3に
関しては私が勝手にえGoogleの論文
から持ってきてるので確かに画像認識の
精度は高いんだなという風な感じがします
よねはいでもうちょっとテストしたいと
ことでこちらの画像も試してみますこれ
これもGoogleの論文に載ってたやつ
なんですけども三角形四角形5角形の後に
何が来ますかという問題になってます
こちらも貼り付けてプロンもコピーして
貼り付けてみ
ますどう
だはいそうするとこんな感じで回答が生成
されました英語なのでちょっと分かり
にくいんですけども1つ目が三角形2つ目
が正方形3つ目が5角形ですよとこれに
基づいて次のシェープを推測すると
ヘキサゴンですよとまつまり6角形という
風にえ推測しています正解ということで
すごいですねでさらに続きとしてどういう
風に考えてえその結論に至ったかという
ところまで詳しく書かれていますこれも
踏まえるとクロド3のオプスは画像認識
能力高そうですねはい最後にどれぐらい
面白い回答できるのかというのでこの
イラスト屋の猫の画像からくすっと笑って
しまうような面白いストーリーをえ200
文字以内で考えてくださいという風に聞い
てみ
ますちょっと画像がなんか荒くなっちゃっ
てますけどもどうでしょう
かはい猫の玉はチーズが大好物とでチーズ
と思ったらえそれはスポンジだったという
ところで少し面白い話になってますねはい
でGPT4の方でも同じように回答を録さ
せてみたんですけどもこの猫は近所で有名
なお金を見つける猫ですと今日は特別彼は
猫用ビットコインを発見したと信じてい
ますとただ残念ながらピカピカのボタン
でしたというストーリーを作成してくれ
ましたえ面白さレベルに関してはあんまり
変わらないのかなという風な感じがしまし
たがどうでしょうかはいただこのクロド3
はまかなり性能高そうな感じがしますので
え今後APIの使い方とかそういった
ところも解説していきたいと思いますあと
言語モデルに関しては私の方で課金しまし
たので日常的に使てみてまた感想とかあれ
ば動画にして紹介したいと思います皆さん
も興味があればえクド3使ってみるといい
と思いますはい以上で本日の動画終了し
たいと思いますえこの動画良かったなって
風にも人は高評価コメントチャンネル登録
の方よろしくお願いしますえゆでもやって
ますので概要欄から見てみてくださいえ
それではまた次回の動画でお会いし
ましょうバイ
バイ
5.0 / 5 (0 votes)