本当にGemini Pro1.5は凄いのか?論文を読んで解説してみた
Summary
TLDR最近、Googleが新しい言語モデル「ジェミニプロ1.5」を発表しましたが、話題にはならなかった。一方で、OpenAIが動画生成AIを公開し、注目を集めている。ジェミニプロ1.5は、前モデルよりも性能が向上し、文章だけでなく画像や音声も扱えるマルチモーダルモデルです。特に、入力できる文章の長さが1000万文字までと大幅に増え、長文の扱いが得意とされています。しかし、実際にはその長所を活かす場面は限られるかもしれないと指摘。また、GPT4と比較して性能評価が行われ、ジェミニプロ1.5が優れていることが示唆されていますが、その評価方法には疑問の声も。この動画では、ジェミニプロ1.5の詳細とその性能を解説し、今後の可能性についても触れています。
Takeaways
- 😀 Googleの新しい言語モデル「ジェミニプロ1.5」が発表され、SNSで話題にならなかった理由について解説。
- 🌟 ジェミニプロ1.5は、前バージョンのジェミニプロやウルトラよりも性能が向上していると主張されている。
- 📈 入力できる文章の上限が1000万トークンまでアップし、長文の扱いが強化された。
- 🎯 ジェミニプロ1.5は、画像、音声、動画などマルチモーダルなデータ入力が可能で、特に長文の入力と処理能力が高いと評価されている。
- 🤖 テスト結果によると、ジェミニプロ1.5は長文の入力を扱う能力においてGPT4を上回る可能性がある。
- 📚 実験では、カマン語への翻訳など、限定的な用途でジェミニプロ1.5の長所が発揮されている。
- 💡 ジェミニプロ1.5は、Googleが現在最も自信を持っているモデルではないかと推測される。
- 🔍 論文の分析やテスト結果から、ジェミニプロ1.5が長文の扱いにおいて優れていることが示されている。
- 📝 ジェミニプロ1.5の利用は申請制となっており、今後APIでの利用が期待されている。
Q & A
Googleのジェミニプロ1.5はどのような新機能が発表されましたか?
-Googleのジェミニプロ1.5は、性能アップと入力できる長さの上限がアップされた2つの大きな変更点があります。特に入力上限は1000万トークンまで入力できるようになり、非常に長い文章やデータの扱いが可能になりました。
ジェミニプロ1.5が持つ「マルチモーダル」モデルとは何を意味しますか?
-「マルチモーダル」モデルとは、テキストだけでなく音声や画像、動画など複数のデータタイプを扱える能力を持つモデルを指します。ジェミニプロ1.5はこれにより、文章だけでなく音声や動画データも処理できるようになっています。
ジェミニプロ1.5が扱える入力の最大文字数はどれくらいですか?
-ジェミニプロ1.5は約1000万文字まで入力できるとされています。これは非常に長い文章やデータの扱いが可能になるため、大規模なシステムのプログラムコードを読ませたり、分厚い本を読ませたりする際に便利です。
ジェミニプロ1.5が行った「Needle in a Haystack」テストとは何ですか?
-「Needle in a Haystack」テストは、長い入力情報をモデルが適切に扱えるかどうかを評価するテストです。例えば、長い文章の中にランダムに数字を埋め込んでおき、それを指し示く質問に対して正しく回答できるかどうかをテストします。
ジェミニプロ1.5とGPT4の性能比較では、どちらが優れていますか?
-論文によると、ジェミニプロ1.5は言語モデルの性能においてGPT4を上回る結果を示しており、特に長文の入力を扱う能力においては優れているとされています。しかし、純粋な性能比較ではGPT4が優れている可能性もありますが、長い文章を扱う用途においてはジェミニプロ1.5が適しているとされています。
ジェミニプロ1.5が扱える動画の最大時間はどれくらいですか?
-ジェミニプロ1.5は動画の入力において最大3時間の動画データを扱うことが可能です。これにより、長時間の動画データから情報を抽出したり、分析したりすることができるようになっています。
ジェミニプロ1.5が扱える音声データの最大時間はどれくらいですか?
-ジェミニプロ1.5は音声データの入力において最大22時間の音声を扱うことが可能です。これにより、長時間の音声データを分析したり、処理したりすることができるようになっています。
カマン語への翻訳テストでジェミニプロ1.5はどのように評価されましたか?
-カマン語への翻訳テストでは、ジェミニプロ1.5は約1000万文字の入力が可能であるため、文法書全体を入力して正しく英語に翻訳できることが示され、他のモデルよりも高精度の翻訳が期待できると評価されました。
ジェミニプロ1.5の利用はどのように申請すればいいですか?
-ジェミニプロ1.5の利用申請はGoogle Japanのブログにあるウェイティングリストのリンクから行うことができます。興味がある人はリンクをクリックして申請フォームを入力し、申請を待つ必要があります。
Googleがリリースしたジェミニウルトラとジェミニプロ1.5はどのような違いがありますか?
-ジェミニウルトラはより大きなモデルで、非常に高い性能を持ちますが、計算コストがかかる傾向があります。一方でジェミニプロ1.5は、入力できる長さの上限が1000万トークンまでと大幅にアップし、長文の扱いが得意とされていますが、サイズはウルトラよりも小さいです。
Outlines
📰 Googleのジェミニプロ1.5とOpenAIの対決
Googleが新たに公開したジェミニプロ1.5について説明し、その性能を評価する。同日にOpenAIが公開した動画生成AIとの比較も交え、GoogleとOpenAIが技術的に激しく競争している現状を紹介。また、Googleの言語モデルの性能評価方法や、以前のモデルであるジェミニウルトラとの比較も行う。
🔍 ジェミニプロ1.5の新機能と性能向上
ジェミニプロ1.5の新機能として、性能の向上と入力できる文章の長さの上限の引き上げが紹介される。特に、入力上限が1000万トークンまでとなっている点に注目が集まる。また、マルチモーダルなモデルとしてのジェミニプロ1.5が、文章だけでなく音声や画像も扱える能力についても触れられている。
🎯 ジェミニプロ1.5の長文入力能力の評価
ジェミニプロ1.5が長文を入力し、正確に情報を抽出する能力を評価するテスト方法である「needle in a haystack」について説明。この方法では、ランダムに埋め込まれた特定の情報(マジックナンバー)を正しく特定する能力が評価される。その結果、ジェミニプロ1.5が他のモデルに比べて優れていることが明らかにされる。
🌐 ジェミニプロ1.5の多言語翻訳能力と実用性
ジェミニプロ1.5が長文を扱う能力を応用して、英語からカマン語への翻訳など、実用的なタスクにどのように役立つかが説明される。カマン語は非常に少ない数の話者しかいない言語であり、インターネット上の情報も限られているため、このタスクは言語モデルにとって非常に困難である。しかし、ジェミニプロ1.5はそのようなタスクにおいても高い翻訳精度を示している。
Mindmap
Keywords
💡ジェミニ
💡ジェミニプロ1.5
💡マルチモーダル
💡needleina
💡GPT4
💡翻訳
💡性能評価
💡SNS
💡モデルサイズ
💡入力上限
Highlights
Googleのジェミニプロ1.5が新機能として発表された。
OpenAIの動画生成AIが公開され、ジェミニプロの話題が埋もれた。
ジェミニウルトラがOpenAのGPT4に匹敵すると言われている。
ジェミニプロ1.5はジェミニウルトラを超える性能があると主張されている。
Googleの言語モデルの性能評価は注意深く見る必要がある。
ジェミニウルトラはcot@32の設定でGPT4を上回る性能を示した。
論文によると、プロンプトの設定の違いによる性能比較が行われている。
ジェミニプロ1.5は入力できる長さの上限が1000万トークンに増えている。
ジェミニプロ1.5はマルチモーダルなモデルで、音声や画像も扱える。
needleinaハイSTACKという評価方法が用いられ、長い入力の情報を適切に扱うことが示された。
ジェミニプロ1.5は長文の入力を扱う能力が高いと示された。
GPT4と比較して、ジェミニプロ1.5が長文の入力を活用する能力が高かった。
カマン語への翻訳試験でジェミニプロ1.5の長所が実証された。
ジェミニプロ1.5は1000万文字の入力が可能で、翻訳などのタスクに有効。
Googleの言語モデルの性能はGPT4と比較して議論の余地がある。
ジェミニプロ1.5は利用申請が必要で、今後APIが公開される可能性がある。
動画はジェミニプロ1.5の詳細な解説を行っている。
Transcripts
SNSとかですごいすごいという風に言わ
れててもま一旦ですね冷静になって論文
などをしっかり読んだ方が良いかもしれ
ませんえジェミニは長文の入力を扱う能力
が高いというのが分かるかと思いますはい
皆さんこんにちはブネです本日はジェミニ
プロ1.5本当にすごいのというテーマで
話していこうと思いますえ先日
Googleからえ最新のジェミニPro
1.5というのが公開されましたしかし
同じ日にOpenAIからえソというえ
動画生成AIが公開されていてこちの長が
すごすぎたのでこのGoogleの
jemiPROの話題はほとんどSNSで
盛り上がってませんでしたでこれは偶然な
のか狙ってるのか分かんないんですけども
OpenAIはGoogleが何か
リリースしたらえすぐにそれよりも上の
ものをですねリリースするというので非常
にバチバチやり合ってるという状態になっ
てますでGoogleは先日ジェミニ
ウルトラというモデルを出したばかりでし
たでそちについてはこちらの動画で解説し
てるので興味がある人は見てみてください
でこのジミニーウルトラはオープンAの
GPT4に匹敵すると言われてたんです
けどもえ次はこのジェミニウルトラを
さらに超えてきたえジェミニプロ1.5と
いうモデルが発表されましたでそもそもえ
プロとかウルトラとかって何なのって人も
いると思いますしえ課金した方がいいのか
なっていう風に迷ってる人もいるかと思い
ますただ実はGoogleの言語モデルの
性能評価はえ結構ちゃんと見ないと怪しい
ところがあったりしますでこういうところ
理解しておかないと必要ないものにお金
払ってしまうという可能性もあると思い
ますので本日はそこら辺も含めてえどう
いう状況なのかというのを誰でも分かる
ように解説していきますGoogleの
原語モデルについてもっと詳しく知りたい
という人は是非見ていってもらえればと
思いますえそれでは早速やっていき
[音楽]
ましょうはい最初にこれまでの
Googleの言語モデルについてあまり
情報を終えていないという人もいるかと
思いますのでそちらから説明していきます
えまずGoogleが開発してる言語
モデルの名前がジェミニという風に呼ばれ
てますでGoogleってすごくクールな
会社というイメージがあると思うのでこの
言語モデルのえジェミニもすごいんだろう
なっていう風に思いますよねで実際え
Googleの言語モデルのサイトとかを
見てみるとえこんな感じでOpenAの
GPT4の性能を超えたというところが
大体的に書かれてたりしますでこれはえ
あるテストの結果なんですけどもGPT4
が86.4%の制度なのにGoogleが
開発してるジェミニウルトラでは90%
ですというところが主張されていますで
これを見るとえジェミニウルトラの方がえ
GPT4よりも強そうだなという風に思い
ますよねで言語モデルの性能を評価する
試験っていうのはえ実はたくさん行われて
いてGoogleのページに行くとえ
いろんな試験の結果がえ表形式でまとめ
られていますでジェミニウルトラと
OpenAのGPT4の結果がそれぞれ
まとめられてるんですけれどもこれを見る
とえ軒並みジェミニウルトラの方が性能が
高いというのが分かるかと思いますでただ
この数値の下の条件を見てみるとえ設定が
違うというのが分かるかと思いますでこれ
はえ言語モデルに与えるプロンプトの設定
が異なるということを意味していますま
簡単に言うと同じ条件で比較した結果では
ないということになりますでコメマークが
ついてるのでこの表の下のところを見て
みるととえ少しちっちゃいんですけどもえ
cot@32という条件でえGPT4の
スコアは87.2900ですよという風に
書いていますでこのジェミニウルトの
90%もえcot@32なのでこちらの
87.29とこちらの90%は同じ条件の
比較結果になっていますなのでえせっかく
同じ条件で比較してるのになぜかこの表に
書かれてるのは同じ条件のものじゃなくて
少し低い違う条件の結果を載せています
これはちょっとどうなんだろうなっていう
風に思いますよねただえそうは言ってもえ
同じ条件で比較してえGPT4は87.
29でジェミニウルトラ90%なので結局
ジェミニーウルトラの方が強いじゃんと
いう風に思った人もいるかもしれません
しかしこれもえ論文を読みに行くとえ
こんな感じの図がえ論文の付録部分え
つまり補足資料として載っていますでこれ
はGPT4とえジェミニウルトラの比較
結果なんですけどもグレーがGPT4で
ブルーが地面にウルトになっています横軸
がプロンプトの設定の違いで縦軸がえ精度
なってるんですけども先ほどあったえ
cot@32というプロンプトはこの
真ん中の結果になっていてこれを見るとえ
GPT4が87.2900でジェミニー
ウルトラは84.99ドル
かと思いますでこれの右を見てみると
Changeオso@32のunan
rootedという設定方法がありますで
この場合だとジェミニウルトラは9.0
4%でまGPT4を超えてるという風な
結果になっていますでこの結果がえ先ほど
のページにのてるというわけですただこの
アサンテルティという方法がま何なのかと
いうのは論文で詳細が書かれていません
でしたなんでこの方法をやるとえGPT4
のスコアは変わらなくてえジェミニ
ウルトラのスコアを伸びてるのかってのが
よくわからないですしそもそもこの方法に
ついて書かれてないとこの結果をどういう
風に解釈していいのかってのが分からない
かと思いますそしてこの論文はえ昨年の
12月時点で発表されたんですけども
GPT4のモデルのバージョンっていうの
が11月の最新のバージョンじゃなくてえ
ここにもあるように0613ということで
半年前の6月13日にリリースされた
モデルを使用しているようですたまたま
この実験をやったのがえ11月以前だった
ということもあると思うんですけども論文
の別の箇所では実験はえ11月に行ってる
ということが書かれてるのでだったら6月
のモデルじゃなくてえ11月のモデルを
使うべきなんじゃないかという風に思っ
たりもしますでこういった背景からま一部
の人たちからまどういうことだというので
ま不審感が少し溜まってるかと思います皆
さんも少しGoogleに対して不審感を
持っていたりするんでしょうか私もえま
スマホはPixel使ってたりとか
Google大好きな人間なんですけども
まちょっと言語モデルに関しては好評さ
れる結果をそのまま信じられなかったりし
ますなのでSNSとかですごいすごいと
いう風に言われててもま一旦ですね冷静に
なって論文などをしっかり読んだ方が良い
かもしれませんで論文とか読んでられない
よという人はですね私の方が解説しますの
でチャンネル登録の方よろしくお願いし
ますという感じ
ですはいそれでは少し前置きが長くなった
んですけどもえ今回新しくリリースされた
えEMIPro1.5について説明します
でこちらはえGoogleで開発されてる
言語モデルになっていて大きく分けて3
種類ありますそれぞれモデルが大きい順
からえジェミニウルトラえプロNANと
いう風に分かれています基本的にはえ
モデルのサイズが大きいほど計算時間が
かかったりする分モデルの性能が良くなり
ますで2月の初旬にリリースされたのがえ
こちらのジェミニウルトラになってるん
ですけども今回はえ真ん中のえjemi
Proのえバージョン1.0がえ
バージョン1.5に進化しますましたと
いう話になりますでジェミニPro1.5
になってえ注目するべき変わったこととし
ては2つあります1つ目がえ性能アップと
いうことでえこれまでのジェミニPro
1.0や先日出されたえジェミニウルトラ
よりもえ性能が良くなりましたこちらはえ
ジェミニプロ1.0とジェミニウルトラと
比較した結果になっていますでジェミニの
モデルはえ文章だけじゃなくて画像とか
音声も扱えるマルチモーダルなモデルなの
でそれぞれのデータの種類に対して比較が
されていますでこれを見ると前のの
バージョンの1.0のプロよりも全ての
データに対して性能が良くなってるとまた
えジェミニウルトラと比較しても文章を
扱うタスクにおいては今回のジェミニ
Pro1.5の方が良い結果を示してます
画像とか音声を扱うタスクにおいては
ジェミニウルトラの方が良いという結果に
なっていますで真ん中のグレードのこの
プロがえ最上位のウルトラを上回って
しまってるというのは少しなんでだろうと
いう感じもしますよねモデルが小さい方が
出力する速度が早いはずなので今の状態だ
とえウルトラを使う場面っていうは
あんまりないんじゃないかなという風な
感じもしますあえてここら辺を公表してる
ということはGoogleが現在最も自信
があるモデルはこのウルトラじゃなくて
今回リリースされたプロの1.5という
ことなのかもしれませんはい続いてえ注目
するべき2つ目の特徴としては入力できる
長さの上限がアップしたということになり
ますOpenAIのGPT4ではえ約
13万文字の文章を入力することができ
ますクロド2.1というモデルでは約
20万文字まで入れることができますこれ
でも相当長くて本とかも入れられるんじゃ
ないかなという風に思うんですけども
jemiPro1.5の入力上限はいくら
だと思うでしょうか50万えもしかしたら
100万かもという風に思った人もいると
思いますはい正解はなんとですね
1000万トークンまで入力できるという
ことでしたいやどんだけ入れられるんだと
いう風な感じもしますよねちなみに
トークンというのはAIで文字を扱う時の
最小単位になっていて文字のようなものだ
と思ってもらえばいいと思いますつまり
最新のジェミニプロ1.5では約
1000万文字まで入力できるということ
になりますま相当分厚い本を読ませたりと
か大規模なシステムのプログラムのコード
を読ませたりとかそういう場合は便利かな
と思うんですけども皆さんはここまで長い
入力上限ってのはえ嬉しかったりする
でしょうかで今回このモデルと一緒に公開
されたえ技術論文では結構なページをさえ
てこの長い入力ができることの利点だっ
たりとか性能の評価結果がまとめられてい
ましたジェミニPro1.5はジェミニ
ウルトラよりもえ言語モデルの性能が高い
というのであればGPT4との比較結果が
あるのかなという風に思って読んでたん
ですけども純粋なガチンコ対決の結果と
いうのは載ってませんでしたでここら辺は
えモデルの純粋な性能というよりも長い
文章を入れられるという点で差別化を測っ
ていこうという意図があるかもしれません
でジェミニのモデルはえマルチモーダルな
モデルとなっていますでマルチモーダルっ
ていうのはえ文章だけじゃなくてえ音声と
か画像とか動画とかえいろんな種類の
データを入力できるということになります
で文章の場合はえ1000万文字ぐらい
まで入れられるという話だったんですけど
も動画の場合はえ3時間音声に関しては
22時間まで入力できるようでその時の
制度がどうなるのかというテスト結果が
検証されていましたはいこちらはえ
needleinaハイstackという
え長い入力の情報をモデルが適切に扱え
てるのかというのを評価した結果になって
います上からえ動画音声テキストの評価
結果になっていますでこのneedle
イアハイスタックって何ってことなんです
けどもこんな感じで例えば桃太郎の昔話を
書いたとしますえおじいさんとおばあさん
が住んでいましたとかそういったことが
書かれてますでこの時のえ文章の中にえ
ランダムでこういった感じでマジック
ナンバーは5番ですとかえそういったえ
文脈に関係ない文章をえ埋め込んでおき
ますそしてこの文章全体とえ質問文として
マジックナンバーは何番ですかという文章
を合わせてえ言語モデルに入力した時に
正しくこの埋め込んだ文章の情報を参照し
てえ質問に答えられるのかというのを評価
する方法になっていますまちょっと難しい
んですけどもこれで何が見たいのかと言う
とjemiPro1.5は1000文字の
文章を入力できるという話だったんです
けども本当にその1000文字の文章を
入れた時にその文章全部をえちゃんと把握
できてるのかというのをチェックしてい
ますこれ結構面白い方法だなっていう風に
思いますよねえ実はこの評価方法は海外の
YouTuberの方が考えた方法になっ
ていますYouTubeをやってる人が
考えた手法がGoogleの言語モデルの
評価に使われてえ論文で引用されて
るってのは結構すごいなっていう風に思い
ませんかはいちょっと脱線したんですけど
もえそのテスト結果が先ほどの図になって
います横軸がえそれぞれの文章の長さに
なっていて例えば先ほどの桃太郎の話だっ
たらその桃太郎ロの物語の文章の長さに
なります縦軸がえその文章の中のえどこに
マジックナンバーの文章を埋め込んだのか
という位置を表していますで緑がえうまく
抽出できたものでえ赤が失敗したものと
いう風になってるんですけどもテキストの
場合はえ1000万トークンまでほとんど
緑になってるのでかなりの割合で成功し
てるというのが分かりますで動画とか音声
に関しても先ほどのテストと同じように
フレームとか音声にえマジックナンバーを
埋め込んだみたいなんですけどもどの場所
に入れたとしてもちゃんと抽出できたと
いう結果のようでですなので結論えjem
には長文の入力を扱う能力が高いというの
が分かるかと思いますでGPT4でもえ
同様の実験を行って結果を比較していまし
たでテキストに関してはえGPT4も
100%の制度だったんですけども音声に
関してはえこういった結果になっています
でGPT4はえマルチモーダルのモデル
じゃないので直接音声入力ができませんな
のでえウパーというえ音声から文字起しを
するAIを使ってえ文章を書き起こした後
にえGPT4を使使った場合というので
比較がされてましたで上がジェミニPro
1.5で下がGPT4とウパーなんです
けどもこれを見るとこのGPT4と
wispはえ赤いところがたくさんあって
うまく情報を抽出できてないという一方で
このgemiPro1.5はえ音声が長く
なってもえ全てを認識できるというのが
分かるかと思いますただこの比較結果論文
載ってたんですけどもえ皆さんどういう風
に思いますかでwispとGPT4の
組み合わせの評価ってそれウィスパーの
文字起しの制度の問題じゃないかという風
に突っ込みたくなったりしますよねとは
いえま現状GPT4では長い音声を扱え
ないのでま無理やり比較しようとすると
こういった形になるのもしょうがないのか
もしれないなという風にも思いますで論文
ではえさらに難しいタスクでの実験も行わ
れていてここでもGPT4よりも
ジェミニーの方が良いよというのが主張さ
れています先ほどはえ文章の中1箇所に
マジックナンバーは何番ですという文章を
入れて正しくこの番号を抽出できるのかと
いうのをやってたんですけども次はえ複数
の場所にこのマジックナンバーの文章を
入れてこの文章と一緒に質問した時に
正しくこの番号を取ってくれるのかとと
いうのを検証していましたで結果はえ
こちらになっていて青色がえジェミニ
Pro1.5で赤色がGPT4のターボに
なっています横軸がえ文章の長さになって
いてまGPT4は12万18000
トークンまでしか入力できないのでここ
までしかありませんと縦軸がえリコールと
言ってこれは正解のデータをどれぐらいの
割合で抽出できたのかというのを表してい
ますまなのでマジックナンバーの文章がえ
10個思い込まれた時に正しく10個正解
できたら100%になりますしえ5個しか
正解できなかったらこのリコールは50%
になりますなので高いほど精度がいいと
いうことになりますでこれを見るとえ青色
の方がリコールが高いのでまつまり
ジェミニプロの方が良い結果になってい
ますなのでえGPT4ターボよりも
ジェミニPro1.5の方が長文の入力を
活用する能力というのについてはえ高いか
もしれませんさすがに論文の数字はえ嘘は
つかないかなという風に思いますので本当
にジェミニプロの方が強いんだなという風
に思いますはいただえマジックナンバーの
タスクってのは結構単純なのでもう少し
現実的なものとしてえ1000ページを
超える本の内容をもにQ&Aで正しく回答
できるのかというのもテストされています
でこちらは少し難しいんですけどもラグと
呼ばれる本の一部からえ文章を抽出する
技術を使った場合との比較も行われてい
ます楽に関してはこちらの動画で紹介し
てるので興味があったら見てみてください
で結果を見るとこのゼロショットが何も
参照させてない時で4系リトリーブという
のがえラグをやった時最後の業がえ文章を
全部を入れた場合のえ結果になっています
でこういう風に見るとクロド2.1という
モデルよりもえジェミニプロの方が精度が
高いというのが分かりますただえなぜか
この試験だけえGPT4の評価結果が除外
されていましたで理由としてはGPT4は
本の内容をすでに学習してしまってるから
という風に書かれてたんですけどもなんで
そういう風に言い切れるのかというところ
は少し論文を読んでいて分からなかった
ですはいケチをつけてしまったんですけど
もえ結論としてはジェミニープロは長い
文章を入れる用途では結構使えるかもしれ
ないということですねで長い文章を入れる
時ってそれってどんな時なのっていう風に
思った人も多いと思いますで論文では英語
からカマン語への翻訳をする時に使えると
いう有用性が示されていました皆さん
カマン語って知ってますかカマン語はえ
世界でも200人未満の人しか喋ってない
言語のようですま当然このカマ語は
インターネット上に情報がないのでその
ままでは言語モデルに聞いても正しく翻訳
はできませんなのでえ実験ではこのカマ語
の文法書と一緒にえ翻訳して欲しい分を
入れた時に正しく英語に翻訳できるのかと
いうのを検証していましたつまりジェミニ
Proは約1000万文字入力できるので
翻訳して欲しい文章とこのカマ語の文法書
まるまるを一緒に入れるというわけですね
はい結果はこんな感じになっていますま皆
さんも予想はつくと思うんですけどもゼロ
ショットが何も入れてない状態でこの
ハーフブックというのが文法書を半分入れ
た状態フルブックってのが全部入れた状態
になってますでGPT4とCL2.1は
ポンを半分までしか入れられないという
ことですねでジェミニプロ1.5はえ全部
入れられるので当然1番精度が高いという
結果でしたはいますごいなという風に思う
んですけども結構用途が限定されるのかな
という風な気もしますよねはい色々と紹介
してきたんですけどもえまとめるとえ
ジェミニProはウルトラより言語モデル
の性能は高いとそしてえ長文を扱う能力が
高いかもしれないと最後に言語モデルの
性能に関してはえGPT4の方が良さそう
だなという風な感じがしますで長文を
たくさん入れられるのでえジェミニプロを
使うとえラグという仕組みがなくんじゃ
ないかという風な意見もあったりしますで
ただえ言語モデルを使うたびに毎回
テキストの情報を全部入れるのかというと
ま明らかにそれは無駄ですし入力文字数に
応じてモデルの利用料金がかかってくるの
で個人的には現段階だとそこまで使いどろ
は多くないんじゃないかなという風に思っ
てますえ皆さんはどういう風に思った
でしょうか感想とかあれば是非教えて
くださいでjemiPro1.5はえ利用
申請が必要になりますGoogle
japanのブログの下の方にえ
ウェイティングリストのリンクが貼って
あるので興味がある人は概要欄にリンク
貼っておくので申し込んでおくと良いと
思います今後APIとかも使えるように
なったらまた動画の方で解説していきたい
と思いますはい以上で本日の動画を終了し
たいと思いますえこの動画良かったなても
人は高評価コメントチャンネル登録の方
よろしくお願いしますえゆでもやってます
ので概要欄から見てみてくださいえそれで
はまた次回の動画でお会いしましょうバイ
[音楽]
バイ
5.0 / 5 (0 votes)