GPT4のライバル登場?Mistral AIについて解説してみた
Summary
TLDRThe video discusses Anthropic, an AI startup known for developing a language model called Claude. It provides an overview of the company, its growth and partnerships, comparing it to competitors like OpenAI. The narrator demonstrates using Claude in a chat interface and discusses its strengths and weaknesses for Japanese language use.
Takeaways
- 😀 Mistral AI is a Paris-based startup focused on developing large language models
- 🤔 Mistral AI was founded by ex-Meta and Google employees and recently raised billions of yen in funding
- 📈 Mistral's models are ranked very highly, second only to OpenAI's GPT models
- 🌎 Mistral AI believes in openness and has open sourced some models
- 🤝 Microsoft partnered with Mistral AI to provide access to their models in the cloud
- 🔬 Mistral's latest model, Mistral Large, is benchmarked to be the 2nd most capable model in the world
- 💰 Accessing Mistral Large currently requires payment to use their API
- 🌐 Mistral Large is optimized for European languages so far, not Japanese yet
- 😊 The Mistral chat interface provides convenient access to test Mistral's models
- ✨ Mistral AI has potential to keep advancing and stay near the top with models like GPT
Q & A
What is Mistral AI?
-Mistral AI is a French startup based in Paris that develops large language models, similar to OpenAI's GPT models.
Why has Mistral AI been gaining attention recently?
-Mistral AI has developed language models that are reported to be close to GPT-4 in performance, making them the second most capable models behind OpenAI.
What is unique about Mistral AI's models?
-Mistral AI releases many of their models as open source, allowing anyone to freely download and use them.
Why did Microsoft partner with Mistral AI?
-By partnering, Microsoft gains access to Mistral AI's state-of-the-art models to offer through its cloud services. Microsoft also invested over $2 billion into Mistral AI for future model development.
How well does Mistral AI's models currently support Japanese?
-The models are not yet optimized for Japanese. They can generate some Japanese responses but also mix in English unexpectedly.
What is Mistral Large (LaMDA) model?
-LaMDA is Mistral AI's latest and most capable model to date, claimed to be the 2nd most powerful model behind GPT-4.
Is Mistral Large (LaMDA) available publicly?
-No, unlike some previous Mistral models, LaMDA has not been released as open source.
Can LaMDA be tested through Mistral AI's website?
-Yes, Mistral AI offers a public chatbot interface that allows testing LaMDA, NEXT and other models.
How well does LaMDA perform in Japanese currently?
-When provided Japanese informational context, LaMDA can generate fairly coherent Japanese responses, though optimization for Japanese is still limited.
What are some potential future applications if Mistral AI's models progress further?
-The models could become extremely useful in areas like search, question answering, and content generation if progress continues and pricing becomes more affordable.
Outlines
📣 Introduction to Mistral AI and Its Significance
The video begins with the announcement of a partnership between Microsoft and Mistral AI, hinting at the potential affordability and usefulness of Mistral AI's technology. The speaker, Chine, introduces the topic of the video: understanding who Mistral AI is. Mistral AI has recently made news for developing a high-performance language model. The AI industry is currently competitive, with major companies like Google, Meta, and OpenAI (known for developing ChatGPT) leading the charge. Mistral AI is presented as a strong contender, possibly second only to OpenAI. Founded by former employees of Meta and Google's DeepMind, Mistral AI is a French startup focusing on developing large-scale language models. They have quickly gained attention by raising significant funding shortly after their establishment. Notably, Mistral AI supports open-source development, offering their models on platforms like Hugging Face for public use. This open-source approach allows for secure, customizable use, particularly important for companies handling sensitive information. Despite the current dominance of OpenAI's GPT-4, which is not open-source, Mistral AI's models have shown promising performance, suggesting a bright future for the company in the AI field.
🌐 Mistral AI's Evolution and Microsoft Partnership
The narrative continues with an explanation of Mistral AI's recent developments, including the launch of a new, high-performance model named Mistral Large, which boasts impressive capabilities, positioning it as the world's second-best in terms of performance. The script discusses the partnership between Microsoft and Mistral AI, which allows the use of Mistral AI's latest models on Microsoft's cloud services and includes a substantial investment from Microsoft for future model development. This partnership highlights Microsoft's strategic positioning, utilizing the top AI models to diversify its portfolio and mitigate risks. The script also touches upon the strategies of different tech companies in the AI space, with Microsoft choosing partnerships over developing proprietary models, contrasting with Google's and Meta's approaches. The video script concludes with an anticipation of Mistral AI's future impact, considering its principles of openness and the challenges of maintaining this ethos while partnering with major corporations like Microsoft.
🔍 Practical Use and Optimizations of Mistral AI's Models
The final section delves into the practical application of Mistral AI's models, specifically the Mistral Large model, and discusses its optimizations and limitations, particularly regarding language support. Despite being less optimized for Japanese, the model shows potential for practical use by referencing external information in Japanese, suggesting versatility in its applications. The speaker also shares their experience with Mistral AI's models through the Richat interface and discusses the ability to select different models for various needs. Additionally, the script mentions a promotional aspect where the speaker's referral code for PowerplexTI, a platform supporting Mistral AI's models, has been widely used, offering financial benefits to both the speaker and the users. The video concludes with an invitation for viewer feedback and encourages engagement with future content.
Mindmap
Keywords
💡language model
💡OpenAI
💡ChatGPT
💡GPT-4
💡natural language processing
💡conversational AI
💡text generation
💡cloud computing
💡natural language understanding
💡deep learning
Highlights
ミストラルAIはフランスのパリに拠点を置くスタートアップの会社。主に大規模言語モデルの開発を行う。
ミストラルAIは元々メタで働いていた人とGoogleのDEEPMINDで働いていた人が共同で設立。
ミストラルAIの言語モデルの特徴はオープンソースで、誰でも自由にダウンロードして使えること。
最も精度が高いのはオープンソースでないOpenAIのGPT-4で、ミストラルAIのモデルが2番目の性能。
ミストラルラージは現在世界で2番目に性能が高い言語モデルと主張されている。
MicrosoftがミストラルAIとパートナーシップを結び、MicrosoftのクラウドでミストラルAIのモデルを利用可能に。
MicrosoftはOpenAIともパートナーシップを結んでいるため、世界1位と2位の言語モデルを利用可能。
残念ながらミストラルラージはオープンソースではなく、利用するにはミストラルAIにお金を払う必要がある。
ミストラルラージは英語などヨーロッパ言語向けに最適化されているが、日本語もある程度生成できる。
外部情報を参照させる用途なら、ミストラルラージが安くなれば割と使える可能性がある。
Microsoftの戦略は自身でモデルを開発せず、OpenAIやミストラルAIと組むこと。
Googleは自身のモデルであるPaLMを開発しオープンソースで公開する戦略。
メタはラマというモデルを開発しオープンソースで公開する戦略。
どの企業の戦略が成功するかが楽しみなポイントだ。
Transcripts
先日MicrosoftとミストラルAI
がえパートナーシップを結ぶということが
発表されましたこれミストラルラージが
めちゃくちゃ安くなったりしたら割と
使えるのかなという風に思いますはい皆
さんこんにちはチネです本日はミストラル
AIって何者なのってテーマで話して
いこうと思いますえ最近ミストラルAIと
いう会社からかなり性能が高い言語モデル
が開発されたというところでニュースに
なったんですけどもそもそもミタルAI
って何なんだろうという人いないでしょう
か現在の生成AI界隈ではえチャットG
PTを開発したOpenAIを初めとして
Googleとかメタ社とかえいろんな
企業が攻めぎ合っている状態になってい
ますで今回紹介するミストラルAIはオ
OpenAIの次に強いのでないかという
風に言われてる会社になっていますでオ
AIも1年前はAIの研究者以外は
ほとんどの人は知らなかったかと思います
まなので本当数年で状況が変わっていくと
いうのが今の生成ア業界なのでもしかし
たらこのミストラルAIの時代が来ると
いう可能性もあるかもしれませんはいそこ
で今回はこのミストラルAIというのは
どういういう会社で何が起きてるのかと
いうことについて誰でも分かるように解説
していきますえ最新の生成や業界について
キャッチアップしたいという人はえぜひ見
ていってもらえばと思いますそれでは早速
やっていき
ましょうで最初にえミストラルAIって
どんな会社ってことなんですけどもえ
ミストラルAIはフランスのパリに拠点を
置くスタートアップの会社になっていてえ
主に大規模原語モデルの開発を行ってい
ますつまりオOpenAIのチャット
gpdみたいにえ独自の言語モデルを開発
してるとえそういった会社のなっています
でこのミストラルAIは元々メタ社で働い
てた人とえGoogleのDEEP
mindというところで働いてた人が共同
で設立した会社になっていますで去年設立
されたようなんですけども設立してから
すぐに数100億円の資金調達をしていて
話題になっていましたでミタルAIの言語
モデルの特徴としてはオープンソースと
いうところがあげられますでオープンソー
スっていうのは開発したAIのモデルが
公開されていて誰でも自由にダウンロード
してきて使えるというものになっています
例えばオープンソースのモデルが公開され
ているプラットフォームとしてはこちらの
ハギングfaceというところが1番有名
ですでハギングフェスではこんな感じでえ
ミストラルAIのページに行くといろんな
モデルが公開されていてここからえ自由に
モデルをダウンロードすることができます
例えばえこちらの言語モデルだったらえ
もうすでに100万回以上ダウウンロード
されて使われてるというのが分かりますで
こういう風にえ自由にモデルを
ダウンロードできると何が嬉しいのかと
いうことなんですけども例えばえ会社で
チットGPTを使おうとした時に入れ
ちゃいいけない情報ってのがあったりし
ますよね例えば個人情報とか車内の機密
情報とかそういったものを入れてしまうと
情報漏洩になってしまうのでえ禁止され
てるという会社が多いかと思いますでそう
いった場合もえこういったオープンソース
のモデルだったら原理上はえ自分の
パソコンにダウンロードしてきて使うこと
ができるのでセキュリティとかをえ特に気
にせず使うことができるというわけです
じゃあオープンソースのモデルを使えば
いいじゃんという風に思うと思うんです
けどもえ現状最も精度が高いのはオープン
ソースとしてモデルを公開していない
オープAIのGGPT4ということでえ
みんなこちらを使ってるというわけですね
でオープAIなのにえ全然AIをオープン
にしないじゃないかというところでSNS
上では少し批判されてたりしますはい少し
脱線しましたがでこちらは
アーティフィシャルアナリシスという
サイトにあるいろんな言語モデルの制度を
まとめた図になっていますで1番左の図が
様々なテストのえ総合的な能力を評価した
結果になっていてGPT4のターボがま
やっぱりダトで高いという結果になってい
ますそしてその次にえミタルミディアムと
モデルが来ていますでこれが先ほど紹介し
たミラルAIが開発した言語モデルになっ
ていますなのでミラルAIが開発した
モデルとOpenAのGPT4っていうの
がかなり制度的に近いということが分かり
ますねただ残念ならはえこのミストラル
ミディアムに関しては現状オープンソース
ではありませんなのでこのモデルを使うに
はえミラルAIにお金を払わないといけ
ないというモデルになっていますはいで
順位としてはまその次にハロピックの
chow2.0とGoogleのjem
Proといずれもオープンソースではない
モデルになっていますそしてこちらがえ
ミストラル87bということでま少し言い
にくいんですけどもミストラルじゃなくて
えミストラルというモルになっていますで
これは先ほど紹介したえハギングフェス
からダウンロードできるモデルになってい
てつまりオープンソースのモデルという風
になっていますで真ん中もえ右も異なる
試験で評価した結果なんですけども全体的
にこのオレンジのミストラルAIのモデル
たちがかなりいい線行ってるというのが
分かるかと思いますはいそしてつい先日え
先ほどのミストラルミディアムを超えるえ
ミタラージというモデルが登場しましたで
このモデルはえ当然ミストラルミディアム
よりもえ精度が良くなっていてGPT4に
はえ及ばないようなんですけども世界で2
番目に性能が高いモデルだということが
主張されていますでちなみに評価してる
モデルはAPIとして公開されてるモデル
に限定していますなのでプログラミングが
使用できるモデルに限定されてるという
ことですちなみに先日紹介したえ
Googleのjemウルトラではこちら
のmmlのテストで90%というスコアを
歌っていましたがジミニウルトラはえまだ
APIが公開されてないのでプログラム
から使用することはできませんあとは評価
の仕方に少し疑惑があったりするのでそこ
ら辺が気になるという人は以前の動画で
解説してるのでそちらを見ていただければ
と思いますはいで他にもまいろんなテスト
項目で評価されていてえ総合的に見て今回
出たミスタラージはえ結構強そうですで
こちらはえいろんなモデルでまいろんな
テストをした結果になってるんですけども
1番上のえミストラルラージを見てみると
かなり性能が高いというのが分かるかと
思いますさすがにGPT4には勝てないと
いう感じはするんですけども少なくともえ
GPT3.5よりも強いという感じに見え
ますねで創業してから1年しか経ってない
スタートアップでここまで来てるというの
はま結構夢がありますよねまだオーAIに
は及びませんが言語モデルで添加を取るか
もしれない有力な会社の1つかと思います
はいそしてえそんな会社をほっとかないの
がMicrosoftということで先日
MicrosoftとミラルAIがえ
パートナーシップを結ぶということが発表
されましたこのパートナーシップによって
えMicrosoftが提供しているえ
クラウドサービス上でミストラルAIの
最新のモデルが使えるようになったりとか
今後ミストラルAIがモデルを開発する
ために200億円以上投資するという
ところを決めてるようです
Microsoftちょっとすごいなって
風に思いませんかMicrosoftは
オーAIともパートナーシップを結んでい
ますまなのでMicrosoftの
サービスで世界1位と世界2位のモデルを
使えるというわけですねオOpenAIと
組んでるだけでも強いのにちゃんとえ2位
のミストラルAIとも組むというのはオ
OpenAIがえ越された時のリスク分散
もできていてまさすがだなという風な感じ
がしますよねでアメリカのテック企業は
各社別々の戦略を取っていて
Microsoftはえ自分たちでは原語
モデルを開発しないとオOpenAIと
ミストラルAIとパートナーシップを組ん
でいてGoogleに関してはジェミニを
開発してるとでメタシに関してはラマと
いうモデルを開発していてそれをオープン
ソースで公開してるという形になってい
ますどの戦略がうまくいくのかってのはま
結構楽しみだなという風に思いますで今回
の主役であるええミラルAIの最新の
モデルえミストラルラージなんですけども
こちらも残念ながらモデルは公開されてい
ませんつまりオープンソースではないと
いうことですでミストラルAIの理念とし
てはオープンであるということを掲げてた
のでこれまでは色々とモデルを公開して
くれてたんですけどもさすがに
Microsoftとかと組み始めると
契約とかでもうモデルをオープンに公開
できないとかそういう風になってしまって
もおかしくないかもしれませんでここら辺
はオーAIと同じような道筋をたどるのか
というのは気になるポイントですねで
ミスタラジの特徴としてはえ日本語には
あまり最適化されてないというところが
あげられますでここにもあるんですけども
え現在は英語とかフランス語とかえ
スペイン語とかですね主にヨーロッパ県の
人に向けたモデルという感じがしますね
ただ使ってみた感じ日本語では返答返して
くれるので学習データとしては日本語も
使われているようですあとはえ入力できる
プロンプトもえ
3万2000円AIのページでこのラージ
のモデルを使うことができるのでえ実際に
使っていきたいと思い
ますはいこちらがえミストラルAIの公式
のページになっていますえ右上のえ
ニュースのところから下の方見てもらうと
最新のアップデート内容が確認できますで
こちらは先ほど紹介したえミストラル
ラージについて書かれていますでもう1つ
同じ日にえリチャットと呼ばれるえ
ミストラルAIのモデルを使えるえ
チャットのインターフェイスというのが
リリースされました今回そちらを使ってみ
たいと思いますで右上のこのリチャットと
言われるところを押すとえチャットの
インターフェイスに遷移しますで使い方に
関してはえチャットGPTと基本的に同じ
なのでえ特に説明する必要ないと思うん
ですけどもここにプロンプと打っていき
ますえこんにちはと打ってみ
ましょうはいそうするとえこんな感じで
生成されますで生成速度も結構早いのかな
という風な感じがしますねただ先ほど説明
したようにえまだ日本語では最適化されて
ないのでこんな感じでえ英語も出力されて
しまいますでこれははもうどうしようも
ないことなんですけどもえ
例えばでプロンプトの中にま必ず全て日本
語で返答してくださいという風にするとま
おそらくですね日本語で返してくれるん
じゃないかと思い
ますあでもやっぱり難しいですねこの日本
語の文章と同じ意味の英語がえなぜか生成
されてしまうという感じになってしまって
ますねただえ日本語の文章を生成できてる
のでまだ最適化されてないけども学習
データの中には日本語が含まれてそうです
ねでこれ今ミストラルラージを使ってるん
ですけどもえ他のミストラルAIのモデル
使いたかったらこの右上のところからえ
ラージとかNEXTと言われるモデルだっ
たりとかえスモールというモデルを使っ
たりできますはいこんな感じでえリチャで
えミストラルAIのモデルが使えますはい
ミスタラジのモデルに関してはえ
PowerXTIでも使うことができます
でPowerXTI知らないという方は
こちらの動画で私が激押ししてますので
興味があったら見てみてくださいで
Powerxtaの方で使うには左下の
このハグ車マークのところから下の方に
行ってもらうとこのAIモデルというのが
選択できるのでえここでミストラルラージ
を選択しますはいあと余談なんですけども
え以前powerplexTIの動画を
あげてからえ皆さん私の紹介コードを使っ
てpowerplexTI申し込んでくれ
たみたいでえなんと75人もえ申し込んで
くれたようでしたえありがとうございます
でこれPowerxtaの中で使えるえ
10$のクーポンになるので毎月え10$
支払いから減るというところで75ヶ月間
え10$でPowerブレックステアを
使えると約6年間ぐらいですかね皆さん
ありがとうございます今後もパプレST
使い続けて何かあったらえ皆さんにお伝え
していこうと思いますはいちょっと余談
だったんですけどもえモデルをミストラル
ラジにえ選択したらえホーム画面に戻り
ますはいここで普通にチャットをしていき
ますはいミストラルAIとはどんな会社な
のか教えてくださいという風に打ってみ
ますそうするとこんな感じでえミストラル
ラジのモデルが使われて回答が生成され
ますはいちゃんとこの右下のところで
ミストラージのモデルが使われて回答が
生成されてますねはいこれを見ると先ほど
は英語で帰ってきたりしてたんですけども
情報源が日本語だからなのかちゃんと自然
な日本語で回答を生成してるようですね
はいでここから分かるのはえ言語モデルが
日本語に最適化されてなくても参照してる
情報がえ日本語であればある程度実用的な
レベルで日本語を生成できるというところ
が分かるかと思いますなのでこの
ミストラルラージがめちゃくちゃ安くなっ
たりしたらこういう外部情報を参照させる
という用途の中では割と使えるのかなと
いう風に思いますはい皆さんはどういう風
に感じたでしょうか感想とかあったらです
ねコメントの方で教えてくださいはい以上
で本日の動画を終了したいと思いますえ
この動画良かったなっていう風に思う人は
高評価コメントチャンネル登録の方
よろしくお願いしますゆもやってますので
概要欄から見てみてくださいえそれでは
また次回の動画でお会いしましょうバイ
[音楽]
[音楽]
バイ
浏览更多相关视频
Meet Claude 2 : Anthropic's NEXT GEN Supercharged Model
New AI Chatbot - Claude 2 - is Free and Outperforms ChatGPT
What's the BEST AI For Language Learning? (CLEAR winner)
ChatGPT Explained Completely.
Groq AI SEO: How to Rank #1 in 24 Hours (FREE Tool!)
用 Zapier 兩分鐘3個Keywords找40頁資料,給 Gemini 引用寫 SEO 千字文
5.0 / 5 (0 votes)