GPT4のライバル登場?Mistral AIについて解説してみた

にゃんたのAI実践チャンネル
2 Mar 202411:56

Summary

TLDRThe video discusses Anthropic, an AI startup known for developing a language model called Claude. It provides an overview of the company, its growth and partnerships, comparing it to competitors like OpenAI. The narrator demonstrates using Claude in a chat interface and discusses its strengths and weaknesses for Japanese language use.

Takeaways

  • 😀 Mistral AI is a Paris-based startup focused on developing large language models
  • 🤔 Mistral AI was founded by ex-Meta and Google employees and recently raised billions of yen in funding
  • 📈 Mistral's models are ranked very highly, second only to OpenAI's GPT models
  • 🌎 Mistral AI believes in openness and has open sourced some models
  • 🤝 Microsoft partnered with Mistral AI to provide access to their models in the cloud
  • 🔬 Mistral's latest model, Mistral Large, is benchmarked to be the 2nd most capable model in the world
  • 💰 Accessing Mistral Large currently requires payment to use their API
  • 🌐 Mistral Large is optimized for European languages so far, not Japanese yet
  • 😊 The Mistral chat interface provides convenient access to test Mistral's models
  • ✨ Mistral AI has potential to keep advancing and stay near the top with models like GPT

Q & A

  • What is Mistral AI?

    -Mistral AI is a French startup based in Paris that develops large language models, similar to OpenAI's GPT models.

  • Why has Mistral AI been gaining attention recently?

    -Mistral AI has developed language models that are reported to be close to GPT-4 in performance, making them the second most capable models behind OpenAI.

  • What is unique about Mistral AI's models?

    -Mistral AI releases many of their models as open source, allowing anyone to freely download and use them.

  • Why did Microsoft partner with Mistral AI?

    -By partnering, Microsoft gains access to Mistral AI's state-of-the-art models to offer through its cloud services. Microsoft also invested over $2 billion into Mistral AI for future model development.

  • How well does Mistral AI's models currently support Japanese?

    -The models are not yet optimized for Japanese. They can generate some Japanese responses but also mix in English unexpectedly.

  • What is Mistral Large (LaMDA) model?

    -LaMDA is Mistral AI's latest and most capable model to date, claimed to be the 2nd most powerful model behind GPT-4.

  • Is Mistral Large (LaMDA) available publicly?

    -No, unlike some previous Mistral models, LaMDA has not been released as open source.

  • Can LaMDA be tested through Mistral AI's website?

    -Yes, Mistral AI offers a public chatbot interface that allows testing LaMDA, NEXT and other models.

  • How well does LaMDA perform in Japanese currently?

    -When provided Japanese informational context, LaMDA can generate fairly coherent Japanese responses, though optimization for Japanese is still limited.

  • What are some potential future applications if Mistral AI's models progress further?

    -The models could become extremely useful in areas like search, question answering, and content generation if progress continues and pricing becomes more affordable.

Outlines

00:00

📣 Introduction to Mistral AI and Its Significance

The video begins with the announcement of a partnership between Microsoft and Mistral AI, hinting at the potential affordability and usefulness of Mistral AI's technology. The speaker, Chine, introduces the topic of the video: understanding who Mistral AI is. Mistral AI has recently made news for developing a high-performance language model. The AI industry is currently competitive, with major companies like Google, Meta, and OpenAI (known for developing ChatGPT) leading the charge. Mistral AI is presented as a strong contender, possibly second only to OpenAI. Founded by former employees of Meta and Google's DeepMind, Mistral AI is a French startup focusing on developing large-scale language models. They have quickly gained attention by raising significant funding shortly after their establishment. Notably, Mistral AI supports open-source development, offering their models on platforms like Hugging Face for public use. This open-source approach allows for secure, customizable use, particularly important for companies handling sensitive information. Despite the current dominance of OpenAI's GPT-4, which is not open-source, Mistral AI's models have shown promising performance, suggesting a bright future for the company in the AI field.

05:01

🌐 Mistral AI's Evolution and Microsoft Partnership

The narrative continues with an explanation of Mistral AI's recent developments, including the launch of a new, high-performance model named Mistral Large, which boasts impressive capabilities, positioning it as the world's second-best in terms of performance. The script discusses the partnership between Microsoft and Mistral AI, which allows the use of Mistral AI's latest models on Microsoft's cloud services and includes a substantial investment from Microsoft for future model development. This partnership highlights Microsoft's strategic positioning, utilizing the top AI models to diversify its portfolio and mitigate risks. The script also touches upon the strategies of different tech companies in the AI space, with Microsoft choosing partnerships over developing proprietary models, contrasting with Google's and Meta's approaches. The video script concludes with an anticipation of Mistral AI's future impact, considering its principles of openness and the challenges of maintaining this ethos while partnering with major corporations like Microsoft.

10:03

🔍 Practical Use and Optimizations of Mistral AI's Models

The final section delves into the practical application of Mistral AI's models, specifically the Mistral Large model, and discusses its optimizations and limitations, particularly regarding language support. Despite being less optimized for Japanese, the model shows potential for practical use by referencing external information in Japanese, suggesting versatility in its applications. The speaker also shares their experience with Mistral AI's models through the Richat interface and discusses the ability to select different models for various needs. Additionally, the script mentions a promotional aspect where the speaker's referral code for PowerplexTI, a platform supporting Mistral AI's models, has been widely used, offering financial benefits to both the speaker and the users. The video concludes with an invitation for viewer feedback and encourages engagement with future content.

Mindmap

Keywords

💡language model

A language model is an AI system that can analyze, understand, and generate human language. The video discusses Mistrial AI's development of large language models that can have conversations. They aim to create models as capable as OpenAI's GPT-4.

💡OpenAI

OpenAI is the leading AI research company known for creating ChatGPT and other powerful language models. Mistrial AI is presented as the main competitor to OpenAI in developing the most advanced conversational AI.

💡ChatGPT

ChatGPT is OpenAI's conversational AI chatbot that can have natural conversations and generate human-like text. The video compares Mistrial AI's models to ChatGPT.

💡GPT-4

GPT-4 is OpenAI's latest unpublished language model expected to be more powerful than ChatGPT. Mistrial AI claims their new Mistrial Large model is the 2nd most capable model after GPT-4.

💡natural language processing

Natural language processing allows AI systems to analyze and generate human language. Large language models from OpenAI and Mistrial AI demonstrate advanced natural language processing abilities.

💡conversational AI

Conversational AI refers to systems like chatbots that can engage in dynamic dialogues with humans. The video focuses on Mistrial AI's development of conversational AI models.

💡text generation

Text generation is an AI technique for automatically creating coherent written texts. Language models like those from Mistrial AI and OpenAI showcase state-of-the-art text generation capacities.

💡cloud computing

Cloud computing provides on-demand internet services like compute power and storage. The partnership with Microsoft will allow Mistrial AI models to be accessed via Microsoft's cloud platform Azure.

💡natural language understanding

Natural language understanding allows AI systems to comprehend and interpret human language. Advanced language models demonstrate increasing natural language understanding to have meaningful conversations.

💡deep learning

Deep learning uses neural networks to learn complex patterns for language modeling and other AI tasks. Mistrial AI leverages deep learning to create its conversational AI models.

Highlights

ミストラルAIはフランスのパリに拠点を置くスタートアップの会社。主に大規模言語モデルの開発を行う。

ミストラルAIは元々メタで働いていた人とGoogleのDEEPMINDで働いていた人が共同で設立。

ミストラルAIの言語モデルの特徴はオープンソースで、誰でも自由にダウンロードして使えること。

最も精度が高いのはオープンソースでないOpenAIのGPT-4で、ミストラルAIのモデルが2番目の性能。

ミストラルラージは現在世界で2番目に性能が高い言語モデルと主張されている。

MicrosoftがミストラルAIとパートナーシップを結び、MicrosoftのクラウドでミストラルAIのモデルを利用可能に。

MicrosoftはOpenAIともパートナーシップを結んでいるため、世界1位と2位の言語モデルを利用可能。

残念ながらミストラルラージはオープンソースではなく、利用するにはミストラルAIにお金を払う必要がある。

ミストラルラージは英語などヨーロッパ言語向けに最適化されているが、日本語もある程度生成できる。

外部情報を参照させる用途なら、ミストラルラージが安くなれば割と使える可能性がある。

Microsoftの戦略は自身でモデルを開発せず、OpenAIやミストラルAIと組むこと。

Googleは自身のモデルであるPaLMを開発しオープンソースで公開する戦略。

メタはラマというモデルを開発しオープンソースで公開する戦略。

どの企業の戦略が成功するかが楽しみなポイントだ。

Transcripts

play00:00

先日MicrosoftとミストラルAI

play00:02

がえパートナーシップを結ぶということが

play00:04

発表されましたこれミストラルラージが

play00:07

めちゃくちゃ安くなったりしたら割と

play00:08

使えるのかなという風に思いますはい皆

play00:11

さんこんにちはチネです本日はミストラル

play00:14

AIって何者なのってテーマで話して

play00:16

いこうと思いますえ最近ミストラルAIと

play00:19

いう会社からかなり性能が高い言語モデル

play00:21

が開発されたというところでニュースに

play00:23

なったんですけどもそもそもミタルAI

play00:24

って何なんだろうという人いないでしょう

play00:26

か現在の生成AI界隈ではえチャットG

play00:30

PTを開発したOpenAIを初めとして

play00:32

Googleとかメタ社とかえいろんな

play00:34

企業が攻めぎ合っている状態になってい

play00:36

ますで今回紹介するミストラルAIはオ

play00:39

OpenAIの次に強いのでないかという

play00:41

風に言われてる会社になっていますでオ

play00:43

AIも1年前はAIの研究者以外は

play00:46

ほとんどの人は知らなかったかと思います

play00:48

まなので本当数年で状況が変わっていくと

play00:50

いうのが今の生成ア業界なのでもしかし

play00:53

たらこのミストラルAIの時代が来ると

play00:55

いう可能性もあるかもしれませんはいそこ

play00:57

で今回はこのミストラルAIというのは

play00:59

どういういう会社で何が起きてるのかと

play01:01

いうことについて誰でも分かるように解説

play01:03

していきますえ最新の生成や業界について

play01:05

キャッチアップしたいという人はえぜひ見

play01:07

ていってもらえばと思いますそれでは早速

play01:09

やっていき

play01:13

ましょうで最初にえミストラルAIって

play01:15

どんな会社ってことなんですけどもえ

play01:17

ミストラルAIはフランスのパリに拠点を

play01:19

置くスタートアップの会社になっていてえ

play01:21

主に大規模原語モデルの開発を行ってい

play01:24

ますつまりオOpenAIのチャット

play01:26

gpdみたいにえ独自の言語モデルを開発

play01:28

してるとえそういった会社のなっています

play01:30

でこのミストラルAIは元々メタ社で働い

play01:33

てた人とえGoogleのDEEP

play01:35

mindというところで働いてた人が共同

play01:37

で設立した会社になっていますで去年設立

play01:40

されたようなんですけども設立してから

play01:42

すぐに数100億円の資金調達をしていて

play01:45

話題になっていましたでミタルAIの言語

play01:47

モデルの特徴としてはオープンソースと

play01:49

いうところがあげられますでオープンソー

play01:52

スっていうのは開発したAIのモデルが

play01:54

公開されていて誰でも自由にダウンロード

play01:57

してきて使えるというものになっています

play01:59

例えばオープンソースのモデルが公開され

play02:01

ているプラットフォームとしてはこちらの

play02:03

ハギングfaceというところが1番有名

play02:05

ですでハギングフェスではこんな感じでえ

play02:08

ミストラルAIのページに行くといろんな

play02:10

モデルが公開されていてここからえ自由に

play02:13

モデルをダウンロードすることができます

play02:15

例えばえこちらの言語モデルだったらえ

play02:17

もうすでに100万回以上ダウウンロード

play02:18

されて使われてるというのが分かりますで

play02:21

こういう風にえ自由にモデルを

play02:23

ダウンロードできると何が嬉しいのかと

play02:25

いうことなんですけども例えばえ会社で

play02:27

チットGPTを使おうとした時に入れ

play02:29

ちゃいいけない情報ってのがあったりし

play02:31

ますよね例えば個人情報とか車内の機密

play02:34

情報とかそういったものを入れてしまうと

play02:36

情報漏洩になってしまうのでえ禁止され

play02:38

てるという会社が多いかと思いますでそう

play02:40

いった場合もえこういったオープンソース

play02:42

のモデルだったら原理上はえ自分の

play02:44

パソコンにダウンロードしてきて使うこと

play02:46

ができるのでセキュリティとかをえ特に気

play02:48

にせず使うことができるというわけです

play02:50

じゃあオープンソースのモデルを使えば

play02:51

いいじゃんという風に思うと思うんです

play02:53

けどもえ現状最も精度が高いのはオープン

play02:56

ソースとしてモデルを公開していない

play02:58

オープAIのGGPT4ということでえ

play03:01

みんなこちらを使ってるというわけですね

play03:03

でオープAIなのにえ全然AIをオープン

play03:06

にしないじゃないかというところでSNS

play03:08

上では少し批判されてたりしますはい少し

play03:11

脱線しましたがでこちらは

play03:13

アーティフィシャルアナリシスという

play03:14

サイトにあるいろんな言語モデルの制度を

play03:16

まとめた図になっていますで1番左の図が

play03:19

様々なテストのえ総合的な能力を評価した

play03:22

結果になっていてGPT4のターボがま

play03:24

やっぱりダトで高いという結果になってい

play03:26

ますそしてその次にえミタルミディアムと

play03:29

モデルが来ていますでこれが先ほど紹介し

play03:31

たミラルAIが開発した言語モデルになっ

play03:34

ていますなのでミラルAIが開発した

play03:37

モデルとOpenAのGPT4っていうの

play03:39

がかなり制度的に近いということが分かり

play03:41

ますねただ残念ならはえこのミストラル

play03:43

ミディアムに関しては現状オープンソース

play03:46

ではありませんなのでこのモデルを使うに

play03:48

はえミラルAIにお金を払わないといけ

play03:50

ないというモデルになっていますはいで

play03:52

順位としてはまその次にハロピックの

play03:55

chow2.0とGoogleのjem

play03:57

Proといずれもオープンソースではない

play03:59

モデルになっていますそしてこちらがえ

play04:01

ミストラル87bということでま少し言い

play04:04

にくいんですけどもミストラルじゃなくて

play04:06

えミストラルというモルになっていますで

play04:08

これは先ほど紹介したえハギングフェス

play04:11

からダウンロードできるモデルになってい

play04:12

てつまりオープンソースのモデルという風

play04:14

になっていますで真ん中もえ右も異なる

play04:17

試験で評価した結果なんですけども全体的

play04:20

にこのオレンジのミストラルAIのモデル

play04:22

たちがかなりいい線行ってるというのが

play04:24

分かるかと思いますはいそしてつい先日え

play04:27

先ほどのミストラルミディアムを超えるえ

play04:29

ミタラージというモデルが登場しましたで

play04:32

このモデルはえ当然ミストラルミディアム

play04:34

よりもえ精度が良くなっていてGPT4に

play04:36

はえ及ばないようなんですけども世界で2

play04:39

番目に性能が高いモデルだということが

play04:41

主張されていますでちなみに評価してる

play04:44

モデルはAPIとして公開されてるモデル

play04:46

に限定していますなのでプログラミングが

play04:48

使用できるモデルに限定されてるという

play04:50

ことですちなみに先日紹介したえ

play04:52

Googleのjemウルトラではこちら

play04:54

のmmlのテストで90%というスコアを

play04:58

歌っていましたがジミニウルトラはえまだ

play05:00

APIが公開されてないのでプログラム

play05:02

から使用することはできませんあとは評価

play05:05

の仕方に少し疑惑があったりするのでそこ

play05:07

ら辺が気になるという人は以前の動画で

play05:09

解説してるのでそちらを見ていただければ

play05:11

と思いますはいで他にもまいろんなテスト

play05:14

項目で評価されていてえ総合的に見て今回

play05:17

出たミスタラージはえ結構強そうですで

play05:20

こちらはえいろんなモデルでまいろんな

play05:22

テストをした結果になってるんですけども

play05:24

1番上のえミストラルラージを見てみると

play05:26

かなり性能が高いというのが分かるかと

play05:28

思いますさすがにGPT4には勝てないと

play05:31

いう感じはするんですけども少なくともえ

play05:33

GPT3.5よりも強いという感じに見え

play05:36

ますねで創業してから1年しか経ってない

play05:38

スタートアップでここまで来てるというの

play05:40

はま結構夢がありますよねまだオーAIに

play05:43

は及びませんが言語モデルで添加を取るか

play05:45

もしれない有力な会社の1つかと思います

play05:48

はいそしてえそんな会社をほっとかないの

play05:50

がMicrosoftということで先日

play05:52

MicrosoftとミラルAIがえ

play05:54

パートナーシップを結ぶということが発表

play05:57

されましたこのパートナーシップによって

play05:59

えMicrosoftが提供しているえ

play06:01

クラウドサービス上でミストラルAIの

play06:03

最新のモデルが使えるようになったりとか

play06:05

今後ミストラルAIがモデルを開発する

play06:08

ために200億円以上投資するという

play06:10

ところを決めてるようです

play06:11

Microsoftちょっとすごいなって

play06:13

風に思いませんかMicrosoftは

play06:15

オーAIともパートナーシップを結んでい

play06:17

ますまなのでMicrosoftの

play06:19

サービスで世界1位と世界2位のモデルを

play06:22

使えるというわけですねオOpenAIと

play06:24

組んでるだけでも強いのにちゃんとえ2位

play06:27

のミストラルAIとも組むというのはオ

play06:29

OpenAIがえ越された時のリスク分散

play06:32

もできていてまさすがだなという風な感じ

play06:34

がしますよねでアメリカのテック企業は

play06:36

各社別々の戦略を取っていて

play06:38

Microsoftはえ自分たちでは原語

play06:40

モデルを開発しないとオOpenAIと

play06:42

ミストラルAIとパートナーシップを組ん

play06:44

でいてGoogleに関してはジェミニを

play06:46

開発してるとでメタシに関してはラマと

play06:49

いうモデルを開発していてそれをオープン

play06:51

ソースで公開してるという形になってい

play06:53

ますどの戦略がうまくいくのかってのはま

play06:55

結構楽しみだなという風に思いますで今回

play06:58

の主役であるええミラルAIの最新の

play07:00

モデルえミストラルラージなんですけども

play07:02

こちらも残念ながらモデルは公開されてい

play07:05

ませんつまりオープンソースではないと

play07:07

いうことですでミストラルAIの理念とし

play07:09

てはオープンであるということを掲げてた

play07:12

のでこれまでは色々とモデルを公開して

play07:14

くれてたんですけどもさすがに

play07:16

Microsoftとかと組み始めると

play07:17

契約とかでもうモデルをオープンに公開

play07:20

できないとかそういう風になってしまって

play07:21

もおかしくないかもしれませんでここら辺

play07:23

はオーAIと同じような道筋をたどるのか

play07:26

というのは気になるポイントですねで

play07:28

ミスタラジの特徴としてはえ日本語には

play07:31

あまり最適化されてないというところが

play07:33

あげられますでここにもあるんですけども

play07:35

え現在は英語とかフランス語とかえ

play07:37

スペイン語とかですね主にヨーロッパ県の

play07:40

人に向けたモデルという感じがしますね

play07:42

ただ使ってみた感じ日本語では返答返して

play07:45

くれるので学習データとしては日本語も

play07:47

使われているようですあとはえ入力できる

play07:50

プロンプトもえ

play07:58

3万2000円AIのページでこのラージ

play08:00

のモデルを使うことができるのでえ実際に

play08:02

使っていきたいと思い

play08:04

ますはいこちらがえミストラルAIの公式

play08:07

のページになっていますえ右上のえ

play08:09

ニュースのところから下の方見てもらうと

play08:11

最新のアップデート内容が確認できますで

play08:14

こちらは先ほど紹介したえミストラル

play08:16

ラージについて書かれていますでもう1つ

play08:18

同じ日にえリチャットと呼ばれるえ

play08:21

ミストラルAIのモデルを使えるえ

play08:23

チャットのインターフェイスというのが

play08:24

リリースされました今回そちらを使ってみ

play08:27

たいと思いますで右上のこのリチャットと

play08:29

言われるところを押すとえチャットの

play08:33

インターフェイスに遷移しますで使い方に

play08:35

関してはえチャットGPTと基本的に同じ

play08:37

なのでえ特に説明する必要ないと思うん

play08:39

ですけどもここにプロンプと打っていき

play08:41

ますえこんにちはと打ってみ

play08:44

ましょうはいそうするとえこんな感じで

play08:47

生成されますで生成速度も結構早いのかな

play08:50

という風な感じがしますねただ先ほど説明

play08:52

したようにえまだ日本語では最適化されて

play08:55

ないのでこんな感じでえ英語も出力されて

play08:57

しまいますでこれははもうどうしようも

play08:59

ないことなんですけどもえ

play09:04

例えばでプロンプトの中にま必ず全て日本

play09:08

語で返答してくださいという風にするとま

play09:10

おそらくですね日本語で返してくれるん

play09:12

じゃないかと思い

play09:14

ますあでもやっぱり難しいですねこの日本

play09:18

語の文章と同じ意味の英語がえなぜか生成

play09:21

されてしまうという感じになってしまって

play09:22

ますねただえ日本語の文章を生成できてる

play09:25

のでまだ最適化されてないけども学習

play09:28

データの中には日本語が含まれてそうです

play09:30

ねでこれ今ミストラルラージを使ってるん

play09:32

ですけどもえ他のミストラルAIのモデル

play09:34

使いたかったらこの右上のところからえ

play09:36

ラージとかNEXTと言われるモデルだっ

play09:39

たりとかえスモールというモデルを使っ

play09:40

たりできますはいこんな感じでえリチャで

play09:43

えミストラルAIのモデルが使えますはい

play09:45

ミスタラジのモデルに関してはえ

play09:47

PowerXTIでも使うことができます

play09:49

でPowerXTI知らないという方は

play09:52

こちらの動画で私が激押ししてますので

play09:54

興味があったら見てみてくださいで

play09:56

Powerxtaの方で使うには左下の

play09:58

このハグ車マークのところから下の方に

play10:00

行ってもらうとこのAIモデルというのが

play10:02

選択できるのでえここでミストラルラージ

play10:05

を選択しますはいあと余談なんですけども

play10:07

え以前powerplexTIの動画を

play10:09

あげてからえ皆さん私の紹介コードを使っ

play10:11

てpowerplexTI申し込んでくれ

play10:13

たみたいでえなんと75人もえ申し込んで

play10:16

くれたようでしたえありがとうございます

play10:18

でこれPowerxtaの中で使えるえ

play10:20

10$のクーポンになるので毎月え10$

play10:23

支払いから減るというところで75ヶ月間

play10:26

え10$でPowerブレックステアを

play10:27

使えると約6年間ぐらいですかね皆さん

play10:30

ありがとうございます今後もパプレST

play10:32

使い続けて何かあったらえ皆さんにお伝え

play10:34

していこうと思いますはいちょっと余談

play10:36

だったんですけどもえモデルをミストラル

play10:38

ラジにえ選択したらえホーム画面に戻り

play10:41

ますはいここで普通にチャットをしていき

play10:44

ますはいミストラルAIとはどんな会社な

play10:47

のか教えてくださいという風に打ってみ

play10:48

ますそうするとこんな感じでえミストラル

play10:51

ラジのモデルが使われて回答が生成され

play10:55

ますはいちゃんとこの右下のところで

play10:58

ミストラージのモデルが使われて回答が

play11:00

生成されてますねはいこれを見ると先ほど

play11:03

は英語で帰ってきたりしてたんですけども

play11:05

情報源が日本語だからなのかちゃんと自然

play11:07

な日本語で回答を生成してるようですね

play11:10

はいでここから分かるのはえ言語モデルが

play11:12

日本語に最適化されてなくても参照してる

play11:15

情報がえ日本語であればある程度実用的な

play11:18

レベルで日本語を生成できるというところ

play11:20

が分かるかと思いますなのでこの

play11:22

ミストラルラージがめちゃくちゃ安くなっ

play11:24

たりしたらこういう外部情報を参照させる

play11:26

という用途の中では割と使えるのかなと

play11:29

いう風に思いますはい皆さんはどういう風

play11:31

に感じたでしょうか感想とかあったらです

play11:33

ねコメントの方で教えてくださいはい以上

play11:35

で本日の動画を終了したいと思いますえ

play11:36

この動画良かったなっていう風に思う人は

play11:38

高評価コメントチャンネル登録の方

play11:39

よろしくお願いしますゆもやってますので

play11:41

概要欄から見てみてくださいえそれでは

play11:42

また次回の動画でお会いしましょうバイ

play11:44

[音楽]

play11:52

[音楽]

play11:55

バイ