GPT-4超えのLLM「Claude 3」詳細/ChatGPTの新機能~回答読み上げ・数学強化~/Soraの最新情報~最新動画と論文~【今週公開の最新AIツール&ニュース】

AI大学【AI&ChatGPT最新情報】
6 Mar 202420:42

Summary

TLDRこの動画では、AIの最新動向と新しいツールが紹介されています。Anthropicの大規模言語モデルCL3、ChatGPTの新機能、OpenAIの動画生成AI「Stable Diffusion」、MicrosoftのAIアシスタントCopilot、Windowsの新しいAI機能などが取り上げられています。また、中国でのStable Diffusionのオープンソース化プロジェクト、OpenAIの内部文書流出の噂、AIチャットボットを狙うマルウェアなどの注目すべきニュースも報告されています。視聴者に最新のAI動向を包括的に伝えるための、情報満載の動画となっています。

Takeaways

  • 🤖 AnthropicのCL3は有名ベンチマークでGPT-4を超える性能を持ち、強力な画像分析機能や長文入力に対応している。
  • 🗣 ChatGPTに回答の音声読み上げ機能と数学問題への対応が追加された。
  • 🎥 OpenAIの動画生成AI「Anthropic」について、中国の研究者がオープンソース版を開発中。
  • 🔍 Copilot がPDF、PowerPoint、Excelファイルの分析機能を追加。
  • 💻 Windows 11にCopilorのプラグインや画像/動画編集のAI機能が実装予定。
  • 🎵 Adobeが音楽生成AIツール「Project Musingene」を発表。
  • 🖼 「Layer Diffusion」技術で透明レイヤーを含む画像生成が可能に。
  • 🔊 オープンソースの高速音声合成AIツール「Molt TTS」が公開。
  • 🖌 テキスト入力でステッカーを生成する「Sticker Baker」が公開。
  • 🌐 中国のAI企業Emosが3D生成AIツール「Rudance 1」のベータ版リリスト公開。

Q & A

  • CL3がどのようなAIモデルであるか説明してください。

    -CL3はAI企業アンソロピックが開発した大規模言語モデルの最新バージョンです。オーパス、ソネット、俳句の3つのモデルがあり、オーパスはGPT-4やGoogle Jemini 1.0を超える性能を持つとされています。3つのモデルともに強力な画像分析機能を備えており、最大20万トークンの入力に対応できます。

  • CL3はどのように利用できますか?

    -CL3はアンソロピックの公式サイトからアクセスできます。無料版のソネットではGoogleアカウントでログインすれば利用可能で、有料版のCL Proに登録するとオーパスが使えます。APIも公開されています。

  • ChatGPTの新機能としてどのようなものが追加されましたか?

    -2つの新機能が追加されました。1つ目は「Read Out」と呼ばれる回答の読み上げ機能で、男女5名の音声から選択できます。2つ目は数学の問題解決能力が向上し、難しい問題にも対応できるようになりました。

  • OpenAIの動画生成AI「Coma」についてどのような最新情報がありますか?

    -空の性能を検証した論文が公開され、実世界の物理法則に基づく高い忠実度で動画を生成できることが確認されました。また、OpenAIのメンバーがサンプル動画を公開し、空の可能性を示しました。さらに中国で空のオープンソース版の開発プロジェクトが立ち上がりました。

  • Microsoft Copiloitの新機能は何ですか?

    -Copiloitに、PDF、PowerPoint、Excel、Wordファイルを読み込んで分析できる機能が実装されました。ファイルをアップロードし、内容を要約したり分析するよう依頼できます。

  • Windows 11にどのようなAI機能が追加される予定ですか?

    -Copiloitに音楽生成やレシピ生成などのプラグインが実装され、様々な指示ができるようになります。また、写真編集アプリにAIによる不要物削除機能、動画編集アプリに無音部分削除機能が追加される予定です。

  • Adobeの新しいAIツール「Project MusicGenAI Control」の機能を教えてください。

    -Project MusicGenAI Controlは、テキストから音楽を生成したり、生成した音楽を編集できるAIツールです。生成したい音楽のイメージをテキスト入力すると音楽が生成され、波形やスペクトログラムを使って編集が可能です。

  • 「Layer Diffusion」とはどのようなAI技術ですか?

    -Layer Diffusionは、画像生成AIで透明な単一レイヤーや複数レイヤーを生成できる技術です。これにより、透明背景の画像と背景画像を別々に生成し、後から合成することができます。

  • 「MelioTTS」はどのようなAIツールですか?

    -MelioTTSはオープンソースの高速音声合成AIツールで、英語、日本語、中国語など複数言語をサポートしています。一般的なCPUでも動作し、無料デモサイトも提供されています。

  • 「StickerBaker」の機能を簡単に説明してください。

    -StickerBakerは、テキストを入力するだけでステッカーを生成できるオープンソースのAIツールです。デモサイトから自由にステッカーを作成・ダウンロードでき、他のユーザーの作品も検索できます。

Outlines

00:00

🤖 CL3の紹介とChatGPTの新機能

この段落では、Anthropicの大規模言語モデルCL3の紹介とChatGPTの新しい機能である回答の読み上げ機能と数学問題の解決能力の向上について説明しています。CL3には3つのモデルがあり、最上位のオーパスモデルは有名ベンチマークでGPT-4やPaLM2を上回る性能を示したとされています。CL3は強力な画像分析機能と長文入力対応できます。一方、ChatGPTには回答を読み上げる機能と数学問題をより適切に解く機能が追加されました。

05:01

🎥 OpenAIの動画生成AI「Anthropic」と新機能の紹介

この段落では、OpenAIの動画生成AIモデル「Anthropic」について紹介しています。中国の研究者らによる論文では、Anthropicが実世界の物理法則に基づいて高い忠実度で動画を生成できるとされています。OpenAIのメンバーがサンプル動画を公開し、YouTuberも動画を投稿していますが、一部で指の本数が異常な問題も指摘されています。また、MicrosoftのAIアシスタント「Copilot」に各種ファイルの読み込みと分析機能が追加され、Windows 11にもAI関連の新機能が実装される予定だと説明されています。

10:01

🎵 AdobeのAI音楽生成ツールと画像生成AIの新技術

この段落では、AdobeのAI音楽生成ツール「Project Music GenEN AI Control」と、画像生成AIに新たな機能を追加する「レイヤーディフュージョン」について説明しています。Project Music GenEN AI Controlではテキストからの音楽生成と編集が可能で、Adobe製品への実装が期待されています。一方、レイヤーディフュージョンは単一または複数の透明レイヤーを生成できる技術で、ステーブルディフュージョンなどの画像生成AIツールで活用できます。また、新しいWEBUI「Stable Diffusion web UI Fuji」にもレイヤーディフュージョンの一部機能が実装されているとのことです。

15:04

💬 AIチャットボットとAIグラスの最新情報

この段落では、AI音声合成ツール「Mello TTS」、AI動画生成ステッカージェネレーター「Sticker Baker」、3Dデータ生成AIツール「Rodin-1」などの最新AIツールについて説明しています。また、中国の研究者チームが動画生成AI「Anthropic」のオープンソース化に着手したこと、OpenAIの内部計画文書が流出した噂、AIチャットボットをターゲットにしたマルウェア「Morice 2」の開発、NVIDIAのノートPC向けGPU発表、OPPOのAIスマートグラスの発表などの最新ニュースも紹介されています。

20:04

🔗 動画のまとめと関連リンクの案内

最後の段落では、この動画で紹介した記事やツールなどのリンクが概要欄に貼られていることが伝えられています。AIツールに興味がある人は是非試してみるよう勧めています。次回の動画で再会することを約束して動画を締めくくっています。

Mindmap

Keywords

💡GPT-4

GPT-4は、OpenAIが開発した最新の大規模言語モデルです。GPT-3に続く新しい技術で、さらに高度な能力を持つとされています。この動画では、GPT-4を超える能力があるとされるアンスロピック社のCL3モデルと比較しています。

💡ChatGPT

ChatGPTは、OpenAIが開発した対話型AI言語モデルです。この動画では、回答の読み上げ機能や数学問題解決能力の強化など、ChatGPTに実装された新機能について紹介しています。

💡Anthropic

Anthropicは、OpenAIの元メンバーによって設立された米国のAIスタートアップ企業です。この動画で紹介されているCL3は、AnthropicがOpenAIのGPT-4を超える性能を持つとしている大規模言語モデルです。

💡CL3

CL3は、Anthropicが開発した大規模言語モデルの最新版です。オーパス、ソネット、俳句の3つのモデルがあり、画像分析や長文テキスト入力に対応していると紹介されています。GPT-4やGoogleの言語モデルを上回る性能を持つとされています。

💡マルチモーダル

マルチモーダルとは、複数のモダリティ(テキスト、画像、音声など)を扱える能力を指します。この動画では、CL3がテキストと画像の両方を扱えるマルチモーダル言語モデルであることが強調されています。

💡Copilot

Copilotは、Microsoftが提供する無料のAIチャットボットです。この動画では、Copilotにファイル読み込み・分析機能が追加されたことが紹介されています。PDF、PowerPoint、Excelファイルなどを読み込んで分析できるようになりました。

💡DALL-E 2

DALL-E 2は、OpenAIが開発した画像生成AIモデルです。この動画では、OpenAIの動画生成AI「Anthropic」とDLL-E 2の性能を比較した論文について触れられています。空がより高い一貫性と忠実度で動画を生成できるとの結論が示されたそうです。

💡空(Anthropic Video)

空は、OpenAIが発表した革新的な動画生成AIモデルです。この動画では、空の性能やサンプル動画、中国での空を再現するオープンソースプロジェクトなど、空に関する最新情報が多く取り上げられています。

💡レイヤーディフュージョン

レイヤーディフュージョンは、透明な背景レイヤーを生成できる新しいAI技術です。この動画では、レイヤーディフュージョンを使うと、ステーブルディフュージョンなどの画像生成AIで透明背景の画像を作れるよう になったと説明されています。

💡AI音声合成

AI音声合成とは、テキストから自然な音声を生成するAI技術のことです。この動画では、高速で複数言語に対応するオープンソースのAI音声合成ツール「メロTTS」と、Adobeの音楽生成AIツール「MusicGenAIControl」が紹介されています。

Highlights

アンソロピックは同社の大規模言語モデルの最新版CL3を公開し、CL3はGPT4などを超える性能を持つと主張している。

CL3は強力な画像分析機能を実装しており、20万トークンの入力に対応している。

チャットGPTに回答の読み上げ機能と数学問題の解答能力向上が実装された。

OpenAIの動画生成AI「空」の性能が高く評価されており、中国で空のオープンソース版が開発中。

Microsoftのコパイロットに様々なファイル読み込み・分析機能が追加された。

Windows 11にコパイロットの新機能やアプリにAI機能が実装予定。

Adobeがテキストから音楽生成・編集できるAIツール「MusicGenAIコントロール」を発表。

レイヤーディフュージョンという透明レイヤーを生成できるAI技術が開発された。

多言語対応の高速音声合成AIツール「メロTTS」がオープンソース公開された。

テキスト入力でステッカーを即座に生成する「ステッカーベーカー」が公開された。

中国のAI企業Emos社が3D生成AIツール「ロダンジ1」のベータ版リリースを予告。

中国の研究者チームが動画生成AI「空」のオープンソース再現プロジェクトを開始。

OpenAIの内部文書が流出し、2027年までの人工知能開発計画が明らかになったとの噂。

AIチャットボットを狙ったマルウェア「モリス2」が開発された。

NVIDIAがAI性能向上のノートPC向けGPUを発表。

Transcripts

play00:00

皆さんこんにちは今回の動画ではGPT4

play00:05

を超える能力とされるアピックの最新

play00:09

マルチモーダルllmCL3回答読み上げ

play00:14

数学機能強化などのチャットGPTの新

play00:18

機能オAIの動画生成AI空の最新映像と

play00:24

空と他の動画生成AIとの比較論文

play00:28

Microsoftの無料AIチャット

play00:30

ボットコパイロットにExelやパワポを

play00:33

読み込んで分析できる機能が実装などここ

play00:37

1週間の間にリリースされた最新のAI

play00:40

ツールの概要と使い方を紹介し中国で

play00:44

オープンソース版の空が開発開始オ

play00:47

OpenAIの内部資料が留出の噂など

play00:51

ai関連の最新ニュースをお届けします

play00:55

それではよろしくお願いし

play00:58

ます

play01:01

まずはCL3の紹介ですOpenAIの元

play01:05

メンバーによって設立された米国のAI

play01:08

スタートアップ企業アンソロピックは同社

play01:12

の大規模言語モデルの最新版CL3を公開

play01:16

しましたCL3はオーパスソネット俳句の

play01:22

3つのモデルが用意されていてCL3の

play01:26

プロジェクトページでは最上位版の

play01:28

オーパスについては有名ベンチマークの

play01:32

mmlUGPQAGSMKでオAIの

play01:38

GPT4やGoogleのjemi1.0

play01:42

ウルトラの数値を超えたとしており3

play01:45

モデルともに強力な画像分析機能を実装し

play01:48

ていて20万トークンの入力に対応してい

play01:52

ますク3はアンソロピックの公式トップ

play01:57

ページに行ってtalktoボタンを押し

play02:00

た後にGoogleアカウントなどを使っ

play02:03

てログインすれば注意モデルのソネットを

play02:06

無料で利用でき上部のフォームでチャット

play02:10

GPTと同じように質問するかフームの

play02:13

右側にあるクリップアイコンから画像を

play02:16

読み込んで分析してもらったりPDF

play02:19

ファイルを読み込んで要約してもらったり

play02:21

できます少し試しましたが回答速度は高速

play02:26

で日本語の質問にも違和感ない形で答えて

play02:30

くれましたし画像分析機能に関しても日本

play02:34

語の入った画像もしっかりと分析してくれ

play02:37

ましたただ日本語に関しては若干

play02:41

ハルシネーションが多いのが気になりまし

play02:43

たし数学の問題に関しては日本語だと

play02:47

間違えることが多かったのですが英語で

play02:51

質問すると正しい回答を出力してくれる

play02:54

ことが多かったですなおクロード3の最

play02:58

上位版であるオーパスについてはCLの

play03:01

有料版であるCLProに登録すれば利用

play03:05

できるようでオパスとソネットに対応した

play03:08

APIも公開されてい

play03:10

ます続いてはChatGPTの新機能の

play03:14

紹介です日々新しい機能が実装されている

play03:18

チットGPTに新機能が2点ほど追加され

play03:22

ました1つ目がチッGPTにリアウと呼ば

play03:27

れる回答の読み上げ機能が実装れました

play03:31

モバイルアプリ版では設定画面で男女5名

play03:34

の中の好きなボイスを設定してチャット

play03:37

GPTの回答を長押して出てきたポップ

play03:40

up画面でリアウの項目をタップすれば

play03:45

文章を読み上げてくれますWebブラウザ

play03:48

版のチャットGPTでは現状で実装されて

play03:52

いるのは一部ユーザーだけのようで回答の

play03:55

読み上げ機能が実装されている場合

play03:58

チャットGP画面の左下の設定ページに

play04:02

行くとスピーチという項目ができているの

play04:05

でそこで男女5名の中から好きなボイスを

play04:09

選択しチャットGPTからの回答の株に

play04:13

ある音声アイコンを押すと回答を音読して

play04:16

くれます英語と日本語の音読に対応して

play04:20

いることを確認しましたが日本語は正しく

play04:23

読んでくれない文字もあり若干不安定に

play04:27

感じました2つ目が

play04:30

海外のインフルエンサーの方が投稿して

play04:32

ネット上で話題になっていた件でかつて

play04:36

チャットGPTが苦手としていた数学の

play04:38

問題に関して現在は難しい問題も解ける

play04:43

ようになっておりチャットGPTに数学の

play04:46

問題かどうかを判断する数学分類機のよう

play04:50

なものが実装されて難しい数学問題が入力

play04:54

された場合には1手間かけて計算が実行さ

play04:57

れる処理が行われていると推測されてい

play05:00

ます数問試してみましたが過去GPT4で

play05:05

失敗していた問題も解けるようになってい

play05:07

ましたしSNS上でも数学能力が上がった

play05:11

という声が多いのでチャットGPTの数学

play05:15

能力は確実に上がっていると思われ

play05:18

ます続いては空の最新情報の紹介です先日

play05:24

OpenAIが発表したテキストや画像

play05:28

から動画をできる動画生成AIモデル空は

play05:33

各種メディアで取り上げられAI界隈で

play05:36

最もホットな話題となっていますここでは

play05:40

空の発表後にネット上で話題になった最新

play05:43

情報をまとめて紹介しますまず中国の研究

play05:48

者らによって有名画像生成AIツールの

play05:53

ランウージン2と科の性能を空と比較検証

play05:57

した論文が公開されましたこの論文によれ

play06:00

ば空は実世界の物理法則に基づいた高い

play06:05

忠実度で動画を生成する能力を持ち空に

play06:09

よって生成された動画はGEN2やピカと

play06:12

比較して圧倒的に一貫性を保持した動画を

play06:16

作れると結論付けられていましたまたオ

play06:20

OpenAIの空の開発メンバーがx上で

play06:25

空で作ったサンプル動画を積極的に公開し

play06:28

ていてニューヨークの街を歩くエイリアン

play06:31

の動画男女が未来的なデザインの

play06:34

レストランで食事をしている動画ドローン

play06:37

撮影のような感じで空から美術館の中に

play06:40

ズームインした後に美術館の中をドローン

play06:44

視点で巡っていく動画黒目が地球のように

play06:48

見える女性の目のアップ動画など空の無限

play06:51

の可能性を感じることのできる動画が公開

play06:54

されていましたそして米国の有名

play06:58

YouTuber

play07:00

マルケスブラウンリー氏が自身のX上で空

play07:03

で制作したとする動画を公開していました

play07:06

が生成された動画の中の男性の指が6本

play07:10

あったりとSNS上では空にも現在の画像

play07:16

生成AIの弱点とされている手の指を

play07:19

うまく表現できない問題があるのではない

play07:22

かと話題になっていました続いてはコ

play07:26

パイロットの新機能の紹介です

play07:29

Microsoftの無料で使えるAI

play07:31

チャットボットコパイロットに新機能とし

play07:35

てPDFPowerPOINTExcel

play07:39

Wordファイルを読み込んで分析して

play07:42

くれるChatGPTの有料版に実装され

play07:45

ているコードインタープリターのような

play07:48

機能が実装されましたMicrosoft

play07:51

アカウントでログインした状態でコ

play07:54

パイロットを立ち上げると新たにフォーム

play07:57

の中にクリップアイコンがが実装されて

play08:00

いるのでそこから各種ファイルを

play08:02

アップロードでき例えばPDFファイルを

play08:06

アップロードして内容を要約してもらっ

play08:09

たり売上データの入ったExelファイル

play08:12

をアップロードしてこのExcel

play08:15

ファイルを分析してくださいと入力して

play08:18

送信するとExcelファイルの内容を

play08:21

分析してくれたりします無料版のコ

play08:24

パイロットではアップロードできる

play08:26

ファイルのサイズは最大で1mとなってい

play08:29

ましたまた私の環境ではChromeで

play08:34

立ち上げたコパイロットにはクリップ

play08:36

アイコンが実装されていましたがエッジ

play08:39

ブラウザで立ち上げたコパイロットには

play08:41

クリップアイコンが表示されていません

play08:43

でした続いてはWindows11のAI

play08:48

機能の紹介です2024年2月下旬に

play08:53

Microsoftは同社のブログを更新

play08:55

し同社のPC向けの最新OS

play08:59

windows11に今後追加予定の機能

play09:02

を発表しましたここでは追加される機能の

play09:06

中からai関連の機能に絞って紹介します

play09:11

まずwindows11に実装されている

play09:14

AIチャットボットコパイロットに音楽

play09:18

生成スノレシピ生成インスタカートなどの

play09:22

プラグインが実装されて2024年3月

play09:26

下旬からコパイロット上でバッテリー

play09:29

セーバーをオンオフにする画面拡大鏡を

play09:33

起動するシステム情報を表示する利用可能

play09:37

なwi-fiネットワークを表示すると

play09:40

いった指示ができるようになるそうです

play09:44

さらにWindowsに標準実装されて

play09:47

いる画像編集アプリPHに画像の中から

play09:51

不要なものを選択して削除できるAI機能

play09:54

が実装され動画編集アプリクリップ

play09:58

チャンプにAIにによる無音部分除去機能

play10:00

が追加されるとのことですなお私の

play10:04

WindowsパソコンではまだPHアリ

play10:07

の不要部分除去機能の実装は確認できませ

play10:10

んでした続いてはadobの音楽生成AI

play10:15

ツールの紹介ですadobはテキストから

play10:19

音楽を生成したり生成した音楽を編集

play10:22

できる機能を実装したAIツール

play10:26

プロジクトMusicgenenAI

play10:28

コントロールを発表しましたADの公式

play10:31

YouTubeチャンネルでプロジェクト

play10:34

MusicgenenAIコントロールを

play10:36

実際に操作している動画が公開されており

play10:40

生成したい音楽のイメージをテキスト入力

play10:43

すると音楽が生成される形になっていて

play10:47

生成した音楽は波形やスペクトログラムを

play10:51

見ながら店舗を変えたりループさせたりと

play10:54

様々な編集ができるようですなお

play10:59

プロジェクトMusicgenenAI

play11:00

コントロールはまだ研究段階だということ

play11:03

で製品としてリリースされるかは未定です

play11:06

が将来的にadobのオーディオ編集

play11:10

ツールオーディションなどに実装される

play11:13

可能性がありそう

play11:15

です続いてはレイヤーディフュージョンの

play11:18

紹介です画像生成AIを使う際に特定の

play11:23

ポーズを指定できる機能コントロール

play11:26

ネットを開発した研究者らは単一の透明

play11:30

画像や複数の透明レイヤーを生成できる

play11:33

AI技術レイヤーディフュージョンを発表

play11:36

しましたレイヤーディフュージョンを使う

play11:39

とステーブルディフュージョンなどの潜在

play11:43

拡散モデルを使った画像生成AIツールの

play11:46

中でエヤ機能を使え透明背景のドラゴンと

play11:50

白の背景透明背景の犬と庭の背景といった

play11:55

感じで透明なレイヤーを含む画像を生成

play11:59

可能になり白の背景を作ってからドラゴン

play12:02

を追加するといったことができるように

play12:04

なりますレイヤーディフュージョンは

play12:07

キットハブにレポジトリが用意されている

play12:09

ので今後ソースコードが公開されると思わ

play12:13

れますちなみに2024年2月に公開され

play12:18

たステイブルディフュージョンの新しい

play12:20

WEBUIスイブルディフュージョン

play12:22

WEBUIフジではレイヤー

play12:25

ディフュージョンの一部機能が使えるよう

play12:28

です

play12:29

続いてはメロTTSの紹介です英語

play12:34

スペイン語フランス語中国語日本語韓国語

play12:39

などの他言語をサポートするオープン

play12:42

ソースの高速音声合成AIツールメロ

play12:46

TTSが公開されました一般的なCPUで

play12:50

も動作するのが特徴でソスコードはG

play12:53

HUBで提供されていますメロTTSの

play12:57

無料のデモがハフスで提供されていて

play13:01

ラゲージの部分で言語スピードの部分で

play13:04

読む速さを選択しテキストtoスピークの

play13:08

部分に喋らせたい文章を入力してシセ

play13:11

サイズボタンを押すと入力した文章を音声

play13:15

化したものが高速生成されますなおメロ

play13:19

TTSはパソコンのローカルで様々なAI

play13:23

ツールを起動できるアプリピノキオにも

play13:26

実装されていますTTSを日本語で何度か

play13:30

試したところ発音に関しては一部調整す

play13:34

べき箇所はありましたが生成速度はこれ

play13:38

まで試したテキストtoスピーチ系の

play13:40

ツールの中ではダトで早く長い文章も一瞬

play13:44

で音声化してくれました続いては

play13:48

ステッカーベーカーの紹介ですテキストを

play13:51

入力するだけで即座にステッカーが生成さ

play13:55

れるオープンソースのAIステッカー

play13:57

ジェネレーターステッカーベーカーが公開

play14:00

されましたgitHUBでソースコードが

play14:03

用意されていますステッカーベーカーを

play14:06

使える無料のデモも公開されていてデモ

play14:10

ページに行って上部のフォームに作りたい

play14:13

ステッカーのイメージをテキスト入力して

play14:17

ベークボタンを押すとステッカーが生成さ

play14:20

れ生成したステッカーをダウンロードでき

play14:23

ますなおデモ画面右上のサーチのボタンを

play14:27

押した先の画面でユーザーの作った

play14:30

ステッカーを検索できるよう

play14:32

です続いてはロダンジ1の紹介です中国の

play14:38

AI企業emosは以前より公式X上で

play14:42

進捗を投稿し続けていた1枚の画像から高

play14:46

精度な3Dデータを生成できるAIツール

play14:50

ロダンジ1の開発者用ベータ版への順番

play14:54

待ちリストを公開しましたメールアドレス

play14:57

などの必要事項をを入力すると順番待ち

play15:00

リストに登録できますまだ実際に触れる

play15:04

ツールが公開されていないので何とも言え

play15:06

ませんがdmosの公式Xや

play15:09

YouTube上で公開されている情報

play15:12

だけを見ると現状で公開されている3D

play15:16

生成AIツールと比べクオリティが格段に

play15:20

高いことが伺え

play15:22

[音楽]

play15:24

ますここからは今週発表されたai関連の

play15:29

ニュースを簡単にまとめて紹介しますまず

play15:33

は空のオープン化プロジェクトの話題です

play15:37

2024年2月に発表され各種メディアを

play15:41

巻き込んで大きな話題となっている

play15:43

OpenAIの動画生成AI空ですがこの

play15:48

度中国の北京大学の研究者を中心とした

play15:52

チームが空の動画生成モデルを忠実に再現

play15:56

することを目的にしたオープンソ

play15:59

プロジェクトを立ち上げましたギットハブ

play16:02

にはソースコードも用意されています相当

play16:05

数の研究者が関わっているプロジェクトの

play16:08

ようなので今後の展開に注目

play16:11

です続いてはオープンAIの内部文書が

play16:15

流出の噂です2024年3月上旬あるX

play16:21

アカウントがOpenAIが2027年

play16:25

までに人間レベルの汎用人工地のを開発

play16:29

するまでの過程を記した計画文書を公開し

play16:32

て話題になっています信頼できる公式情報

play16:36

ではないので都市伝説的な感じで紹介し

play16:39

ますがこの計画文書のPDFによると

play16:43

OpenOpenAIは2022年から

play16:46

アキスやQスターと呼ばれる125兆の

play16:50

パラメーターを持つマルチモーダルモデル

play16:52

のトレーニングを開始し2023年12月

play16:56

に訓練を終了してこれを2025年に

play17:00

GPT5としてリリースする予定でしたが

play17:04

高額な水論コストがかかるので中止になっ

play17:07

たといった内容でその他にもGPT4.5

play17:11

やGPT6GPT7絡みの話題も出てい

play17:16

ました続いてはAIチャットを狙った

play17:20

マルウェアの話題ですイスラエル高家大学

play17:24

やコーネル高家大学の研究者らはOpen

play17:27

AIのチャットGPKeやGoogleの

play17:30

ジェミニなどのAIチャットボットを

play17:32

ターゲットにしたマルウェアモリス2を

play17:35

開発しましたマルウェアというのは不正

play17:39

かつ有害に動作させる意図で作成された

play17:42

悪意のあるソフトウェアや悪質なコードの

play17:45

総称のことでモリス2はネットワーク経由

play17:49

で感染するワームというマルウェアの一種

play17:52

でモリス2を使うとユーザーが気づかない

play17:56

うちに特定の端末に染させることが可能で

play18:01

感染した端末から別の端末に拡散させ

play18:04

ながら端末からデータを盗み出したり

play18:07

できるとのことで検証用のコードがG

play18:10

HUBで提供されていますなお研究チーム

play18:14

はモリス2の調査結果をOpenAIと

play18:17

Googleに報告済みだとのこと

play18:20

です続いてはNVIDIAがノートPC

play18:24

向けGPUを発表の話題ですNVIDIA

play18:27

はAIの性能を向上させるエイラブレス

play18:32

アーキテクチャを採用したノートPC向け

play18:35

のGPUNVIDIARTX500A

play18:39

ジェネレーションとNVIDIARTX

play18:42

1000ジェネレーションを発表しました

play18:46

この2つのGPUはエントリー向けの

play18:48

GPUでRTX500の方が4GBRTX

play18:54

1000の方が6Gのメモリを搭載して

play18:57

おり

play18:58

CPUだけの構成のノートPCと比較して

play19:02

ステイブルディフュージョンなどの画像

play19:04

生成AIモデルを使う際に大きく

play19:07

パフォーマンスが上がるとのことで

play19:10

2024年春からデルやレノボなどの

play19:13

ノートPCに実装される予定のよう

play19:16

です続いてはOPPOのAIスマート

play19:20

グラスの話題です中国のスマートフォン

play19:23

会社OPPOは生成AI機能を実装した

play19:28

アートグラスエアグラス3を発表しました

play19:32

エアグラス3はOPPO独自の大規模言語

play19:35

モデルアスGPTがベースの音声

play19:39

アシスタントを実装していて音声で質問や

play19:43

検索などができるようですが音声

play19:46

アシスタントを使うにはベッドスマート

play19:48

フォンのアプリに接続する必要があるよう

play19:51

ですなおIT系のメディアCNETの記事

play19:56

によると音声アシスタント機能が使えるの

play19:59

は現状で中国語のみでエアグラス3の価格

play20:04

発売日ともに未定だとのこと

play20:07

ですなおこの動画で紹介した記事やツール

play20:11

などのリンクは動画の概要欄に貼ってい

play20:14

ますAIツールに興味のある方は是非自分

play20:19

の手で試してみてくださいそれでは次回の

play20:22

動画でお会いし

play20:27

ましょう

play20:40

OG

Rate This

5.0 / 5 (0 votes)

Related Tags
AIテクノロジー最新情報機能紹介動画生成チャットボット音声合成OpenAIマルチモーダルイノベーション
Do you need a summary in English?