GPT-4超えのLLM「Claude 3」詳細/ChatGPTの新機能~回答読み上げ・数学強化~/Soraの最新情報~最新動画と論文~【今週公開の最新AIツール&ニュース】
Summary
TLDRこの動画では、AIの最新動向と新しいツールが紹介されています。Anthropicの大規模言語モデルCL3、ChatGPTの新機能、OpenAIの動画生成AI「Stable Diffusion」、MicrosoftのAIアシスタントCopilot、Windowsの新しいAI機能などが取り上げられています。また、中国でのStable Diffusionのオープンソース化プロジェクト、OpenAIの内部文書流出の噂、AIチャットボットを狙うマルウェアなどの注目すべきニュースも報告されています。視聴者に最新のAI動向を包括的に伝えるための、情報満載の動画となっています。
Takeaways
- 🤖 AnthropicのCL3は有名ベンチマークでGPT-4を超える性能を持ち、強力な画像分析機能や長文入力に対応している。
- 🗣 ChatGPTに回答の音声読み上げ機能と数学問題への対応が追加された。
- 🎥 OpenAIの動画生成AI「Anthropic」について、中国の研究者がオープンソース版を開発中。
- 🔍 Copilot がPDF、PowerPoint、Excelファイルの分析機能を追加。
- 💻 Windows 11にCopilorのプラグインや画像/動画編集のAI機能が実装予定。
- 🎵 Adobeが音楽生成AIツール「Project Musingene」を発表。
- 🖼 「Layer Diffusion」技術で透明レイヤーを含む画像生成が可能に。
- 🔊 オープンソースの高速音声合成AIツール「Molt TTS」が公開。
- 🖌 テキスト入力でステッカーを生成する「Sticker Baker」が公開。
- 🌐 中国のAI企業Emosが3D生成AIツール「Rudance 1」のベータ版リリスト公開。
Q & A
CL3がどのようなAIモデルであるか説明してください。
-CL3はAI企業アンソロピックが開発した大規模言語モデルの最新バージョンです。オーパス、ソネット、俳句の3つのモデルがあり、オーパスはGPT-4やGoogle Jemini 1.0を超える性能を持つとされています。3つのモデルともに強力な画像分析機能を備えており、最大20万トークンの入力に対応できます。
CL3はどのように利用できますか?
-CL3はアンソロピックの公式サイトからアクセスできます。無料版のソネットではGoogleアカウントでログインすれば利用可能で、有料版のCL Proに登録するとオーパスが使えます。APIも公開されています。
ChatGPTの新機能としてどのようなものが追加されましたか?
-2つの新機能が追加されました。1つ目は「Read Out」と呼ばれる回答の読み上げ機能で、男女5名の音声から選択できます。2つ目は数学の問題解決能力が向上し、難しい問題にも対応できるようになりました。
OpenAIの動画生成AI「Coma」についてどのような最新情報がありますか?
-空の性能を検証した論文が公開され、実世界の物理法則に基づく高い忠実度で動画を生成できることが確認されました。また、OpenAIのメンバーがサンプル動画を公開し、空の可能性を示しました。さらに中国で空のオープンソース版の開発プロジェクトが立ち上がりました。
Microsoft Copiloitの新機能は何ですか?
-Copiloitに、PDF、PowerPoint、Excel、Wordファイルを読み込んで分析できる機能が実装されました。ファイルをアップロードし、内容を要約したり分析するよう依頼できます。
Windows 11にどのようなAI機能が追加される予定ですか?
-Copiloitに音楽生成やレシピ生成などのプラグインが実装され、様々な指示ができるようになります。また、写真編集アプリにAIによる不要物削除機能、動画編集アプリに無音部分削除機能が追加される予定です。
Adobeの新しいAIツール「Project MusicGenAI Control」の機能を教えてください。
-Project MusicGenAI Controlは、テキストから音楽を生成したり、生成した音楽を編集できるAIツールです。生成したい音楽のイメージをテキスト入力すると音楽が生成され、波形やスペクトログラムを使って編集が可能です。
「Layer Diffusion」とはどのようなAI技術ですか?
-Layer Diffusionは、画像生成AIで透明な単一レイヤーや複数レイヤーを生成できる技術です。これにより、透明背景の画像と背景画像を別々に生成し、後から合成することができます。
「MelioTTS」はどのようなAIツールですか?
-MelioTTSはオープンソースの高速音声合成AIツールで、英語、日本語、中国語など複数言語をサポートしています。一般的なCPUでも動作し、無料デモサイトも提供されています。
「StickerBaker」の機能を簡単に説明してください。
-StickerBakerは、テキストを入力するだけでステッカーを生成できるオープンソースのAIツールです。デモサイトから自由にステッカーを作成・ダウンロードでき、他のユーザーの作品も検索できます。
Outlines
🤖 CL3の紹介とChatGPTの新機能
この段落では、Anthropicの大規模言語モデルCL3の紹介とChatGPTの新しい機能である回答の読み上げ機能と数学問題の解決能力の向上について説明しています。CL3には3つのモデルがあり、最上位のオーパスモデルは有名ベンチマークでGPT-4やPaLM2を上回る性能を示したとされています。CL3は強力な画像分析機能と長文入力対応できます。一方、ChatGPTには回答を読み上げる機能と数学問題をより適切に解く機能が追加されました。
🎥 OpenAIの動画生成AI「Anthropic」と新機能の紹介
この段落では、OpenAIの動画生成AIモデル「Anthropic」について紹介しています。中国の研究者らによる論文では、Anthropicが実世界の物理法則に基づいて高い忠実度で動画を生成できるとされています。OpenAIのメンバーがサンプル動画を公開し、YouTuberも動画を投稿していますが、一部で指の本数が異常な問題も指摘されています。また、MicrosoftのAIアシスタント「Copilot」に各種ファイルの読み込みと分析機能が追加され、Windows 11にもAI関連の新機能が実装される予定だと説明されています。
🎵 AdobeのAI音楽生成ツールと画像生成AIの新技術
この段落では、AdobeのAI音楽生成ツール「Project Music GenEN AI Control」と、画像生成AIに新たな機能を追加する「レイヤーディフュージョン」について説明しています。Project Music GenEN AI Controlではテキストからの音楽生成と編集が可能で、Adobe製品への実装が期待されています。一方、レイヤーディフュージョンは単一または複数の透明レイヤーを生成できる技術で、ステーブルディフュージョンなどの画像生成AIツールで活用できます。また、新しいWEBUI「Stable Diffusion web UI Fuji」にもレイヤーディフュージョンの一部機能が実装されているとのことです。
💬 AIチャットボットとAIグラスの最新情報
この段落では、AI音声合成ツール「Mello TTS」、AI動画生成ステッカージェネレーター「Sticker Baker」、3Dデータ生成AIツール「Rodin-1」などの最新AIツールについて説明しています。また、中国の研究者チームが動画生成AI「Anthropic」のオープンソース化に着手したこと、OpenAIの内部計画文書が流出した噂、AIチャットボットをターゲットにしたマルウェア「Morice 2」の開発、NVIDIAのノートPC向けGPU発表、OPPOのAIスマートグラスの発表などの最新ニュースも紹介されています。
🔗 動画のまとめと関連リンクの案内
最後の段落では、この動画で紹介した記事やツールなどのリンクが概要欄に貼られていることが伝えられています。AIツールに興味がある人は是非試してみるよう勧めています。次回の動画で再会することを約束して動画を締めくくっています。
Mindmap
Keywords
💡GPT-4
💡ChatGPT
💡Anthropic
💡CL3
💡マルチモーダル
💡Copilot
💡DALL-E 2
💡空(Anthropic Video)
💡レイヤーディフュージョン
💡AI音声合成
Highlights
アンソロピックは同社の大規模言語モデルの最新版CL3を公開し、CL3はGPT4などを超える性能を持つと主張している。
CL3は強力な画像分析機能を実装しており、20万トークンの入力に対応している。
チャットGPTに回答の読み上げ機能と数学問題の解答能力向上が実装された。
OpenAIの動画生成AI「空」の性能が高く評価されており、中国で空のオープンソース版が開発中。
Microsoftのコパイロットに様々なファイル読み込み・分析機能が追加された。
Windows 11にコパイロットの新機能やアプリにAI機能が実装予定。
Adobeがテキストから音楽生成・編集できるAIツール「MusicGenAIコントロール」を発表。
レイヤーディフュージョンという透明レイヤーを生成できるAI技術が開発された。
多言語対応の高速音声合成AIツール「メロTTS」がオープンソース公開された。
テキスト入力でステッカーを即座に生成する「ステッカーベーカー」が公開された。
中国のAI企業Emos社が3D生成AIツール「ロダンジ1」のベータ版リリースを予告。
中国の研究者チームが動画生成AI「空」のオープンソース再現プロジェクトを開始。
OpenAIの内部文書が流出し、2027年までの人工知能開発計画が明らかになったとの噂。
AIチャットボットを狙ったマルウェア「モリス2」が開発された。
NVIDIAがAI性能向上のノートPC向けGPUを発表。
Transcripts
皆さんこんにちは今回の動画ではGPT4
を超える能力とされるアピックの最新
マルチモーダルllmCL3回答読み上げ
数学機能強化などのチャットGPTの新
機能オAIの動画生成AI空の最新映像と
空と他の動画生成AIとの比較論文
Microsoftの無料AIチャット
ボットコパイロットにExelやパワポを
読み込んで分析できる機能が実装などここ
1週間の間にリリースされた最新のAI
ツールの概要と使い方を紹介し中国で
オープンソース版の空が開発開始オ
OpenAIの内部資料が留出の噂など
ai関連の最新ニュースをお届けします
それではよろしくお願いし
ます
まずはCL3の紹介ですOpenAIの元
メンバーによって設立された米国のAI
スタートアップ企業アンソロピックは同社
の大規模言語モデルの最新版CL3を公開
しましたCL3はオーパスソネット俳句の
3つのモデルが用意されていてCL3の
プロジェクトページでは最上位版の
オーパスについては有名ベンチマークの
mmlUGPQAGSMKでオAIの
GPT4やGoogleのjemi1.0
ウルトラの数値を超えたとしており3
モデルともに強力な画像分析機能を実装し
ていて20万トークンの入力に対応してい
ますク3はアンソロピックの公式トップ
ページに行ってtalktoボタンを押し
た後にGoogleアカウントなどを使っ
てログインすれば注意モデルのソネットを
無料で利用でき上部のフォームでチャット
GPTと同じように質問するかフームの
右側にあるクリップアイコンから画像を
読み込んで分析してもらったりPDF
ファイルを読み込んで要約してもらったり
できます少し試しましたが回答速度は高速
で日本語の質問にも違和感ない形で答えて
くれましたし画像分析機能に関しても日本
語の入った画像もしっかりと分析してくれ
ましたただ日本語に関しては若干
ハルシネーションが多いのが気になりまし
たし数学の問題に関しては日本語だと
間違えることが多かったのですが英語で
質問すると正しい回答を出力してくれる
ことが多かったですなおクロード3の最
上位版であるオーパスについてはCLの
有料版であるCLProに登録すれば利用
できるようでオパスとソネットに対応した
APIも公開されてい
ます続いてはChatGPTの新機能の
紹介です日々新しい機能が実装されている
チットGPTに新機能が2点ほど追加され
ました1つ目がチッGPTにリアウと呼ば
れる回答の読み上げ機能が実装れました
モバイルアプリ版では設定画面で男女5名
の中の好きなボイスを設定してチャット
GPTの回答を長押して出てきたポップ
up画面でリアウの項目をタップすれば
文章を読み上げてくれますWebブラウザ
版のチャットGPTでは現状で実装されて
いるのは一部ユーザーだけのようで回答の
読み上げ機能が実装されている場合
チャットGP画面の左下の設定ページに
行くとスピーチという項目ができているの
でそこで男女5名の中から好きなボイスを
選択しチャットGPTからの回答の株に
ある音声アイコンを押すと回答を音読して
くれます英語と日本語の音読に対応して
いることを確認しましたが日本語は正しく
読んでくれない文字もあり若干不安定に
感じました2つ目が
海外のインフルエンサーの方が投稿して
ネット上で話題になっていた件でかつて
チャットGPTが苦手としていた数学の
問題に関して現在は難しい問題も解ける
ようになっておりチャットGPTに数学の
問題かどうかを判断する数学分類機のよう
なものが実装されて難しい数学問題が入力
された場合には1手間かけて計算が実行さ
れる処理が行われていると推測されてい
ます数問試してみましたが過去GPT4で
失敗していた問題も解けるようになってい
ましたしSNS上でも数学能力が上がった
という声が多いのでチャットGPTの数学
能力は確実に上がっていると思われ
ます続いては空の最新情報の紹介です先日
OpenAIが発表したテキストや画像
から動画をできる動画生成AIモデル空は
各種メディアで取り上げられAI界隈で
最もホットな話題となっていますここでは
空の発表後にネット上で話題になった最新
情報をまとめて紹介しますまず中国の研究
者らによって有名画像生成AIツールの
ランウージン2と科の性能を空と比較検証
した論文が公開されましたこの論文によれ
ば空は実世界の物理法則に基づいた高い
忠実度で動画を生成する能力を持ち空に
よって生成された動画はGEN2やピカと
比較して圧倒的に一貫性を保持した動画を
作れると結論付けられていましたまたオ
OpenAIの空の開発メンバーがx上で
空で作ったサンプル動画を積極的に公開し
ていてニューヨークの街を歩くエイリアン
の動画男女が未来的なデザインの
レストランで食事をしている動画ドローン
撮影のような感じで空から美術館の中に
ズームインした後に美術館の中をドローン
視点で巡っていく動画黒目が地球のように
見える女性の目のアップ動画など空の無限
の可能性を感じることのできる動画が公開
されていましたそして米国の有名
YouTuber
マルケスブラウンリー氏が自身のX上で空
で制作したとする動画を公開していました
が生成された動画の中の男性の指が6本
あったりとSNS上では空にも現在の画像
生成AIの弱点とされている手の指を
うまく表現できない問題があるのではない
かと話題になっていました続いてはコ
パイロットの新機能の紹介です
Microsoftの無料で使えるAI
チャットボットコパイロットに新機能とし
てPDFPowerPOINTExcel
Wordファイルを読み込んで分析して
くれるChatGPTの有料版に実装され
ているコードインタープリターのような
機能が実装されましたMicrosoft
アカウントでログインした状態でコ
パイロットを立ち上げると新たにフォーム
の中にクリップアイコンがが実装されて
いるのでそこから各種ファイルを
アップロードでき例えばPDFファイルを
アップロードして内容を要約してもらっ
たり売上データの入ったExelファイル
をアップロードしてこのExcel
ファイルを分析してくださいと入力して
送信するとExcelファイルの内容を
分析してくれたりします無料版のコ
パイロットではアップロードできる
ファイルのサイズは最大で1mとなってい
ましたまた私の環境ではChromeで
立ち上げたコパイロットにはクリップ
アイコンが実装されていましたがエッジ
ブラウザで立ち上げたコパイロットには
クリップアイコンが表示されていません
でした続いてはWindows11のAI
機能の紹介です2024年2月下旬に
Microsoftは同社のブログを更新
し同社のPC向けの最新OS
windows11に今後追加予定の機能
を発表しましたここでは追加される機能の
中からai関連の機能に絞って紹介します
まずwindows11に実装されている
AIチャットボットコパイロットに音楽
生成スノレシピ生成インスタカートなどの
プラグインが実装されて2024年3月
下旬からコパイロット上でバッテリー
セーバーをオンオフにする画面拡大鏡を
起動するシステム情報を表示する利用可能
なwi-fiネットワークを表示すると
いった指示ができるようになるそうです
さらにWindowsに標準実装されて
いる画像編集アプリPHに画像の中から
不要なものを選択して削除できるAI機能
が実装され動画編集アプリクリップ
チャンプにAIにによる無音部分除去機能
が追加されるとのことですなお私の
WindowsパソコンではまだPHアリ
の不要部分除去機能の実装は確認できませ
んでした続いてはadobの音楽生成AI
ツールの紹介ですadobはテキストから
音楽を生成したり生成した音楽を編集
できる機能を実装したAIツール
プロジクトMusicgenenAI
コントロールを発表しましたADの公式
YouTubeチャンネルでプロジェクト
MusicgenenAIコントロールを
実際に操作している動画が公開されており
生成したい音楽のイメージをテキスト入力
すると音楽が生成される形になっていて
生成した音楽は波形やスペクトログラムを
見ながら店舗を変えたりループさせたりと
様々な編集ができるようですなお
プロジェクトMusicgenenAI
コントロールはまだ研究段階だということ
で製品としてリリースされるかは未定です
が将来的にadobのオーディオ編集
ツールオーディションなどに実装される
可能性がありそう
です続いてはレイヤーディフュージョンの
紹介です画像生成AIを使う際に特定の
ポーズを指定できる機能コントロール
ネットを開発した研究者らは単一の透明
画像や複数の透明レイヤーを生成できる
AI技術レイヤーディフュージョンを発表
しましたレイヤーディフュージョンを使う
とステーブルディフュージョンなどの潜在
拡散モデルを使った画像生成AIツールの
中でエヤ機能を使え透明背景のドラゴンと
白の背景透明背景の犬と庭の背景といった
感じで透明なレイヤーを含む画像を生成
可能になり白の背景を作ってからドラゴン
を追加するといったことができるように
なりますレイヤーディフュージョンは
キットハブにレポジトリが用意されている
ので今後ソースコードが公開されると思わ
れますちなみに2024年2月に公開され
たステイブルディフュージョンの新しい
WEBUIスイブルディフュージョン
WEBUIフジではレイヤー
ディフュージョンの一部機能が使えるよう
です
続いてはメロTTSの紹介です英語
スペイン語フランス語中国語日本語韓国語
などの他言語をサポートするオープン
ソースの高速音声合成AIツールメロ
TTSが公開されました一般的なCPUで
も動作するのが特徴でソスコードはG
HUBで提供されていますメロTTSの
無料のデモがハフスで提供されていて
ラゲージの部分で言語スピードの部分で
読む速さを選択しテキストtoスピークの
部分に喋らせたい文章を入力してシセ
サイズボタンを押すと入力した文章を音声
化したものが高速生成されますなおメロ
TTSはパソコンのローカルで様々なAI
ツールを起動できるアプリピノキオにも
実装されていますTTSを日本語で何度か
試したところ発音に関しては一部調整す
べき箇所はありましたが生成速度はこれ
まで試したテキストtoスピーチ系の
ツールの中ではダトで早く長い文章も一瞬
で音声化してくれました続いては
ステッカーベーカーの紹介ですテキストを
入力するだけで即座にステッカーが生成さ
れるオープンソースのAIステッカー
ジェネレーターステッカーベーカーが公開
されましたgitHUBでソースコードが
用意されていますステッカーベーカーを
使える無料のデモも公開されていてデモ
ページに行って上部のフォームに作りたい
ステッカーのイメージをテキスト入力して
ベークボタンを押すとステッカーが生成さ
れ生成したステッカーをダウンロードでき
ますなおデモ画面右上のサーチのボタンを
押した先の画面でユーザーの作った
ステッカーを検索できるよう
です続いてはロダンジ1の紹介です中国の
AI企業emosは以前より公式X上で
進捗を投稿し続けていた1枚の画像から高
精度な3Dデータを生成できるAIツール
ロダンジ1の開発者用ベータ版への順番
待ちリストを公開しましたメールアドレス
などの必要事項をを入力すると順番待ち
リストに登録できますまだ実際に触れる
ツールが公開されていないので何とも言え
ませんがdmosの公式Xや
YouTube上で公開されている情報
だけを見ると現状で公開されている3D
生成AIツールと比べクオリティが格段に
高いことが伺え
[音楽]
ますここからは今週発表されたai関連の
ニュースを簡単にまとめて紹介しますまず
は空のオープン化プロジェクトの話題です
2024年2月に発表され各種メディアを
巻き込んで大きな話題となっている
OpenAIの動画生成AI空ですがこの
度中国の北京大学の研究者を中心とした
チームが空の動画生成モデルを忠実に再現
することを目的にしたオープンソ
プロジェクトを立ち上げましたギットハブ
にはソースコードも用意されています相当
数の研究者が関わっているプロジェクトの
ようなので今後の展開に注目
です続いてはオープンAIの内部文書が
流出の噂です2024年3月上旬あるX
アカウントがOpenAIが2027年
までに人間レベルの汎用人工地のを開発
するまでの過程を記した計画文書を公開し
て話題になっています信頼できる公式情報
ではないので都市伝説的な感じで紹介し
ますがこの計画文書のPDFによると
OpenOpenAIは2022年から
アキスやQスターと呼ばれる125兆の
パラメーターを持つマルチモーダルモデル
のトレーニングを開始し2023年12月
に訓練を終了してこれを2025年に
GPT5としてリリースする予定でしたが
高額な水論コストがかかるので中止になっ
たといった内容でその他にもGPT4.5
やGPT6GPT7絡みの話題も出てい
ました続いてはAIチャットを狙った
マルウェアの話題ですイスラエル高家大学
やコーネル高家大学の研究者らはOpen
AIのチャットGPKeやGoogleの
ジェミニなどのAIチャットボットを
ターゲットにしたマルウェアモリス2を
開発しましたマルウェアというのは不正
かつ有害に動作させる意図で作成された
悪意のあるソフトウェアや悪質なコードの
総称のことでモリス2はネットワーク経由
で感染するワームというマルウェアの一種
でモリス2を使うとユーザーが気づかない
うちに特定の端末に染させることが可能で
感染した端末から別の端末に拡散させ
ながら端末からデータを盗み出したり
できるとのことで検証用のコードがG
HUBで提供されていますなお研究チーム
はモリス2の調査結果をOpenAIと
Googleに報告済みだとのこと
です続いてはNVIDIAがノートPC
向けGPUを発表の話題ですNVIDIA
はAIの性能を向上させるエイラブレス
アーキテクチャを採用したノートPC向け
のGPUNVIDIARTX500A
ジェネレーションとNVIDIARTX
1000ジェネレーションを発表しました
この2つのGPUはエントリー向けの
GPUでRTX500の方が4GBRTX
1000の方が6Gのメモリを搭載して
おり
CPUだけの構成のノートPCと比較して
ステイブルディフュージョンなどの画像
生成AIモデルを使う際に大きく
パフォーマンスが上がるとのことで
2024年春からデルやレノボなどの
ノートPCに実装される予定のよう
です続いてはOPPOのAIスマート
グラスの話題です中国のスマートフォン
会社OPPOは生成AI機能を実装した
アートグラスエアグラス3を発表しました
エアグラス3はOPPO独自の大規模言語
モデルアスGPTがベースの音声
アシスタントを実装していて音声で質問や
検索などができるようですが音声
アシスタントを使うにはベッドスマート
フォンのアプリに接続する必要があるよう
ですなおIT系のメディアCNETの記事
によると音声アシスタント機能が使えるの
は現状で中国語のみでエアグラス3の価格
発売日ともに未定だとのこと
ですなおこの動画で紹介した記事やツール
などのリンクは動画の概要欄に貼ってい
ますAIツールに興味のある方は是非自分
の手で試してみてくださいそれでは次回の
動画でお会いし
ましょう
OG
تصفح المزيد من مقاطع الفيديو ذات الصلة
ChatGPTのリーク情報~ファイル分析・画像生成機能強化~/OpenAIの謎サイトオープン/動画生成AI「Sora」の最新情報【今週公開の最新AIツール&ニュース】
IQ100突破のClaude 3の最新情報とOpusを無料で使う方法/ChatGPTの新機能~画像生成機能と認証機能強化~【今週公開の最新AIツール&ニュース】
マイクロソフトのAI特化PC「Copilot+PC」~GPT-4o搭載Copilot、すべてを記憶する機能~/Soraっぽい高画質動画生成AI「Viva」【今週公開の最新AIツール&ニュース】
Google検索一部有料化検討?動画作成アプリは良い感じ!【AI・ITニュースまとめ】
注目AIニュース9選~iPhoneにChatGPT搭載!?、OpenAIの新発表、XのGrokいよいよリリース
最新のClaudeアプデ内容(claude3.5, artifacts, projects機能)について解説してみた
5.0 / 5 (0 votes)