東京大学発のオープンソースLLM「Tanuki-8×8B」/テキストからwebアプリ・webサイトを生成できるAI「GPT Engineer」【今週公開の最新AIツール&ニュース】
Summary
TLDRこの動画では、東京大学が開発した日本語対応のAIモデル「たぬき88B」や、テキストから動画を生成する「コグビデオX」などの最新AIツールの紹介。さらに、Amazonの新しいAlexaや、AI企業が開発するロボットデモなどのAI関連ニュースもカバー。これらのツールとニュースは、AI技術の進歩と多様な応用が見られる。
Takeaways
- 😀 東京大学の松尾岩沢研究室が開発した日本語対話能力の高いオープンソースLLM「たぬき88B」を公開。
- 🛠️ GPTエンジニアがテキストからコードを生成し、ウェブサイトやWebアプリをデプロイできる機能を提供。
- 🎥 中国の成果大学がテキストから一貫性のある動画を生成するオープンソースAIモデル「コグビデオX」を公開。
- 🖼️ アリババのAIブランドクエンが画像動画認識AIモデル「クエン2VL」をオープンソースで公開。
- 🎨 プレイグラウンドAIがグラフィックデザインを生成できるツールページを新たに公開。
- 💬 Cohereが大規模言語モデル「コマンドR」の新型モデル「コマンドR Plus」を公開。
- 🔧 アンソロピックのAIチャット「クロード」にコード改善機能を実装。
- 🎞️ ラウェイがテキストや画像から動画を生成するAIツール「genen3」の拡張機能を発表。
- 🗣️ Googleがテキストデータを音声ディスカッション形式に変換できる「イルミネート」を実験公開。
- 🤖 1X technologiesが人間のように動くロボット「ネオ」のデモ動画を公開。
- 🗣️ Amazonが新しいAlexaにアンソロピックのクロードを採用予定。
- 📚 AI企業Magic Leapが最大1億トークンを処理できるAIモデル「LTM2 mini」を開発。
- 🏫 OpenAIとアリゾナ中立大学がChatGPTを教育研究運営に導入。
- 🇰🇷 韓国でAIによるデープフェイク犯罪が急増し、政府が対策を検討中。
Q & A
東京大学が開発した日本語向けのオープンソースAIモデルの名前は何ですか?
-東京大学が開発した日本語向けのオープンソースAIモデルは「たぬき88B」です。
たぬき88Bはどのような性能を誇っていますか?
-たぬき88BはGPT3.5ターボと同等以上の性能を達成しており、日本語対話能力を評価するベンチマーク「ジャパニーズMTベンチ」において優れた成績を示しています。
たぬき88Bはどこで公開されていますか?
-たぬき88Bはオープンソースで公開されており、研究や商業目的での自由な利用が可能です。モデルデータはHugging Faceで提供されています。
GPTエンジニアとはどのようなAIツールですか?
-GPTエンジニアはテキストからコードを生成できるオープンソースのAIツールで、さらにGitHubと同期させることもでき、作ったコンテンツをデプロイして公開できます。
コグビデオXはどのような機能を持ちますか?
-コグビデオXはテキストから一貫性のある動画を生成できるオープンソースのAIモデルで、段階的なトレーニング技術を採用して高品質な動画キャプションデータを生成する機能を持っています。
クン2VLはどのようなAIモデルですか?
-クン2VLはオープンソースの画像動画認識AIモデルで、様々な解像度やアスペクト比の画像を理解し、長時間動画の内容理解が可能な性能を持っています。
プレイグラウンドAIの新機能とは何ですか?
-プレイグラウンドAIはグラフィックデザインを生成できるツールページを公開し、Tシャツロゴ、SNS投稿ミームの作成など幅広く対応する機能を提供しています。
コマンドRPlusはどのような新型モデルですか?
-コマンドRPlusはカナダのAI企業コヒアが公開した大規模言語モデルコマンドRの新型モデルで、具体的な変更点は発表されていませんが、プレイグラウンドを通じて無料でお試しいただけます。
genen3アルの新機能とは何ですか?
-genen3アルの新機能として、テキストや画像から動画を生成できる機能が拡張され、最大40秒までの動画を作成できるようになりました。
Amazonの新しいAlexaはどのような変更が予定されていますか?
-Amazonの新しいAlexaはアンソロピックの大規模言語モデルクロードを採用する予定で、従来のAIモデルよりも優れたパフォーマンスを示すとされています。
Outlines
🌏 AIツールの最新動向
この動画では、東京大学が開発した日本語対応のAIツール「たぬき88B」や、テキストからウェブサイトやWebアプリを生成する「GPTエンジニア」、テキストから動画を生成する「コグビデオX」など、最新のAIツールの概要と使い方を紹介します。また、AI関連のニュースもお届けします。たぬき88Bは、日本語対話能力を評価するベンチマークでGPT3.5ターボと同等以上の性能を示しており、オープンソースで公開されています。GPTエンジニアはテキストからコードを生成し、コンテンツをデプロイできる機能を持ち、コグビデオXは一貫性のある動画を生成するオープンソースのAIモデルです。
📹 コグビデオXの詳細
中国の成果大学などの研究者が開発した「コグビデオX」は、テキストから一貫性のある動画を生成できるオープンソースのAIモデルです。このモデルは段階的なトレーニング技術を採用し、高品質な動画キャプションデータを生成するプロセスを開発しています。現在では720x480ピクセルの6秒間の動画を生成することができ、他の動画生成AIモデルと比較して優れたパフォーマンスを示しています。コグビデオXのソースコードはGitHubで公開されており、5Bと2Bの2つのモデルが用意されています。
🤖 ロボットとAIの進化
このセクションでは、AI企業1X technologiesが開発中の家庭用人型ロボット「ネオ」のデモ動画を公開したニュースについて触れています。この動画では、ネオが非常に自然な動きで人間をサポートする様子が展示されており、SF映画のようなリアルなロボットの家庭での使用が近い将来実現可能であると期待されています。また、Amazonが2024年にリリース予定の改良版のAlexaにアンソロピックの大きな言語モデル「クロード」を採用する予定であると報じられており、新しいAlexaは従来のバージョンよりも優れたパフォーマンスを示しているとされています。
📚 AIの教育応用とデータセットの更新
このセクションでは、AIが教育分野での応用や画像データセットの更新について紹介しています。アリゾナ中立大学がAI「ChatGPT」を教育研究運営の200以上のプロジェクトに導入し、学術論文作成のためのAIライティングアシスタントや医学生の患者とのやり取り練習のためのチャットボットを利用していると報告されています。また、画像データセット「Lon5B」から不適切なコンテンツを除去した新しいバージョン「リライ5B」が公開され、安全基準が強化されたとされています。
Mindmap
Keywords
💡GPT3.5ターボ
💡オープンソース
💡AIツール
💡生成AI
💡テキストから生成
💡デプロイ
💡モデル
💡AIチャット
💡デモ
💡AI関連ニュース
Highlights
東京大学が開発した日本語に強いオープンソースAI「たぬき88B」を紹介。
たぬき88BはGPT3.5ターボと同等以上の性能を達成。
オープンソースの動画生成AI「コグビデオX」がリリースされ、テキストから一貫性のある動画を生成できる。
AIツール「GPTエンジニア」が公開、テキストからウェブサイトやWebアプリのコンテンツを生成可能。
Amazonの新しいAlexaがアンソロピックのクロードを採用する予定であると報じられた。
AI企業マジックが最大1億トークンを処理できるAIモデル「ltm2 mini」を開発。
OpenAIがアリゾナ中立大学と連携し、200以上のプロジェクトにChatGPTを導入。
画像データセットLAION-5Bから不適切なコンテンツを除去した新しいバージョンが公開。
韓国でAIによるデープフェイク性犯罪が急増していると報告。
たぬき88Bはオープンソースで公開され、研究商業目的での自由な利用が可能。
GPTエンジニアはテキストからコードを生成し、コンテンツをデプロイして公開できる。
コグビデオXは720x480ピクセルの6秒間の動画を生成できる。
クン2VLはオープンソースの画像動画認識AIモデルで、多言語に対応。
プレイグラウンドAIがグラフィックデザインツールページを公開。
コマンドRPlusが公開され、新型モデルで無料お試しが可能。
AIチャットクロードにコード改善促進機能が実装された。
genen3アエクステンションズ機能で動画を最大40秒まで拡張可能になった。
Googleがテキストデータを音声ディスカッションデータに変換できる「イルミネート」を公開。
GitHubがAIモデルを無料で試せる「GitHubモデルズ」の限定公開ベータ版を公開。
Transcripts
皆さんこんにちは今回の動画では東京大学
が1から作ったGPT3.5ターボと同等
の性能を誇る日本語に強いオープンソース
llmたぬき88B日本語テキストから
ウェブサイトやWebアプリなどの
コンテンツを生成できるAIツールGPT
エンジニアテキストから一貫性のある動画
を作れるオープンソースの動画生成AI
コグビデオXなどここ1週間の間に
リリースされた最新のAIツールの概要と
使い方を紹介し1Xが人間のように動く
ロボットのデモを公開amazonの
新しいAlexaがクロードを採用など
ai関連の最新ニュースをお届けします
それではよろしくお願いし
[音楽]
ますまずは
8Bの紹介です東京大学の松尾岩沢研究室
は日本国内の生成AI基盤モデル開発を
推進するジーニアプロジェクトの一環とし
て新たな大規模言語モデルたぬき88Bを
開発し公開しましたこのモデルはフル
スクラッチで開発されていてllmの
日本語対話能力を評価するベンチマーク
ジャパニーズMTベンチにおいて
GPT3.5ターボと同等以上の性能を
達成し人による評価でもGPT4jemi
1.5Proクロード3.5ソネットに
継ぐ性能を示したとしていますたぬき88
Bはオープンソースで公開され研究商業
目的での自由な利用が可能となっていて
モデルデータはハギングフェースで提供さ
れておりたぬき88の軽量版のたぬき8B
をチャット形式で利用できる無料のデモも
ハギングフェスで公開されていますデモで
はフォームに質問を入力してサブミッシブ
です2024年の早い段階から順番待ち
リストの募集中となっていたテキストから
ウェブサイトやWebアプリなどの
コンテンツを生成できるクロードの
アーティファクトに似た機能を持つAI
ツールGPTエンジニアが正式公開され
ましたAIチャット経由でテキストから
コードを生成できる他Gハブと同期させる
こともでき作ったコンテンツはデプロイし
て公開できますGPTエンジニアはツール
ページの右上にあるサインアップボタンを
押してGoogleやgitHUB
アカウントなどでログインすればある程度
無料で利用できログイン後の画面上部に
あるフォームに作りたいコンテンツの内容
をテキスト入力して送信すると後はAIが
自動でコンテンツを生成してくれ作った
コンテンツをプレビュー画面で実行でき
ますなお生成したコンテンツは画面の右上
にあるデプロイボタンを押した後に出て
くる画面でデプロイボタンを押すと生成し
たコンテンツを実際に使えるウェブページ
を生成できgitHUBボタンから
コンテンツのコードをgitHUBに同期
させることもできますなおサブスク登録
すると1日にチャットできる回数などが
増えるようです続いてはコグビデオXの
紹介です
中国の成果大学などの研究者らはテキスト
から一貫性のある動画を生成できる
オープンソースのAIモデルコグビデオX
を公開しましたコグビデオXは段階的な
トレーニング技術を採用することで長時間
の一貫性のある動画生成を可能にし高品質
な動画キャプションデータを生成する
プロセスを開発してモデルの
パフォーマンスを大きく上さたとしていて
現段階では720く480ピクルの6秒間
の動画を生成できるようですなお論文の中
ではコグビデオXはラウェイのgenen
2やキカなどの他の動画生成AIモデルを
上回るパフォーマンスを示したと主張して
いますコグビデオXのソースコードは
Kitハブで提供されていてcogビデX
5BとCビデX2bの2つのモデルが用意
されていますまたグビX5Bの公式デモが
ハギングフェスで提供されていて
プロンプトの部分に作りたい動画の
イメージをテキスト入力してジェネレート
ビデオボタンを押せば6秒の動画が生成さ
れます画質はラウェイのgenen3や
ramaaiのドリームマシーンなどの現
段階で最高峰の動画生成AIツールには
及びませんがーソースということもあり
今後の進化に期待
です続いてはクン2VLの紹介です中国の
アリババのAIブランドクエンはオープン
ソースの画像動画認識AIモデルquen
2VLを公開しましたquen2VLは
様々な解像度やアスペクト比の画像を理解
し20分以上の長時間動画の内容理解が
可能で1番大きなモデルは複数のllm
ベンチマークの多くの項目でオープAIの
GPT4やアンソロピックのクロード
3.5ソネットをしのぐ性能を誇るとして
おり英語や中国語の他日本語などの他言語
に対応していますクエン2VLには2B7
b72Bの3つのモデルが存在し2Bと7
bのコードはハギングフェスで公開されて
いて72BモデルはAPI経由で利用
できるようですまた72Bモデルは
ハギングフェースでデモが公開されていて
デモではアップロードの部分から画像や
動画をアップロードしフォームに質問を
入力してサブミッシブ
答えもばっちりでした続いては
プレイグラウンドの新機能の紹介です
プレイグラウンドAIは同社の開発する
AI画像
プラットフォームプレイグラウンドに新た
にTシャツロゴSNS投稿ミームの作成
まで幅広く対応するグラフィックデザイン
を生成できるツールページを公開しました
プレイグラウンドはツールトップページの
スタートデザイニングボタンを押した後に
出てくる画面でサインアップボタンを押し
てGoogleアカウントでサインアップ
すれば利用できますログイン後のページで
はロゴの部分からロゴをモバイルウォール
ペーパーの部分からスマホの壁紙をといっ
た感じで各種アイコンを押した後の画面で
好きな画像を押すと編集画面に遷移しその
画像を元に右側のアプライスタイルので
スタイルを変えたりCのフォームで画像内
の文字を編集し作った画像をダウンロード
できますなお右上にアイコンがついた画像
を編集する場合にはサブスク登録が必要
ですまた先ほど紹介したサイトにログイン
した状態で画像を生成できる方の
プレイグラウンドのページに行くと
プレイグラウンドAiの画像基盤モデルの
最新版プレイグラウンド3のベータ版を
使って画像を生成できページの上部に作り
たい画像のイメージをテキスト入力して
ページの右側でplaygroundV3
ベータを選びクリエイトボタンを押せば
画像が生成されますplayground
V3の詳細はまだ公開されていませんが
かなり高画質の画像を作れサブスク登録
するとさらに高画質な画像を作れるなどの
特典があります
続いては新型コマンドRPlusの紹介
ですカナダのAI企業コヒアは4月に公開
した大規模言語モデルコマンRとコマンR
Plusの新型モデルを公開しましたどの
ような変更があったのかは発表されてい
ませんなおこの新型モデルはコヒ屋の公式
ページに行ってGetスーテforfre
ボタンを押しGoogleアカウントなど
を使ってログインした先の画面の左側に
あるプレイグラウンドの部分を押した先の
ページにあるフォームで右側にあるモデル
の部分で新型モデルを選んでカにある
フームから新型モデルを使ったチャットを
無料でお試しできますコマンドRPlus
の方はネットでも評価の高いllmなので
興味のある方は是非1度触ってみて
ください続いてはクーの新機能の紹介です
アンソロピックの開発者のアレックス
アルバート氏は自身のXを更新しAI
チャットクロードに実装されている
アーティファクト機能について生成した
コンテンツのコードの1部の内容について
説明してもらったり改善を促せる機能が
実装されたと発表しました一部のコドを
選択してインプルーブボタンを押して出て
きたフォームにコードの改善ないを書いて
アップデートボタンを押せばコードを改善
してくれ一部のコードを選択してエプレ
ボタンを押すとそのコードの内容について
詳しく解説してくれますプログラミング
初心者にとっては非常に便利な機能と言え
ます続いてはgenen3アルの新機能の
紹介ですラウェイは7月に公開した
テキストや画像から動画を生成できるAI
ツールの最新版genen3アについて
genen3アエクステンションズ機能を
使うことで最大40秒まで動画を拡張
できるようになったと発表しました
ラウェイの公式X上で公開されている40
秒動画では長時間でも一貫性を保てており
genen3アで1度作った動画の
エクステンドボタンを押すと拡張できる
ようですなお現状3アを利用するには
サブスク登録が必要で無料で使える
genen3アターボではこの拡張機能は
使えないようですが将来的に実装される
可能性はあります続いてはイルミネートの
紹介ですGoogleは論文などの
テキストデータを2人の会話形式の音声
ディスカッションデータに変換できる
イルミネートに関して実験サイトといくつ
かのサンプル音声を公開しましたサイト内
にあるプレイボタンを押すと会話形式の
音声に変換された論文内容を確認できます
なおイルミネートはサイト上部にある
ジョインウェイトリストボタンを押して
職業と使用目的を選んでサブミッシブ
モデルズの紹介です開発プラットフォーム
のghubは先日gitHUBの
プラットフォーム上で様々なAIモデルを
無償で試せるGHUBモデルズの限定公開
ベータ版を公開し順番待ちリストに登録
すれば使えるようになっていましたがこの
度私の環境でアクセスできるようになった
ので簡単に使い方を紹介しますGHUB
モデルズはハにログインした状態でgit
HUBモデルズのページに行きページに
並んでいるllmのアイコンの中から好き
なものを押した先のページの上部の
フォームを使ってそのllmとチャット
できチャット画面の上部でモデルを
切り替えたり画面の右側でシステム
プロンプトなどを設定できますgit
HUBモデルズではOpenAIのGPT
4GPT4MinMICソフトの53
ミストラルAIのミストラルラージなど
様々なllmを無料で1つの画面で試せる
ので非常に便利ですなおGHUBモデルズ
を利用するにはgittHUBにログイン
した状態で指定のサイトに移動しサイトの
上部にあるGetRアクスの部分を押した
先のページで順番待ちリストに登録すれば
後日使えるようになります
[音楽]
ここからは今週発表されたai関連の
ニュースを簡単にまとめて紹介しますまず
は1Xが人間のように動くロボットのデモ
を公開の話題ですオOpenAIなどの
AI企業も出資しているノルウェイの
ロボットスタートアップ企業1X
technologiesは同社のXを
更新し開発中の家庭人型ロボットネオの
ベータ版の動画を公開しましたこの動画に
はまるで人間のような動きで人間を
サポートするロボットが登場しており
あまりのリアルさにネットでは中に人間が
入っているんじゃないかといった声も出て
いました近年のAIの発達によりロボット
の進化も凄まじいものがあるので私たちが
かつてSF映画で見ていたようなリアルな
ロボットが家庭用ロボットとして発売さ
れる日も近そうです続いてはAmazon
の新しいAlexaがクロードを採用の
話題ですロイターはAmazonが
2024年にリリース予定の改良版の
Alexaにアンソロピックの大規模言語
モデルクロードを採用する予定であると
報じましたクロードを採用した新しい
Alexaは従来のAmazonの自社
AIモデルを使用したバージョンよりも
優れたパフォーマンスを示しているとされ
ていますなお新しいAlexaは
リマーカブルAlexaという名称で
2024年10月にリリースされる見込み
でAIで生成されたニュースの要約子供
向けのチャットボット会話型ショッピング
ツールなどの機能が期待されていて月額5
から10ドルの有料サービスとして提供さ
れる可能性があり現在利用されて
クラシックalexは無料サービスとして
提供し続けるようです続いては750冊の
本の情報を1度に処理可能なAIモデルの
話題ですAI企業のマジックは水論時に
最大1億トークンもの超々分脈を処理
できる能力を持つAIモデルltm2
miniを開発したと発表しました1億
トークンというのは約1000万行の
コードや
750冊の小説に相当する情報を1度に
処理可能になりますさらにマジックは
GoogleCloudと提携して
NVIDIAの最新GPUを搭載した次
世代スーパー
コンピューターMagicG4と
MagicG5の構築を進めているといい
これによりAIの処理能力がさらに飛躍的
に向上するとのことですltm2mini
はまだ一般公開はされていないようですが
詳細が気になる方はニュースリリース
ページを確認してみて
ください続いてはアリゾナ中立大学がオ
AIと定型の話題ですOpenAIは米国
のアリゾナ立大学と連携してAIチット
ChatGPTを大学の教育研究運営の
200以上のプロジェクトに導入すると
発表しましたアリゾナ中立大学は
プライバシーとセキュリティが強化された
大学向けに設計されたチャットGPTで
あるチットGPTエデュが導入されていて
学術論文作成のためのAIライティング
アシスタントとして使われたり医学生が
患者とのやり取りを練習するための
チャットボットサムなどが利用されている
ようですAI時代における教育の変化の中
でこうした事例が術の未来を作り上げる
一助となりそうです続いては画像データ
セットライオ5Bの修正版公開の話題です
ドイツの比団体ライオンはステーブル
ディフュージョンなどの有名画像生成AI
に使われた画像データセットLon5Bに
ついて2023年12月に不適切な内容が
含まれていることを指摘されていた件で
ライオ5Bから不適切なコンテンツを除去
した新しいバージョンリライ5Bを公開し
ましたリライ5Bでは安全基準が大幅に
強化されているようでラオは公式サイト
にて研究者がより安全に使用できると語っ
ていますなおミライオ5Bのデータは
ハギングフェスで公開されています続いて
は韓国でデープフェイク生犯罪が深刻化の
です事事.comが伝えたところによると
韓国においてAIによるデープフェイク性
犯罪が急増して申告化しているとのこと
ですこの犯罪には通信アプリtgrを使っ
て画像や動画が共有されるケースが多く
政府と警察が対策に乗り出しているとの
ことで8月29日には韓国のユソンニル
大統領がデジタル性犯罪の混をえて対策を
指示するほどの事態になっているようです
ただテレグラムは得性が高い上に海外の
通信ツールということもあってすぐには
対応を強制できないという事情もあるよう
ですなおこの動画で紹介した記事やツール
などのリンクは動画の概要欄に貼ってい
ますAIツールに興味のある方は是非自分
の手で試してみてくださいそれでは次回の
動画でお会いしましょう
関連動画をさらに表示
マイクロソフトのAI特化PC「Copilot+PC」~GPT-4o搭載Copilot、すべてを記憶する機能~/Soraっぽい高画質動画生成AI「Viva」【今週公開の最新AIツール&ニュース】
Google検索一部有料化検討?動画作成アプリは良い感じ!【AI・ITニュースまとめ】
🚀 VivaTech 2024 : Keynote - More than a Model: The Gen AI Essentials for Business Innovation
オリジナルのAIを作れるGeminiの新機能「Gems」・画像生成AI「Imagen 3」/OpenAIが2つの新しいAIモデルを開発中の噂【今週公開の最新AIツール&ニュース】
GPT-4o、Claude 3 Opus、Gemini 1.5 ProなどのAIモデルを6つ同時に実行できる無料AIツール/ChatGPT無料版でGPTs機能解放【今週公開の最新AIツール&ニュース】
これさえ押さえておけばOK! 生成AI時流を解説 〜3月後半の生成AIトレンドをご紹介〜(2024/04/03)
5.0 / 5 (0 votes)