ChatGPTのリーク情報~ファイル分析・画像生成機能強化~/OpenAIの謎サイトオープン/動画生成AI「Sora」の最新情報【今週公開の最新AIツール&ニュース】

AI大学【AI&ChatGPT最新情報】
28 Feb 202421:06

Summary

TLDRこの動画では、チャットGPTの新機能リーク情報やOpenAIの動画生成AI「空」の最新情報、AIとの自然な会話が楽しめるアプリ「こと」、さまざまなAI機能が搭載されるiOS 18の噂など、最新のAIツールやAI関連ニュースが紹介されています。ファイル分析やイメージ生成機能の拡張、GPTサーチなどのチャットGPTの機能アップデート、動画変換AIツールや高速画像生成AIの登場など、AI技術の急速な発展と無限の可能性が感じられる内容となっています。

Takeaways

  • 😀 チャットGPTには、Excelファイルなどのデータ分析を可能にする「データアナリシスV2」という新機能が実装されるかもしれません。
  • 📊 GPT4には、画像生成AIツール「ダリー3」関連の新機能が追加され、画像のスタイルや枚数、アスペクト比の調整が可能になる見込みです。
  • 🌐 OpenAIが「空」という動画生成AIモデルを発表し、テキストや画像から高品質な動画を生成できる技術が注目されています。
  • 🗣 スターレ株式会社が開発した音声会話型のAIアプリ「ことも」が公開され、自然な音声会話が特徴です。
  • 🎨 「GOエンハンスAI」という動画を様々な画風に変換するAIツールが公開されました。
  • 📈 フランスのAI企業ミストラルAIが、大規模言語モデル「ミストラルラージ」を公開しました。
  • 🔍 Chrome拡張機能「GPTサーチ」が公開され、チャットGPTの会話履歴の検索が可能になります。
  • 🎙 TTSアリーナが公開され、様々なテキスト音声変換AIツールをランキング化します。
  • 🖼 SDXLライトニングという、超高速で高品質な画像を生成できるAIモデルが発表されました。
  • 🌍 オープンソースのマルチモーダル大規模言語モデル「パロ」が、10の主要言語をカバーして公開されました。

Q & A

  • チャットGPTの新機能リークはどのようなものですか?

    -2つのリーク情報があります。1つ目はGPT4 ADATAv2という新しいモデルを使用したデータアナリシスV2機能で、チャットGPTにExcelファイルなどをアップロードし、特定の列や列を指定して分析できるようになる可能性があります。2つ目は画像生成AIツール「DALL-E 3」関連の機能で、画像のスタイルの設定や生成枚数、アスペクト比の調整などができるようになるかもしれません。

  • 「アンカー」というウェブサイトの目的は何ですか?

    -OpenAIが公開した謎のウェブサイト「フザー」の目的についての詳細は分かっていませんが、近日中に何か新しいプロジェクトが立ち上がる可能性があると言われています。

  • 動画生成AIモデル「空」の特徴は何ですか?

    -空はOpenAIが発表したテキストや画像から動画を生成できる動画生成AIモデルで、従来の動画生成AIと比べてクオリティが桁違いに高いことが特徴です。まだツールやAPIは公開されていませんが、空のテクニカルレポートページでサンプルの動画を生成できるほか、空の開発メンバーがさまざまな動画をSNSで公開しています。

  • 「こも」アプリの特徴は何ですか?

    -「こも」は日常のコミュニケーションに特化した音声会話型のおしりAIアプリで、iOSデバイス向けに公開されました。独自の学習データを用いて作られた日常会話に特化したLLMを使用しており、自然な音声会話ができることが特徴です。無料でダウンロードでき、端末のマイクを許可すればAIとおしりを楽しめます。

  • 動画変換AIツール「GOエンハンスAI」の機能は何ですか?

    -GOエンハンスAIは動画を様々な画風の動画に変換してくれるAIツールで、Google アカウントでログインすると一定程度無料で利用できます。アップロードした動画をスタイルとデュレーションを指定して生成すると設定したスタイルが反映された動画が作成でき、ダウンロードできます。画像のアップスケーラー機能も備えています。

  • 「ミストラルラージ」とは何ですか?

    -ミストラルラージはフランスのAI企業ミストラルAIが公開した最新の大規模言語モデルで、OpenAI の GPT-4 に次ぐ性能を持つと言われています。ミストラルAI の公式ページでAPIが公開されており、Microsoft のクラウドサービスAzure 上でも利用できるようになりました。AIツール「PO」でも試すことができますが、日本語は苦手なようです。

  • 「GPTサーチ」はどのような機能を提供しますか?

    -GPTサーチはパソコンでチャットGPTを利用する際の会話履歴を検索できるChrome拡張機能です。Chrome ウェブストアからダウンロードすると、チャットGPT画面の左上に検索窓ができ、そこで検索するとタイトルと会話履歴にヒットした内容を表示してくれます。ただし現状では英語検索のみ対応していて、日本語には対応していません。

  • 「TTSアリーナ」の概要を教えてください。

    -TTSアリーナは世界中のテキスト音声変換AIツールをユーザーの判定を元にランキング化するTTSバトルプラットフォームです。ハギングフェイス上で動作し、主要なTTSツールがラインナップされています。英語のテキストを入力すると、ランダムで2つのTTSの音声が出力され、ユーザーに優れた回答を投票してもらいます。その投票結果を元にTTSのランキングが作られています。

  • 「SDXLライトニング」はどのような機能を持つAIモデルですか?

    -SDXLライトニングは、バイトダンスが発表した超高速でテキストから1024x1024ピクセルの画像を生成できるSDXLベースのAIモデルです。プログレッシブ敵対的拡散上流モデルという技術が使われており、ワンステップから数ステップの短いステップで高品質な画像を生成できることが特徴です。ハギングフェイスで無料のデモも公開されています。

  • 「パロ」はどのようなAIモデルですか?

    -パロは、世界の10の主要言語をカバーしたオープンソースのマルチモーダル大規模言語モデルです。ハギングフェイスで無料のデモが公開されており、日本語での会話や画像の内容についての質問に答えられます。まだハルシネーションが多い点は課題ですが、注目のAIモデルです。

Outlines

00:00

🤖 チャットGPTに新機能が実装される見込み

チャットGPTに新機能が実装されるかもしれない情報がリークされています。GPT-4モデルを使った「データアナリシスV2」機能では、Excelファイルなどをアップロードして特定の列や行を指定して分析できるようになる見込みです。また、ダリー3関連の機能として、生成する画像のスタイルやサイズ、アスペクト比を調整できる項目が追加される予定とのこと。これらの機能は有料のプラスプランになると予想されています。

05:04

🎥 OpenAIの動画生成AI「空」が話題に

OpenAIが発表した動画生成AIモデル「空」が、クオリティの高さから注目を集めています。空のテクニカルレポートページには空の機能を体験できる箇所があり、キーワードを組み合わせて様々な動画を生成できます。開発者はTwitterなどで空で作成したサンプル動画を多数公開しており、空の無限の可能性が感じられます。

10:05

🤖 日常会話に特化したAIアプリ「こと」が登場

スターレ株式会社が、日常のコミュニケーションに特化した音声会話型のおしりAIアプリ「こと」を公開しました。日常会話に特化したLLMが使われており、自然な会話が可能です。iOSアプリに対応しており、無料でダウンロードできます。SNSでも話題となり、落合洋一さんも2台のiPhoneで「こと」同士を会話させるなど、AI会話を楽しむユーザーが増えています。

15:07

🎨 動画をさまざまな画風に変換するAIツール

動画を様々な画風に変換してくれる動画変換AIツール「GOエンハンスAI」が公開されました。無料で利用でき、動画をアップロードして変換したいスタイルと動画の長さを選び、ボタンを押すと設定したスタイルが反映された動画が生成されます。同様のツールにはDiscord上で動作する「どAI」がありますが、GOエンハンスAIの方が操作性が良いです。画像を高画質化するアップスケーラー機能も実装されています。

20:08

🤖 OpenAIのGPT-4に匹敵する大規模言語モデル「ミストラルラージ」が登場

フランスのAI企業ミストラルAIが、同社の最新大規模言語モデル「ミストラルラージ」を公開しました。OpenAIのGPT-4に続く性能を持つと主張されており、APIはミストラルAIの公式ページで公開されています。またミストラルAIとMicrosoftは提携を発表し、Microsoftのクラウドサービスでミストラルラージが使えるようになりました。無料AIツール「PO」でもミストラルラージを試すことができますが、日本語の対応はまだ苦手なようです。

Mindmap

Keywords

💡チャットGPT

チャットGPTは、OpenAIが開発した大規模な言語モデルを用いたチャットボットです。このAIアシスタントは、自然言語処理技術を用いて文脈を理解し、適切な返答を生成することができます。本スクリプトでは、チャットGPTの最新情報やリークされた機能について触れられています。例えば、GPT-4を使ったデータ解析機能や画像生成AIダリー3の統合が予想されています。

💡AI動画生成

AI動画生成とは、人工知能を用いてテキスト情報や画像から映像を生成する技術のことです。本スクリプトでは、OpenAIが発表した動画生成AIモデル「空」について詳しく紹介されています。空は従来の動画生成AIと比べて圧倒的な画質と表現力を持つとされ、既にサンプル動画が公開されているため注目されています。AIを使った動画生成は、コンテンツ制作の新しい可能性を切り開くものと期待されています。

💡音声会話AI

音声会話AIとは、自然な音声による会話を実現するAI技術のことです。本スクリプトでは、スターレ株式会社が開発した音声会話型のAIアプリ「こも」が紹介されています。こもは独自の学習データを用いた日常会話に特化したAIを搭載しており、ユーザーとマイクを介して自由な会話を楽しめるのが特徴です。音声会話AIは、ユーザーとの自然なコミュニケーションを実現し、AI接続のストレスを軽減する技術として注目されています。

💡AIツールパロ

パロは、マルチモーダルな大規模言語モデルの1つです。英語、中国語、ヒンディー語など、世界の主要10言語に対応しており、オープンソースで公開されているのが特徴です。本スクリプトでは、ハギングフェイスでパロの無料デモを試すことができると紹介されています。パロを使えば、複数の言語で画像や会話を通じてAIと対話が可能になります。マルチリンガルなオープンソースAIモデルの登場は、世界中の人々がAI技術を手軽に利用できる環境づくりに貢献するでしょう。

💡GPT搜索

GPT搜索はChromeブラウザ用の拡張機能で、チャットGPTの会話履歴を検索できる機能を提供します。チャットGPTにはデフォルトでこの検索機能が実装されていないため、GPT搜索はパソコン上でチャットGPTを使う際の便利なツールとなります。本スクリプトでは、GPT搜索を使えば、大量の会話から目的の内容を見つけやすくなることが説明されています。AIとのコミュニケーションがますます増えていく中で、こうした付帯ツールの存在は重要になってくるでしょう。

💡TTSアリーナ

TTSアリーナは、テキスト音声変換AI(TTS)の性能をユーザーの投票に基づいてランキング化するウェブプラットフォームです。本スクリプトでは、イブラボス、メタボイス、ウィスパーなど主要なTTSツールが参加していると紹介されています。TTSアリーナでは、ランダムに出力された2つの音声を比較して投票することで、音声の出力元のモデルが判明します。このようなユーザー評価を通じて、優れたTTSを見出すことを目指しています。AIの性能評価をユーザーに委ねる斬新なアプローチと言えるでしょう。

💡SDXL ライトニング

SDXL ライトニングは、バイトダンスが発表した超高速テキスト画像生成AIモデルです。これは、安定化拡散技術の一種であるSDXL(Stable Diffusion with Extra Large)ベースのモデルです。本スクリプトでは、ハギングフェイスでSDXL ライトニングのデモを試すことができると紹介されています。このモデルの特徴は、わずか数ステップで高品質な画像を生成できる点にあり、生成速度も非常に速いとされています。AIアシスタンスをリアルタイムで活用できるモデルとして期待されています。

💡ヨロV9

ヨロV9はオープンソースのリアルタイムオブジェクト検出AIです。ヨロとは物体検出の手法を表す言葉で、ヨロV9はその最新モデルとなります。本スクリプトでは、ハギングフェイスにヨロV9のデモが用意されており、画像内のオブジェクトを迅速かつ正確に検出できると説明されています。物体検出AIは、自動運転や医療診断、異常検知など、様々な分野での応用が期待されていますので、ヨロV9も注目の技術と言えるでしょう。

💡OpenAIとレディット

OpenAIはAI企業のCEOを務めるサムアルトマン氏が株主となっているレディットとパートナーシップを拡大しました。これにより、OpenAIはレディットのデータAPIを通じてコンテンツにアクセスできるようになり、レディットはGoogleのAIプラットフォームを使って検索機能を強化できることになりました。大手テクノロジー企業と有力ウェブサービスがAI分野で提携を深めていくことは、AIの発展に大きな影響を与えるに違いありません。

💡AIロボット配送

AIロボット配送とは、AIを搭載したロボットを使って配送を行うサービスのことです。本スクリプトでは、UbereatがAIロボットを活用した配送サービスを東京で開始すると発表したことが紹介されています。使用されるロボットは高度な物体検知技術や自立走行性能を備えており、 AIによって作業の自動化や効率化が期待できます。ロボットによる配送は、まだ試験的な段階ですが、今後AIとロボット技術が発達すれば、さらに活用の幅が広がると考えられます。

Highlights

チャットGPTに実装されるかもしれない、ファイル分析機能の新機能のリークされた情報。Excelファイルなどをアップロードすると特定の列やセルを指定して分析できるようになる機能と、画像生成AIツールダリー3に関連する新機能の追加が噂されている。

OpenAIが発表したテキストや画像から動画を生成できる動画生成AIモデル「空」。動画のクオリティが桁違いに高い点が話題になっている。

スターレ株式会社が音声会話型のおしりAIアプリ「こも」を公開。話相手になってくれるAIと自然な音声会話ができる。

動画を様々な画風の動画に変換してくれる動画変換AIツール「GOエンハンスAI」が公開された。

フランスのAI企業ミストラルAIが最新大規模言語モデル「ミストラルラージ」を公開。OpenAIのGPT-4に継ぐ性能だと主張している。

パソコン版のチャットGPTで会話履歴を検索できる Chrome 拡張機能「GPTサーチ」が公開された。

テキスト音声変換AIツールをユーザーの判定を元にランキング化する「TTSアリーナ」が公開された。

バイトダンスが超高速でテキストから画像を生成できるAIモデル「SDXLライトニング」を発表した。

10の主要言語をカバーしたオープンソースのマルチモーダル大規模言語モデル「パロ」が公開された。

画像や動画内の複数のオブジェクトを迅速かつ正確に識別して位置を特定できるオープンソースのAI「ヨロV9」が公開された。

Appleが2024年に公開するiOS 18にてAI機能を大量に実装するのではないかと噂されている。

Googleとレディットがパートナーシップを拡大し、Googleがレディットデータにアクセスしてトレーニングなどに利用できるようになった。

楽天とOpenAIが楽天のネットワーク技術とOpenAIのAI技術を組み合わせて通信業界向けのAIツールを共同開発すると発表した。

OpenAIがベータ版として提供していたチャットGPTプラグイン機能を2024年4月9日に終了すると発表した。今後はGPTを使うように移行する。

ニューラリンクが開発した脳に埋め込む機器で、考えるだけでコンピューターのマウスを操作できるようになったと発表された。

Ubereatが2024年3月から東京都内の一部地域で、AIを駆使したロボットによるフード配送サービスを開始すると発表した。

Transcripts

play00:00

皆さんこんにちは今回の動画では間もなく

play00:05

チャットGPTに実装されるかもしれない

play00:08

ファイル分析ダリー3の新機能のリーク

play00:12

情報サンプル動画が続々公開中のオーAI

play00:16

の動画生成AI空の最新情報SNSで話題

play00:22

のAIとおしりできるコミュニケーション

play00:25

アプリこととも動画変換AIツール円ス

play00:30

AIミストラルの最新llmミストラル

play00:34

ラージなどここ1週間の間にリリースされ

play00:38

た最新のAIツールの概要と使い方を紹介

play00:42

しiOS員で実装される予定のApple

play00:46

のAI情報AIトレーニング絡みで

play00:50

Googleとレディットが定型などai

play00:53

関連の最新ニュースをお届けしますそれで

play00:56

はよろしくお願いし

play00:58

ます

play01:02

まずはチットGPTのリーク情報の紹介

play01:06

です海外のAI系のXユーザーによって

play01:10

将来的にチャットGPTに実装されるかも

play01:13

しれない情報のリークがありましたリーク

play01:17

情報は全部で2つあり1つ目がGPT4

play01:21

ADAV2という新しいGPT4モデルを

play01:26

使用しているデータアナリシスV2という

play01:29

機能でチャットGPTにExelファイル

play01:33

などをアップロードすると特定の列量セル

play01:37

を指定して分析できるようになるようです

play01:41

2つ目がGPT4に実装されている画像

play01:45

生成AIツールダリー3関連の機能として

play01:49

チットGPTで画像を作る際に生成する

play01:53

画像のスタイルを設定したり生成する画像

play01:57

の枚数やアスペクト比の調整などがが

play02:00

できる項目が追加されるようです2つとも

play02:03

まだ噂の段階ですがおそらく有料の

play02:07

チャットGPTプ向けの機能になると思い

play02:10

ますなおOpenAIはフザーという謎の

play02:15

ウェブサイトも公開しており近日中に何か

play02:18

新しいプロジェクトが立ち上がるかもしれ

play02:21

ません続いては空の最新情報の紹介です

play02:27

先日OpenAIが発表

play02:30

テキストや画像から動画を生成できる動画

play02:33

生成AIモデル空は既存の動画生生AI

play02:38

モデルと比べて動画のクオリティが桁違い

play02:41

に高いこともあり各種メディアで取り上げ

play02:44

られAI界隈で最もホットな話題となって

play02:48

いますここでは空の発表後にネット上で

play02:52

話題になった最新情報をまとめて紹介し

play02:55

ますまず空は実際にツールやAPIはまだ

play03:01

公開されていませんがオOpenAIの

play03:04

公開している空のテクニカルレポート

play03:07

ページの中で空の機能を事前に体験できる

play03:11

箇所が存在し人物人物の服装天候などの

play03:16

キーワードを変更して組み合わせにより

play03:19

様々な動画を生成できますまた空の発表後

play03:24

にオOpenAIの空の開発メンバーがx

play03:29

上で空で作ったサンプル動画を積極的に

play03:32

公開していて夕暮れの黒い砂浜を歩く

play03:36

ガラスの亀の動画シェフを目指す子犬たち

play03:40

の映画予告編的な動画海の中で未知の

play03:43

テクノロジーで作られたナパ戦を発見する

play03:46

スキューバダイバーの動画海を公開する

play03:49

蒸気戦とイルカのペーパークラフト動画

play03:52

などたくさんの動画が公開されており

play03:56

さらにtiktokのオOpenAIの

play03:59

アカウントには空で生成されたとされるF

play04:02

1ゲームのサンプル動画も公開されていて

play04:06

空の無限の可能性を感じることができます

play04:10

続いてはコトの紹介ですai関連製品を

play04:15

開発するスターレ株式会社は日常の

play04:18

コミュニケーションに特化した音声会話型

play04:21

のおしりAIアプリこもを公開しました

play04:26

このアプリは話相手になってくれるA

play04:30

こも自然な音声会話ができるのが特徴で

play04:34

会話には独自の学習データを用いて作られ

play04:38

た日常会話に特化したllmが使われて

play04:42

いるようですなおコはiOSアプリに対応

play04:46

していてAppストアからダウンロード

play04:49

すれば無料で利用できますAppストア

play04:53

からアプリをダウンロード後にアプリを

play04:55

立ち上げて端末のマイクを許可し相手にに

play04:59

なってくれることと対話しながら声や名前

play05:04

アイコンボイスなどの設定を完了するとコ

play05:08

と自由におしりできるようになります何度

play05:11

か使ってみましたが話している際にコが

play05:15

ちゃんと合槌をしてきたりしてかなり自然

play05:18

に会話できますこのアプリはSNSでも

play05:22

大きな話題になっておりメディア

play05:24

アーティストの落合洋一さんは2台の

play05:28

iPhoneを使ってコ同士を会話させて

play05:31

いました簡単操作でAIとの自然な会話を

play05:35

楽しめるのでiPhoneを利用している

play05:38

方はダウンロードして是非使ってみて

play05:42

ください続いてはGOエンハンスAIの

play05:45

紹介です動画を様々な画風の動画に変換し

play05:50

てくれる動画変換AIツールGO

play05:53

エンハンスAIが公開されましたツール

play05:56

トップページのトゴエンハンス4フリー

play05:59

ボタンを押して出てきた画面の右上のログ

play06:03

インボタンからGoogleアカウント

play06:05

などを使ってログインするとある程度無料

play06:09

で利用できますログイン後のページの左側

play06:13

にあるアップロードビデオの部分に動画を

play06:16

アップロードしてスタイルの部分で変換し

play06:19

たい動画のスタイルを選びビデオ

play06:22

デュレーションの部分で動画の長さを選ん

play06:24

でジェネレートボタンを押せば設定した

play06:28

スタイルが反映され動画が生成され作った

play06:32

動画をダウンロードできますGO

play06:34

エンハンスAIと同じことのできる同様の

play06:37

ツールにどAIがありますが

play06:40

Discord上で動作するどAIよりも

play06:43

GOエンハンスAIの方が操作性が良い

play06:46

ですなおGOエンハンスAIには画像を高

play06:51

画質化するアップスケーラー機能も実装さ

play06:53

れています続いてはミストラルラージの

play06:57

紹介ですフランスのAI企業ミストラル

play07:02

AIは同社の最新大規模言語モデル

play07:06

ミストラルラージを公開しました

play07:09

ミストラルラージは

play07:28

3万2000円Googleのjemi

play07:30

PROなどを両がし主要なllmの中で

play07:34

OpenAIのGPT4に継ぐ性能である

play07:38

とアピールしていますミストラルラージの

play07:41

APIはミストラルAIの公式ページで

play07:45

公開されていますまたミストラルラージの

play07:48

公開と同じタイミングでミストラルAIと

play07:52

Microsoftは定型を発表し

play07:55

Microsoftのクラウドサービス

play07:58

アール上でミストラルラージが使えるよう

play08:00

になりましたなお様々な大規模言語モデル

play08:05

を利用したAIチャットボットを無料で

play08:07

利用できる日本語対応のAIツールPO

play08:11

にてミストラルラージを試すことができ

play08:15

POにログインした状態で画面左上にある

play08:18

検索の部分でミストラルラージと検索して

play08:22

出てきたミストラルラージのアイコンを

play08:24

押すとミストラルラージを使って会話でき

play08:27

ます日本語に正式対応しているという

play08:31

アナウンスはないので日本語はやや苦手の

play08:34

ようでした続いてはGPTサーチの紹介

play08:39

ですパソコンでチャットGPTを利用する

play08:42

際に会話履歴の検索機能を実装できる

play08:46

Chrome拡張機能GPTサーチが公開

play08:50

されましたGPTサーチはChrome

play08:54

Webスアからダウンロードすれば利用

play08:56

できChromeブラウザ上で機能を有効

play09:00

にするとチャットGPT画面の左上に検索

play09:04

窓ができるのでそこで検索するとタイトル

play09:08

と会話履歴に引っかかった内容を表示して

play09:11

くれますただ現状で対応しているのは英語

play09:15

検索のみで日本語検索には対応していない

play09:19

ようですモバイルアプリのチャットGPT

play09:22

にはGPTサーチのような会話を検索する

play09:27

機能が実装されていますがパソコン版の

play09:30

チャットGPTには実装されていないので

play09:33

会話が大量に溜まっていて目的の会話を

play09:36

見つけたい際などには非常に便利な拡張

play09:39

機能だと言えます続いてはTTSアリーナ

play09:44

の紹介です世の中にあるあらゆるテキスト

play09:47

音声変換AIツールをユーザーの判定を元

play09:51

にランキング化するTTSバトル

play09:55

プラットフォームTTSアリーナが公開さ

play09:57

れましたTTSアリーナは主要な大規模

play10:02

言語モデルの性能をユーザーに競わせる

play10:05

チャットボットアリーナにインスパイアを

play10:07

受けて制作されたとのことでイブンラボス

play10:11

xttsV2メタボイスウィスパー

play10:15

スピーチなどの主要なTTSツールが

play10:18

ラインナップされていますTTSアリーナ

play10:21

はハギングフェス上で動作し上部のボート

play10:25

タブのカにあるフォームに英語テキストを

play10:29

入力してシセサイズボタンを押すと複数の

play10:33

ttsからランダムでAとBの2つの音声

play10:37

が出力されるので優れた回答と思った方に

play10:41

投票すると回答の出力に使われたモデル名

play10:45

が判明する形となっていますそしてツール

play10:49

画面上部のリーダーボードタブにユーザー

play10:52

の投票を元に作られたTTSのランキング

play10:55

が表示されていて現時点でのランキングで

play10:59

は有名TTSのイブラボスが1位になって

play11:03

いました続いてはSDXLライトニングの

play11:08

紹介ですバイトダンスは超高速でテキスト

play11:13

から1024か124ピクセルの画像を

play11:16

生成できるSDXLベースのAIモデル

play11:21

SDXLライトニングを発表しました

play11:25

プログレッシブ敵対的拡散上流モデルと

play11:28

いうワンステップから数ステップの短い

play11:31

ステップで高品質な画像を生成できる技術

play11:34

が使われているとのことでモデルの各種

play11:37

データはハギングフェスで提供されてい

play11:40

ますハギングフェイスで無料のデモも公開

play11:43

されていてフォームに作りたい画像の

play11:46

イメージをテキスト入力してセレクト

play11:49

インターフェイスステップスの部分で

play11:51

ステップ数を選択しLボタンを押せば

play11:56

10241024ピクルの画質画像が生成

play12:00

され作った画像はダウンロードできます

play12:04

生成速度も早くSDXLベースなだけあっ

play12:08

て非常に高画質です続いてはパロの紹介

play12:13

です英語中国語ヒンディ語スペイン語

play12:18

フランス語アラビア語ベンガル語ロシア語

play12:23

ウルドゥー語日本語という世界にある10

play12:27

の主要言語をカバーした

play12:29

オープンソースのマルチモーダル大規模

play12:31

言語モデルパロが公開されましたgit

play12:35

HUBにレポジトリが用意されていて

play12:38

ソースコードは後日提供予定となってい

play12:41

ますハギングフェスで無料のデモが公開さ

play12:44

れていてCのフォームを使って日本語で

play12:48

会話したりイメージの部分に画像を

play12:50

アップロードして画像の内容についての

play12:54

質問に答えてもらうこともできます日本語

play12:57

で何度か試したととろ不自然さは感じませ

play13:01

んでしたがハルシネーションはまだまだ

play13:04

多い気がしました続いてはヨロV9の紹介

play13:09

です画像や動画内の複数のオブジェクトを

play13:13

迅速かつ正確に識別して位置を特定できる

play13:16

オープンソースのリアルタイム

play13:18

オブジェクト検出AI陽V9が公開され

play13:22

ました養老というのはAIを使った物体

play13:26

検出手法のことでヨロV9に関しては従来

play13:31

のヨロ関連のツールと比較してより高い

play13:34

精度と効率を維持しながら性能を犠牲に

play13:38

することなく軽量モデルを実現したとして

play13:41

いますヨロV9のソースコードはキット

play13:45

ハブで公開されていてハギングフェスに

play13:48

簡単なデモが用意されていますデモでは

play13:52

画像をアップロードすると即座に画像内の

play13:55

オブジェクトを検出してオブジェクトの

play13:58

内容を言語表示してくれます養老は将来的

play14:03

に自動運転や異常検地医療の画像診断など

play14:07

の分野で利用できそうな注目のAI技術

play14:10

ですので気になった方は1度デモを触って

play14:13

みて

play14:17

くださいここからは今週発表されたai

play14:21

関連のニュースを簡単にまとめて紹介し

play14:24

ますまずはiOS員に実装されるAI機能

play14:30

の噂ですAppleは2024年に公開

play14:34

する予定のモバイル用の最新OSiOS

play14:38

18にてAI機能を大量に実装するのでは

play14:42

ないかと噂になっていますがこの噂につい

play14:45

てのまとめがAppleの情報を扱う

play14:48

ニュースサイト925Macに掲載され

play14:52

ましたそれによるとiOS18のAI機能

play14:57

の書になるのはAppleが開発している

play15:00

とされる大規模言語モデルApple

play15:03

GPTでありさらにはOpenAIの

play15:07

チャットGPTやGoogleのjemi

play15:10

などに似たllmを搭載した音声対話

play15:13

システムSiriが実装されたり音楽

play15:16

ストリーミングサービスのApple

play15:18

MusicでプレイリストをAIで自動

play15:21

生成できるようになったりページ

play15:24

レイアウトアプリページズプレゼンアプリ

play15:28

Enot表計算アプリナンバーズにAIが

play15:32

統合され要約やコンテンツの生成を自動で

play15:36

実行可能になるということですその他にも

play15:40

ヘルスケアアプリやメッセージアプリに

play15:43

AI機能が追加されるなどの噂が立って

play15:45

いるようでこれらの噂が真実であれば

play15:49

iOS18を実装したiPhoneはAI

play15:53

スマホと呼べるものになりそうです続いて

play15:57

はGoogleとレディットが定型の話題

play16:00

です2月22日Googleと掲示板

play16:04

サイトのレディットはパートナーシップを

play16:07

拡大したと発表しましたこれにより

play16:11

GoogleはレディットデータAPIを

play16:13

経由してレディット内のコンテンツに

play16:16

アクセスできるようになりこれをAIの

play16:19

トレーニングなどに利用できるようになり

play16:21

ましたまたレディットはGoogleの

play16:25

機械学習

play16:27

プラットフォームAIを使うことで

play16:30

レディットの検索機能などを強化する予定

play16:33

とのことですなおレディットは今回の

play16:38

Googleとの提携のタイミングで

play16:40

ニューヨーク証券取引所での新規上場申請

play16:44

を行いましたが申請の際の提出資料でオ

play16:48

AIのCEOであるサムアルトマン氏が

play16:52

レディットの第3位の株主だったと判明し

play16:55

て話題になっていました続いてはは楽天と

play16:59

OpenAIがAIツールを共同開発の

play17:02

話題です楽天とOpenAIは楽天の無線

play17:07

アクセスネットワーク技術オープンラント

play17:11

OpenAIのAI技術に関する知見を

play17:14

組み合わせることで通信業界向けの最先端

play17:18

AIツールを共同開発し今後提供を行うと

play17:22

発表しました具体的には現在楽天が展開し

play17:27

ているAIプラット

play17:29

楽天AIのネットワーク上の問題をリアル

play17:33

タイムに検出して解決する機能が強化さ

play17:36

れるようで楽天とオAIが開発するAI

play17:40

ツールに関しては個人向けというよりは

play17:43

企業向けに特化したものになるようです

play17:46

続いてはチャットGPTプラグインが終了

play17:50

の話題ですオープンAIは同社の開発系の

play17:55

公式Xアカウントにて20233年5月

play17:59

くらいから有料版のチャットGPT

play18:01

Plusユーザー向けにベータ版として

play18:04

提供していたプラグイン機能を2024年

play18:08

4月9日に終了すると発表しましたプラグ

play18:12

イン機能は終了しますが今後はGPSを

play18:16

使ってくださいというのがオAIの移行の

play18:20

ようですなおチャットGPTプラグインと

play18:24

してリリースされていたコンセンサス

play18:28

ウルフラムなどの有名ツールはすでに

play18:30

GPTに移行しています続いては考える

play18:35

だけでマウスを操作の話題です企業家の

play18:39

イーロンマスク氏は2024年2月に開か

play18:43

れたイベントでどしが共同設立した

play18:46

ニューラリンクが開発した小型の機器を脳

play18:49

に埋め込んだ臨床試験の危険者が考える

play18:52

だけでコンピューターのマウスを操作

play18:55

できるようになったと発表しましたただ

play18:58

具体的な詳細などは明らかにしていません

play19:01

マスク氏は2024年1月に

play19:05

ニューラリンクが開発した小型の機器を

play19:08

危険者の脳に埋め込んでコンピューターに

play19:11

直接つなぐ臨床試験を開始したと発表して

play19:14

いましたニューラリンクは人が考えるだけ

play19:18

でコンピューターを操作できることを

play19:20

目指しておりその目標に徐々に近づいて

play19:23

いっているようです続いてはUber

play19:27

eatが日本でロボット配送サービスを

play19:30

展開の話題ですフード宅配サービス

play19:34

Ubereatを提供するUbereat

play19:36

JAPANは2月21日AIを駆使した

play19:41

ロボットによるフード配送サービスを

play19:44

2024年3月から東京都内の一部地域で

play19:48

開始すると発表しました同時に三菱電気や

play19:53

米国のロボットメーカーカートケとの業務

play19:56

提携も発表しています

play19:58

UbereatJAPANのニュース

play20:00

リリースによるとこのサービスで使われる

play20:03

宅配ロボットは緑色の小型ロボットで車輪

play20:08

を6つ装備していて高度なAIモデルや

play20:11

アルゴリズムを活用した物体検地技術や

play20:14

自立走行性能遠隔操作機能を備えたカート

play20:18

牽制デリバリーロボットとのことで

play20:21

YouTubeではすでにロボット配送

play20:24

サービスを開始している米国で使われて

play20:27

いるロボットの映像を見ることもでき

play20:31

ますなおこの動画で紹介した記事やツール

play20:35

などのリンクは動画の概要欄に貼ってい

play20:39

ますAIツールに興味のある方は是非自分

play20:43

の手で試してみてくださいそれでは次回の

play20:46

動画でお会いし

play20:57

ましょう

play21:04

OG

Rate This

5.0 / 5 (0 votes)

هل تحتاج إلى تلخيص باللغة الإنجليزية؟