Another glorious battle for AI dominance… GPT-4o vs Google I/O

Fireship
15 May 202404:39

Summary

TLDR昨年のGoogle I/Oは、開発者向けの年次カンファレンスで、Googleは人工知能のライバルであるOpen AIと激しい競争を繰り広げました。Open AIは新しいGPT-4モデルを発表し、テキスト、ビジョン、音声を統合した単一モデルとして、人間のような会話能力を誇りました。一方、GoogleはGemini 1.5 Proを発表し、2百万トークンのコンテキストウィンドウを扱えるようになりました。また、Firebaseデータコネクトという新機能も発表され、これはPostgressをFirebaseに統合するという長年の要望を満たすものです。さらに、Googleは新しいハードウェアやデータセンター向けのCPU、ビデオジェネレーションモデル「vo」など、さまざまな新技術を発表しましたが、人工知能の進歩に対して少し失望していると述べています。

Takeaways

  • 📅 Google I/Oは、Googleが毎年開催する開発者向けのカンファレンスです。
  • 🤖 OpenAIは新しいGPT-4モデルを発表し、Google I/Oの数時間前に発表することで話題を集めました。
  • 🚀 GPT-4は、テキスト、ビジョン、音声を統合した単一モデルで、人間のような会話能力を持ちます。
  • 📱 OpenAIはiPhoneへの導入について話し合っており、Googleも自分のフラグシップモデルをiPhoneに搭載したいと考えています。
  • 🧠 OpenAIは共同創設者であり、元チーフサイエンティストであるIlyaに別れを告げました。
  • 🔍 GoogleはGemini 1.5 Proを発表し、2百万のトークンコンテキストウィンドウを扱えるようになりました。
  • 💰 Googleはトークンの再利用ができるコンテキストキャッシングという新機能をリリースしました。
  • 🚗 Googleは開発者コンテストを開催し、最優秀のGeminiパワードアプリを開発した者には電気DeLoreanを賞品に与えます。
  • 🔧 Firebase Gen Kitという新しいツールをリリースし、Firebaseと統合してAI対応APIエンドポイントを簡単に構築できます。
  • 🔥 Firebase Data Connectという新しいツールが発表され、FirebaseにPostgressを正式に導入しました。
  • 💾 Googleは新しいハードウェアであるTrillium TPUとAxionという新しいARMベースCPUを発表しました。
  • 🎥 GoogleはOpenAIのSoraと競うための生成ビデオモデルであるVOを発表しました。
  • 🤔 技術は進化しているものの、人工知能が独立して学習できるようになることなく、シンギュラリティへの進歩は見えないと感じる声もいます。

Q & A

  • Google IOはどのような年度の開発者向けカンファレンスですか?

    -Google IOは、Googleが主催する年度の開発者向けカンファレンスで、最新の技術や製品を発表する場です。

  • Open AIが発表したGPT-4の主要な特徴は何ですか?

    -GPT-4は、テキスト、ビジョン、音声を一つのモデルに統合し、人間のように会話ができる機能を持つ新モデルです。また、声のトーンも劇的から皮肉から、とてもリラックスしているようにまで変えることができます。

  • Open AIとAppleの間でどのような協議が進行中ですか?

    -Open AIは、自分の技術をiPhoneに搭載する協議を進めています。一方、Googleも自分のフラグシップモデルをiPhoneに搭載したいと考えており、競合しています。

  • Googleがデモしたプロジェクトアストロとは何ですか?

    -プロジェクトアストロは、Open AIのOmniに似た機能を持ちますが、音声のロボット感や遅延が少しあるとされています。

  • Open AIが発表した新しいモデルGPT-4はいつ利用可能になる予定ですか?

    -GPT-4のモデルは現在利用可能ですが、会話部分はまだ一般には公開されていません。

  • Googleが発表したGemini 1.5 Proの特長は何ですか?

    -Gemini 1.5 Proは、200万トークンのコンテキストウィンドウを扱える能力を持ち、ビデオコンテンツやコードの大量のコンテキストを処理できます。また、トークンの再利用ができるコンテキストキャッシングという新機能も発表されました。

  • Firebase gen kitとは何ですか?

    -Firebase gen kitは、Firebaseと統合され、AIが有効なAPIエンドポイントを簡単に構築できるツールです。

  • Firebase data connectが解決する問題は何ですか?

    -Firebase data connectは、PostgressをFirebaseに公式に取り入れることで、SQLとFirebaseを組み合わせることができるようになり、これは数年来の最も要求された機能でした。

  • Googleが発表した新しいハードウェアには何がありますか?

    -Googleは新しいハードウェアとして、Trillium TPUとAxionという新しいARMベースCPUをデータセンター用に発表しました。

  • Googleが発表したVegaとは何ですか?

    -Vegaは、Open AIのSoraと競合するジェネラティブビデオモデルで、非常に印象的です。

  • 最近のAIの進歩に対してどのような意見が述べられていますか?

    -最近のAIの進歩に対して、モデルをより速く、安くすることは素晴らしいが、それらがより賢くならない限り、シンギュラリティは見えないという意見が述べられています。

  • Code Reportの次回放送はいつですか?

    -Code Reportの次回放送は、次の動画で見ることができますが、具体的な日付は記載されていません。

Outlines

00:00

📈 Google IOとOpen AIの競争

Google IOは、Googleが毎年開催する開発者向けのカンファレンスです。今年も、GoogleはOpen AIと呼ばれる人工知能のライバルと激しい競争を繰り広げています。Googleは、FirebaseのためのSQLデータベースなど、驚くべき発表を行いました。しかし、Google IOの数時間前にOpen AIが新しいGPT-4を発表し、話題をさらってしまいました。また、Open AIはiPhoneにも技術を搭載する可能性があるとの話がされていますが、Googleも同じくiPhoneへの搭載を目指しています。

🚀 Open AIの新しいモデルGPT-4

Open AIは、新しいフラグシップモデルであるGPT-4を発表しました。GPT-4は、テキスト、ビジョン、音声を1つのモデルに統合し、人間のように会話できる能力を持っています。しかし、会話部分はまだ一般には公開されていません。また、Open AIは元チーフサイエンティストであるイリヤと別れたとの情報もあり、背後には何かしらのドラマがあるとされています。

🔍 Googleの新しいAI技術Gemini 1.5 Pro

Googleは、Gemini 1.5 Proという新しいAI技術を発表しました。これは、200万トークンのコンテキストウィンドウを扱える能力があり、ビデオコンテンツやコードの大量のコンテキストを処理できます。また、トークンの再利用を可能にする新しい機能であるコンテキストキャッシングも発表されました。さらに、Googleは開発者向けにコンテストを開催し、最優秀のGeminiアプリケーションを開発した開発者に電気DeLoreanを賞品に与えます。

🔧 Firebaseと新しいツールの登場

Googleは、Firebase gen kitという新しいツールを発表しました。これは、Firebaseと統合され、AIが有効なAPIエンドポイントを簡単に構築できるようにするものです。また、プロジェクトidxは、モバイルエミュレータなどと統合されたブラウザベースのVS Codeがオープンとなりました。私が最も興奮したのは、Firebase data connectという新しいツールです。これは、PostgressをFirebaseに統合し、SQLとFirebaseを一緒に使うことができるようになりました。

💾 Googleの新しいハードウェアとビデオモデル

Googleは、新しいハードウェアであるTrillium TPUやAxionという新しいARMベースCPUを発表しました。これらはデータセンターに使用されるものです。また、GoogleはOpen AIのSoraと競うためにvoという生成ビデオモデルも発表しました。これらの技術は1年前に比べて非常に印象的ですが、Open AIの背後で1歩遅れている感じがします。

🤔 技術進歩とシギュラリティへの期待

さまざまな新しいゲームチェンジ技術を見てきましたが、シギュラリティへの進歩には少し失望しています。GPT-4やOmni Claude、Gemini 1.5は、基準でどれだけ遠くまで到達できるかという点でほぼ限界に達しているように見えます。モデルを高速化・低コスト化することは素晴らしいですが、それらがより賢くなっているわけではないため、シギュラリティはまだ見えないようです。AIが独立して学習できるようになることが必要です。

Mindmap

Keywords

💡Google IO

Google IOは、グーグルが開く年度的な開発者向けカンファレンスです。ここでは、グーグルは最新の技術や製品を発表し、開発者コミュニティと情報を共有します。ビデオでは、Google IOでの発表が話題となっています。

💡Open AI

Open AIは、人工知能技術の研究と開発を行う組織です。ビデオでは、Open AIが新しいモデルGPT-4を発表し、それに続いてグーグルが対抗する発表を行うという対比が描かれています。

💡GPT-4

GPT-4は、Open AIが開発した最新のフラグシップモデルで、テキスト、ビジョン、音声を一つのモデルに統合し、人間のような会話能力を持ちます。ビデオでは、その発表がグーグルIOの前に行われ、話題となっています。

💡Project Astro

Project Astroは、Googleが開発しているプロジェクトで、人工知能を活用した機能を提供することを目指しています。ビデオでは、Google IOでのデモとして紹介されており、Open AIのOmniと比較されています。

💡Gemini 1.5 Pro

Gemini 1.5 Proは、Googleが発表したAIモデルで、2百万のトークンコンテキストウィンドウを扱えることが特徴です。ビデオでは、これはビデオコンテンツやコードの大量なコンテキストを処理できると説明されています。

💡Context Caching

Context Cachingは、Googleが提供する新機能で、トークンを再利用してコストを削減することができるというものです。ビデオでは、これはトークンが高価である問題に対処する手段として紹介されています。

💡Firebase

Firebaseは、Googleが提供するモバイルアプリケーションとウェブアプリケーションの開発プラットフォームです。ビデオでは、Firebaseデータコネクトという新しいツールが紹介されており、PostgressをFirebaseに統合することで、SQLを使用したデータ管理が可能になるという話題がされています。

💡Superbase

Superbaseは、Firebaseの代替として位置づけられており、SQLを使用したデータ管理が可能なプラットフォームです。ビデオでは、FirebaseがPostgressを統合することで、Superbaseとはどのような関係にあるのかが説明されています。

💡Trillium TPUs

Trillium TPUsは、Googleが発表した新しいハードウェアで、データセンターで使用されるための新しいアームベースCPUです。ビデオでは、Googleが新しいハードウェア技術を導入し、AIの性能を向上させることを目指していることが言及されています。

💡Axion

Axionは、Googleが開発した新しいARMベースCPUで、データセンターでの使用を目的としています。ビデオでは、GoogleがAI分野でハードウェアも開発し、全体的な性能向上を目指していることが説明されています。

💡VO

VOは、Googleが発表した生成ビデオモデルで、Open AIのSoraと競合することを目指しています。ビデオでは、VOが過去1年間に比べて非常に印象的な進歩を遂げていると評価されていますが、Open AIの背後から一歩遅れているとも述べています。

Highlights

Google IO is an annual developer conference where Google announces new technologies.

Open AI released GPT-4 just hours before Google IO, showcasing its advanced capabilities.

GPT-4 combines text, vision, and audio into a single model with impressive conversational abilities.

Open AI's technology is in talks to be integrated into the iPhone, competing with Google's flagship model.

Google demoed Project Astro, a technology with similarities to Open AI's Omni model.

Open AI has parted ways with Ilya Sutskever, its former Chief Scientist and co-founder.

Google announced Gemini 1.5 Pro, capable of handling a 2 million token context window.

Context caching is a new feature that allows for the reuse of tokens at a fraction of the cost.

Google launched a competition for developers to build the best Gemini powered app.

Firebase Gen Kit is a new tool integrated with Firebase for building AI-enabled API endpoints.

Project idx is now open to the public, a browser-based VS Code integrated with mobile emulators.

Firebase Data Connect officially brings PostgreSQL into Firebase, a highly requested feature.

Superbase, a Firebase alternative, has been affected by Firebase's new SQL capabilities.

Google announced new hardware like Trillium TPUs and Axion, its new ARM-based CPUs for data centers.

VO is Google's generative video model, competing with Open AI's Sora.

Despite advancements, there is disappointment in the slow progress towards the singularity.

AI models are becoming faster and cheaper, but intelligence and independent learning are still lacking.

The current state of AI seems to be on the edge of a plateau, with the potential for disillusionment.

Transcripts

play00:00

yesterday was Google IO the annual

play00:02

developer conference where Google

play00:03

desperately tries to catch up to its

play00:05

artificial rival open AI

play00:08

Google Google announced some crazy stuff

play00:10

I never thought I would see in my

play00:11

lifetime like a SQL database for

play00:13

Firebase more on that later because

play00:15

first we need to talk about the biggest

play00:16

announcement at iio open ai's new GPT 4

play00:19

oh oh oh you see open AI hype Lord Sam

play00:22

Alman yet again wrapped up Sundar in a

play00:25

wet blanket by releasing GPT 40 just

play00:27

hours before Google IO which is a total

play00:30

coincidence and definitely not designed

play00:31

to troll Google in today's video we'll

play00:33

break down this artificial beef but more

play00:35

importantly look at all kinds of crazy

play00:36

new technology released in just the last

play00:38

48 hours it is May 15th 2024 and you

play00:42

watching the code report on Monday open

play00:43

aai had a surprise spring update where

play00:46

they unveiled their new flagship model

play00:47

gp4 Omni you've got me on the edge of my

play00:51

well I don't really have a seat but you

play00:53

get the idea what's the big news yeah

play00:56

we've got a new model which is faster

play00:58

and cheaper than gp4 turbo and combines

play01:00

text vision and audio into a single

play01:02

model what was most impressive though

play01:04

was its humanlike conversational

play01:06

abilities well well well just when I

play01:09

thought things couldn't get any more

play01:11

interesting talking to another AI that

play01:14

can see the World by default it uses a

play01:17

California Valley Girl accent set to

play01:19

maximum cringe but the tone of the voice

play01:21

can vary from dramatic to sarcastic to

play01:23

Super chill for bedtime stories a

play01:25

bedtime story about robots and love I

play01:28

got you covered this technology will be

play01:30

a huge leap forward for your AI

play01:32

girlfriend and you can use the GPT 40

play01:34

model today but the conversational part

play01:36

of it is still not available to the

play01:37

public that's disappointing but what you

play01:39

also need to know is that open AI is in

play01:41

talks to put their technology on the

play01:43

iPhone but Google also wants to get its

play01:45

Flagship model on the iPhone as well it

play01:47

talks are on going to also get Gemini on

play01:48

the iPhone so these companies are

play01:50

competing to create a model that's smart

play01:52

but also fast and cheap enough to run on

play01:54

mobile in order to get that massive bag

play01:56

from Apple yesterday at IO Google demoed

play01:58

something called project Astro which

play02:00

feels similar to for Omni do you

play02:01

remember where you saw my

play02:05

glasses yes I do your glasses were on

play02:08

the desk near a red apple it's cool but

play02:10

there's more latency and the voice is

play02:11

more robotic compared to open AI now

play02:13

what's also very interesting is that

play02:15

open AI just parted ways with Ilia their

play02:17

former Chief scientist and co-founder

play02:19

who many people used to worship as the

play02:21

brains behind open AI there's definitely

play02:23

some underline drama here but we likely

play02:25

won't know the truth until they release

play02:26

their Memoirs in the 2040s but now let's

play02:29

finally talk about Google IO the biggest

play02:31

AI announcement from Google was Gemini

play02:33

1.5 Pro which can now handle a 2 million

play02:35

token context window that could be 2

play02:37

hours of video content or 60,000 lines

play02:40

of code that's a lot of context but

play02:41

tokens can be expensive and to address

play02:43

that they released a new feature called

play02:45

context caching that can reuse tokens

play02:47

for a fraction of the cost in addition

play02:49

Google launched a competition for

play02:51

developers and whoever builds the best

play02:52

Gemini powered app wins an electric

play02:54

DeLorean to make building this app

play02:56

easier they also released a new tool

play02:58

called Firebase gen kit which which is

play03:00

integrated with oama and makes it easy

play03:02

to build AI enabled API endpoints in

play03:04

addition project idx is now open to the

play03:06

public which is a browser-based vs code

play03:09

that's also integrated with things like

play03:10

mobile emulators by far the most

play03:12

exciting thing for me though is a new

play03:14

tool called Firebase data connect which

play03:16

officially brings postgress into

play03:18

Firebase this has been the number one

play03:19

most requested feature for years how do

play03:21

I use Firebase with SQL and its absence

play03:24

is led to startups like superbase which

play03:26

is branded as a Firebase alternative but

play03:28

now in 2024 the turns of table Firebase

play03:31

is now the superbase alternative I'm a

play03:33

big fan of both super base and Firebase

play03:35

and if you want to learn these

play03:35

Technologies check out my full courses

play03:37

on fireship iio and stay tuned for a

play03:39

full tutorial on data connect on my

play03:41

second Channel Beyond fireship soon

play03:43

Google also announced some new hardware

play03:44

like Trillium tpus and Axion its new

play03:47

arm-based CPUs for data centers and

play03:49

finally Google also announced vo a

play03:51

generative video model to compete with

play03:53

open AI Sora it's extremely impressive

play03:56

compared to where we were just a year

play03:57

ago but yet again it just feels one step

play03:59

on behind open AI we just looked at all

play04:01

kinds of crazy new gamechanging

play04:02

technology but at this point I'm feeling

play04:04

a little disappointed with our progress

play04:06

towards the singularity it's been over a

play04:08

year since GPT 4 and unfortunately I

play04:10

still have a job four Omni Claude and

play04:12

Gemini 1.5 all seem to be pretty maxed

play04:14

out on how far they can get with these

play04:16

benchmarks making models faster and

play04:17

cheaper is great but if they're not

play04:19

becoming more intelligent then the

play04:20

singularity is nowhere in sight they've

play04:22

already absorbed almost all the

play04:23

information humans have created is so

play04:25

unless there's a major breakthrough that

play04:26

makes AI actually intelligent and able

play04:28

to learn independently it sure looks

play04:30

like we're standing on the edge of a

play04:31

plateau and the only place to go is the

play04:33

trough of disillusionment this has been

play04:35

the code report thanks for watching and

play04:37

I will see you in the next one

Rate This

5.0 / 5 (0 votes)

Related Tags
Google I/OOpenAIGPT-4AI技術プロジェクトアストロFirebaseデータベースハードウェア競争未来予測開発者大会
Do you need a summary in English?