Another glorious battle for AI dominance… GPT-4o vs Google I/O
Summary
TLDR昨年のGoogle I/Oは、開発者向けの年次カンファレンスで、Googleは人工知能のライバルであるOpen AIと激しい競争を繰り広げました。Open AIは新しいGPT-4モデルを発表し、テキスト、ビジョン、音声を統合した単一モデルとして、人間のような会話能力を誇りました。一方、GoogleはGemini 1.5 Proを発表し、2百万トークンのコンテキストウィンドウを扱えるようになりました。また、Firebaseデータコネクトという新機能も発表され、これはPostgressをFirebaseに統合するという長年の要望を満たすものです。さらに、Googleは新しいハードウェアやデータセンター向けのCPU、ビデオジェネレーションモデル「vo」など、さまざまな新技術を発表しましたが、人工知能の進歩に対して少し失望していると述べています。
Takeaways
- 📅 Google I/Oは、Googleが毎年開催する開発者向けのカンファレンスです。
- 🤖 OpenAIは新しいGPT-4モデルを発表し、Google I/Oの数時間前に発表することで話題を集めました。
- 🚀 GPT-4は、テキスト、ビジョン、音声を統合した単一モデルで、人間のような会話能力を持ちます。
- 📱 OpenAIはiPhoneへの導入について話し合っており、Googleも自分のフラグシップモデルをiPhoneに搭載したいと考えています。
- 🧠 OpenAIは共同創設者であり、元チーフサイエンティストであるIlyaに別れを告げました。
- 🔍 GoogleはGemini 1.5 Proを発表し、2百万のトークンコンテキストウィンドウを扱えるようになりました。
- 💰 Googleはトークンの再利用ができるコンテキストキャッシングという新機能をリリースしました。
- 🚗 Googleは開発者コンテストを開催し、最優秀のGeminiパワードアプリを開発した者には電気DeLoreanを賞品に与えます。
- 🔧 Firebase Gen Kitという新しいツールをリリースし、Firebaseと統合してAI対応APIエンドポイントを簡単に構築できます。
- 🔥 Firebase Data Connectという新しいツールが発表され、FirebaseにPostgressを正式に導入しました。
- 💾 Googleは新しいハードウェアであるTrillium TPUとAxionという新しいARMベースCPUを発表しました。
- 🎥 GoogleはOpenAIのSoraと競うための生成ビデオモデルであるVOを発表しました。
- 🤔 技術は進化しているものの、人工知能が独立して学習できるようになることなく、シンギュラリティへの進歩は見えないと感じる声もいます。
Q & A
Google IOはどのような年度の開発者向けカンファレンスですか?
-Google IOは、Googleが主催する年度の開発者向けカンファレンスで、最新の技術や製品を発表する場です。
Open AIが発表したGPT-4の主要な特徴は何ですか?
-GPT-4は、テキスト、ビジョン、音声を一つのモデルに統合し、人間のように会話ができる機能を持つ新モデルです。また、声のトーンも劇的から皮肉から、とてもリラックスしているようにまで変えることができます。
Open AIとAppleの間でどのような協議が進行中ですか?
-Open AIは、自分の技術をiPhoneに搭載する協議を進めています。一方、Googleも自分のフラグシップモデルをiPhoneに搭載したいと考えており、競合しています。
Googleがデモしたプロジェクトアストロとは何ですか?
-プロジェクトアストロは、Open AIのOmniに似た機能を持ちますが、音声のロボット感や遅延が少しあるとされています。
Open AIが発表した新しいモデルGPT-4はいつ利用可能になる予定ですか?
-GPT-4のモデルは現在利用可能ですが、会話部分はまだ一般には公開されていません。
Googleが発表したGemini 1.5 Proの特長は何ですか?
-Gemini 1.5 Proは、200万トークンのコンテキストウィンドウを扱える能力を持ち、ビデオコンテンツやコードの大量のコンテキストを処理できます。また、トークンの再利用ができるコンテキストキャッシングという新機能も発表されました。
Firebase gen kitとは何ですか?
-Firebase gen kitは、Firebaseと統合され、AIが有効なAPIエンドポイントを簡単に構築できるツールです。
Firebase data connectが解決する問題は何ですか?
-Firebase data connectは、PostgressをFirebaseに公式に取り入れることで、SQLとFirebaseを組み合わせることができるようになり、これは数年来の最も要求された機能でした。
Googleが発表した新しいハードウェアには何がありますか?
-Googleは新しいハードウェアとして、Trillium TPUとAxionという新しいARMベースCPUをデータセンター用に発表しました。
Googleが発表したVegaとは何ですか?
-Vegaは、Open AIのSoraと競合するジェネラティブビデオモデルで、非常に印象的です。
最近のAIの進歩に対してどのような意見が述べられていますか?
-最近のAIの進歩に対して、モデルをより速く、安くすることは素晴らしいが、それらがより賢くならない限り、シンギュラリティは見えないという意見が述べられています。
Code Reportの次回放送はいつですか?
-Code Reportの次回放送は、次の動画で見ることができますが、具体的な日付は記載されていません。
Outlines
📈 Google IOとOpen AIの競争
Google IOは、Googleが毎年開催する開発者向けのカンファレンスです。今年も、GoogleはOpen AIと呼ばれる人工知能のライバルと激しい競争を繰り広げています。Googleは、FirebaseのためのSQLデータベースなど、驚くべき発表を行いました。しかし、Google IOの数時間前にOpen AIが新しいGPT-4を発表し、話題をさらってしまいました。また、Open AIはiPhoneにも技術を搭載する可能性があるとの話がされていますが、Googleも同じくiPhoneへの搭載を目指しています。
🚀 Open AIの新しいモデルGPT-4
Open AIは、新しいフラグシップモデルであるGPT-4を発表しました。GPT-4は、テキスト、ビジョン、音声を1つのモデルに統合し、人間のように会話できる能力を持っています。しかし、会話部分はまだ一般には公開されていません。また、Open AIは元チーフサイエンティストであるイリヤと別れたとの情報もあり、背後には何かしらのドラマがあるとされています。
🔍 Googleの新しいAI技術Gemini 1.5 Pro
Googleは、Gemini 1.5 Proという新しいAI技術を発表しました。これは、200万トークンのコンテキストウィンドウを扱える能力があり、ビデオコンテンツやコードの大量のコンテキストを処理できます。また、トークンの再利用を可能にする新しい機能であるコンテキストキャッシングも発表されました。さらに、Googleは開発者向けにコンテストを開催し、最優秀のGeminiアプリケーションを開発した開発者に電気DeLoreanを賞品に与えます。
🔧 Firebaseと新しいツールの登場
Googleは、Firebase gen kitという新しいツールを発表しました。これは、Firebaseと統合され、AIが有効なAPIエンドポイントを簡単に構築できるようにするものです。また、プロジェクトidxは、モバイルエミュレータなどと統合されたブラウザベースのVS Codeがオープンとなりました。私が最も興奮したのは、Firebase data connectという新しいツールです。これは、PostgressをFirebaseに統合し、SQLとFirebaseを一緒に使うことができるようになりました。
💾 Googleの新しいハードウェアとビデオモデル
Googleは、新しいハードウェアであるTrillium TPUやAxionという新しいARMベースCPUを発表しました。これらはデータセンターに使用されるものです。また、GoogleはOpen AIのSoraと競うためにvoという生成ビデオモデルも発表しました。これらの技術は1年前に比べて非常に印象的ですが、Open AIの背後で1歩遅れている感じがします。
🤔 技術進歩とシギュラリティへの期待
さまざまな新しいゲームチェンジ技術を見てきましたが、シギュラリティへの進歩には少し失望しています。GPT-4やOmni Claude、Gemini 1.5は、基準でどれだけ遠くまで到達できるかという点でほぼ限界に達しているように見えます。モデルを高速化・低コスト化することは素晴らしいですが、それらがより賢くなっているわけではないため、シギュラリティはまだ見えないようです。AIが独立して学習できるようになることが必要です。
Mindmap
Keywords
💡Google IO
💡Open AI
💡GPT-4
💡Project Astro
💡Gemini 1.5 Pro
💡Context Caching
💡Firebase
💡Superbase
💡Trillium TPUs
💡Axion
💡VO
Highlights
Google IO is an annual developer conference where Google announces new technologies.
Open AI released GPT-4 just hours before Google IO, showcasing its advanced capabilities.
GPT-4 combines text, vision, and audio into a single model with impressive conversational abilities.
Open AI's technology is in talks to be integrated into the iPhone, competing with Google's flagship model.
Google demoed Project Astro, a technology with similarities to Open AI's Omni model.
Open AI has parted ways with Ilya Sutskever, its former Chief Scientist and co-founder.
Google announced Gemini 1.5 Pro, capable of handling a 2 million token context window.
Context caching is a new feature that allows for the reuse of tokens at a fraction of the cost.
Google launched a competition for developers to build the best Gemini powered app.
Firebase Gen Kit is a new tool integrated with Firebase for building AI-enabled API endpoints.
Project idx is now open to the public, a browser-based VS Code integrated with mobile emulators.
Firebase Data Connect officially brings PostgreSQL into Firebase, a highly requested feature.
Superbase, a Firebase alternative, has been affected by Firebase's new SQL capabilities.
Google announced new hardware like Trillium TPUs and Axion, its new ARM-based CPUs for data centers.
VO is Google's generative video model, competing with Open AI's Sora.
Despite advancements, there is disappointment in the slow progress towards the singularity.
AI models are becoming faster and cheaper, but intelligence and independent learning are still lacking.
The current state of AI seems to be on the edge of a plateau, with the potential for disillusionment.
Transcripts
yesterday was Google IO the annual
developer conference where Google
desperately tries to catch up to its
artificial rival open AI
Google Google announced some crazy stuff
I never thought I would see in my
lifetime like a SQL database for
Firebase more on that later because
first we need to talk about the biggest
announcement at iio open ai's new GPT 4
oh oh oh you see open AI hype Lord Sam
Alman yet again wrapped up Sundar in a
wet blanket by releasing GPT 40 just
hours before Google IO which is a total
coincidence and definitely not designed
to troll Google in today's video we'll
break down this artificial beef but more
importantly look at all kinds of crazy
new technology released in just the last
48 hours it is May 15th 2024 and you
watching the code report on Monday open
aai had a surprise spring update where
they unveiled their new flagship model
gp4 Omni you've got me on the edge of my
well I don't really have a seat but you
get the idea what's the big news yeah
we've got a new model which is faster
and cheaper than gp4 turbo and combines
text vision and audio into a single
model what was most impressive though
was its humanlike conversational
abilities well well well just when I
thought things couldn't get any more
interesting talking to another AI that
can see the World by default it uses a
California Valley Girl accent set to
maximum cringe but the tone of the voice
can vary from dramatic to sarcastic to
Super chill for bedtime stories a
bedtime story about robots and love I
got you covered this technology will be
a huge leap forward for your AI
girlfriend and you can use the GPT 40
model today but the conversational part
of it is still not available to the
public that's disappointing but what you
also need to know is that open AI is in
talks to put their technology on the
iPhone but Google also wants to get its
Flagship model on the iPhone as well it
talks are on going to also get Gemini on
the iPhone so these companies are
competing to create a model that's smart
but also fast and cheap enough to run on
mobile in order to get that massive bag
from Apple yesterday at IO Google demoed
something called project Astro which
feels similar to for Omni do you
remember where you saw my
glasses yes I do your glasses were on
the desk near a red apple it's cool but
there's more latency and the voice is
more robotic compared to open AI now
what's also very interesting is that
open AI just parted ways with Ilia their
former Chief scientist and co-founder
who many people used to worship as the
brains behind open AI there's definitely
some underline drama here but we likely
won't know the truth until they release
their Memoirs in the 2040s but now let's
finally talk about Google IO the biggest
AI announcement from Google was Gemini
1.5 Pro which can now handle a 2 million
token context window that could be 2
hours of video content or 60,000 lines
of code that's a lot of context but
tokens can be expensive and to address
that they released a new feature called
context caching that can reuse tokens
for a fraction of the cost in addition
Google launched a competition for
developers and whoever builds the best
Gemini powered app wins an electric
DeLorean to make building this app
easier they also released a new tool
called Firebase gen kit which which is
integrated with oama and makes it easy
to build AI enabled API endpoints in
addition project idx is now open to the
public which is a browser-based vs code
that's also integrated with things like
mobile emulators by far the most
exciting thing for me though is a new
tool called Firebase data connect which
officially brings postgress into
Firebase this has been the number one
most requested feature for years how do
I use Firebase with SQL and its absence
is led to startups like superbase which
is branded as a Firebase alternative but
now in 2024 the turns of table Firebase
is now the superbase alternative I'm a
big fan of both super base and Firebase
and if you want to learn these
Technologies check out my full courses
on fireship iio and stay tuned for a
full tutorial on data connect on my
second Channel Beyond fireship soon
Google also announced some new hardware
like Trillium tpus and Axion its new
arm-based CPUs for data centers and
finally Google also announced vo a
generative video model to compete with
open AI Sora it's extremely impressive
compared to where we were just a year
ago but yet again it just feels one step
on behind open AI we just looked at all
kinds of crazy new gamechanging
technology but at this point I'm feeling
a little disappointed with our progress
towards the singularity it's been over a
year since GPT 4 and unfortunately I
still have a job four Omni Claude and
Gemini 1.5 all seem to be pretty maxed
out on how far they can get with these
benchmarks making models faster and
cheaper is great but if they're not
becoming more intelligent then the
singularity is nowhere in sight they've
already absorbed almost all the
information humans have created is so
unless there's a major breakthrough that
makes AI actually intelligent and able
to learn independently it sure looks
like we're standing on the edge of a
plateau and the only place to go is the
trough of disillusionment this has been
the code report thanks for watching and
I will see you in the next one
5.0 / 5 (0 votes)