Google I/O 2024 keynote in 17 minutes

The Verge

14 May 202417:03

Summary

TLDRDans cette conférence Google IO, la société a annoncé une série d'améliorations et de lancements technologiques impressionnants. Le nouveau système Gemini 1.5 Pro, avec un contexte étendu à 1 million de jetons, sera disponible pour les développeurs et les consommateurs dans 35 langues. Google prévoit d'élargir la fenêtre de contexte à 2 millions de jetons, un pas en avant vers l'objectif ultime de contexte infini. Les outils génératifs de médias, tels que Image 3, Music AI Sandbox et le modèle de vidéo VR, offriront des expériences plus immersives et personnalisées. La sixième génération de TPU, Trillium, apportera une amélioration significative des performances de calcul. De nouvelles fonctionnalités dans Google Search, comme la raison multi-étapes et la recherche vidéo, rendront la recherche d'informations plus efficace. Les utilisateurs de Gmail mobile bénéficieront de nouvelles capacités telles que la synthèse et la réponse aux questions directement dans l'application. Gemini Nano, avec ses capacités multimodales, améliorera l'accessibilité pour les utilisateurs. Les modèles Gemini 1.5 Flash et Pro seront tarifés compétitifs, et l'introduction de Poly Gemma, le premier modèle de langage vision open, promet de nouvelles possibilités pour les développeurs. L'ensemble de ces annonces montre l'engagement de Google pour l'innovation et l'amélioration continue de l'expérience des utilisateurs.

Takeaways

🚀 Lancement d'une nouvelle expérience de recherche améliorée avec Gemini, qui sera disponible pour tous les développeurs à l'échelle mondiale.
📈 Gemini 1.5 Pro, avec un contexte de 1 million de tokens, sera directement accessible pour les consommateurs dans Gemini Advanced et sera utilisable dans 35 langues.
🔍 Expansion de la fenêtre de contexte à 2 millions de tokens, représentant une étape supplémentaire vers l'objectif ultime du contexte infini.
📱 Progrès dans l'assistance IA avec le projet Astra, qui comprend des outils génératifs pour l'image, la musique et la vidéo.
🎥 Introduction d'Imagine 3, un modèle plus photoréaliste avec des détails enrichis et moins d'artefacts visuels.
🎼 Mise en place de Music AI Sandbox, un ensemble d'outils IA musicale professionnel pour créer de nouvelles sections instrumentales et transférer des styles entre pistes.
📹 Présentation du modèle de vidéo génératif le plus performant appelé VR, capable de créer des vidéos 1080p de haute qualité à partir de textes, d'images et de vidéos.
🧠 Intégration de la raisonnement à plusieurs étapes dans Google Search pour répondre à des questions plus complexes.
📧 Nouveaux développements dans Gmail mobile avec des fonctionnalités telles que la synthèse des e-mails et la réponse aux questions directement dans les cartes mobiles.
📊 Prochain lancement de la sixième génération de TPUs appelée Trillium, offrant une amélioration significative des performances de calcul par rapport à la génération précédente.
💬 Prochaine disponibilité d'un nouveau tableau de bord Gemini pour Gmail, avec des capacités telles que la création de documents et la visualisation des revenus.