La trouvaille stupéfiante de chercheurs sur cette IA qui joue à Minecraft

Underscore_
3 Jun 202415:14

Summary

TLDRLe script explore l'usage de Minecraft comme plateforme d'entraînement pour l'IA, mettant en avant le bot 'Voyageur' développé par Nvidia. Voyageur démontre une capacité d'exploration et d'apprentissage autonome sans assistance humaine, illustrant les progrès de l'apprentissage par renforcement et la créativité artificielle. La discussion couvre également les implications futures pour la robotique et l'apprentissage de vie, soulignant le potentiel de modèles de langage avancés pour améliorer les interactions avec les robots et les systèmes informatiques.

Takeaways

  • 🧠 Le bot 'Voyageur' a été conçu par un chercheur de Nvidia pour explorer le monde de Minecraft sans assistance humaine.
  • 🕵️‍♂️ Voyageur est capable d'effectuer des tâches complexes dans Minecraft qui pourraient être difficiles à comprendre même pour un humain non-expert du jeu.
  • 🎮 Minecraft est utilisé pour entraîner l'IA car il offre un environnement ouvert avec des possibilités infinies, offrant un terrain de jeu idéal pour le développement d'IA.
  • 🔧 Le concept de 'coding as action' est utilisé pour que Voyageur interprète le monde de Minecraft en texte, permettant à l'IA de prendre des décisions sans vision.
  • 🤖 GPT4 est utilisé pour analyser la situation de Voyageur et proposer des objectifs à atteindre, basés sur l'inventaire et l'environnement de l'IA.
  • 🔄 Voyageur dispose d'un mécanisme d'auto-vérification et d'itération pour apprendre de ses erreurs et améliorer ses actions.
  • 📚 Lorsqu'une nouvelle compétence est découverte, Voyageur la stocke dans une 'bibliothèque', créant ainsi une mémoire persistante.
  • 🏆 Voyageur a été le premier agent à atteindre l'épée en diamant dans Minecraft, démontrant son efficacité dans l'apprentissage et l'exploration du jeu.
  • 🌐 L'IA est utilisée pour des applications bien au-delà de Minecraft, y compris dans le domaine de la robotique, où elle peut être utilisée pour apprendre à effectuer des tâches complexes.
  • 🛠️ Les projets de Jim Fan, comme 'Métamorphe' et 'ISAAC', visent à développer des modèles de fondation pour contrôler et apprendre à partir de robots dans le monde réel.
  • 🔮 Le projet 'Groot' a pour ambition de créer un modèle de fondation unique pour tous les robots, indépendamment de leur type ou de leur environnement.

Q & A

  • Qu'est-ce que le bot Voyager et à quoi est-il destiné?

    -Voyager est un bot d'IA conçu par un chercheur de Nvidia pour explorer le monde de Minecraft entièrement seul, sans assistance humaine. Il est capable d'effectuer des tâches que même un humain ne pourrait comprendre aussi rapidement.

  • Pourquoi Minecraft est-il utilisé pour entraîner l'IA?

    -Minecraft est utilisé car il s'agit d'un monde ouvert avec des possibilités infinies, offrant un environnement de jeu sans scénario fixe où l'IA peut s'autonomiser et développer des capacités de créativité et de résolution de problèmes.

  • Quel est le rôle de l'API JavaScript de Minecraft dans Voyager?

    -L'API JavaScript de Minecraft permet de convertir le monde 3D en texte, ce qui est essentiel pour Voyager qui n'a pas de capacité de vision. Ainsi, il peut envoyer des informations sur son inventaire et son environnement à GPT4.

  • Comment Voyager interagit-il avec GPT4?

    -Voyager envoie à GPT4 des informations sur son inventaire, son environnement et son état de santé dans le jeu. GPT4 analyse ces données et propose une tâche ou un objectif à atteindre, que Voyager doit essayer de réaliser.

  • Quelle est la méthode 'Coding as action' utilisée par Voyager?

    -La méthode 'Coding as action' est utilisée pour que Voyager envoie des actions à GPT4, qui les interprète et propose des tâches en conséquence. Cette méthode permet à Voyager d'apprendre et de s'améliorer en fonction des actions qu'il effectue dans Minecraft.

  • Comment Voyager vérifie-t-il les erreurs et apprend-il de celles-ci?

    -Voyager dispose d'un mécanisme d'autovérification et d'itération. Si des erreurs sont commises, il renvoie ces erreurs à GPT4, qui propose une action corrective. Cela permet à Voyager d'apprendre de ses erreurs et de s'améliorer.

  • Quel est l'objectif final de Voyager dans Minecraft?

    -L'objectif final de Voyager est d'explorer le plus possible le monde de Minecraft, de découvrir de nouveaux items et de développer des compétences, tout en construisant une mémoire persistante pour stocker ces compétences.

  • Quelle est la différence entre Voyager et d'autres agents autonomes dans Minecraft?

    -Voyager est capable d'apprendre et de s'améliorer sans avoir besoin d'être retuné ou spécialisé spécifiquement pour Minecraft. Il a atteint des niveaux de compétences élevés, comme la fabrication d'une épée en diamant, ce qui le place au-dessus d'autres agents autonomes.

  • Pourquoi les chercheurs sont-ils intéressés par le potentiel de Voyager au-delà de Minecraft?

    -Les chercheurs voient dans Voyager un pas en avant vers l'apprentissage lifelong et l'application de modèles de langage pour effectuer des actions utiles dans le monde réel. Leur ambition est de transposer les capacités de Voyager dans des robots et des agents autonomes pour résoudre des tâches complexes.

  • Quels sont les projets connexes à Voyager menés par le chercheur Jim Fan et son équipe?

    -Jim Fan et son équipe travaillent sur des projets comme Métamorphe, qui vise à contrôler des milliers de robots, et Groot, qui a pour objectif de créer un modèle de fondation unique pour tous les robots, indépendamment de leur environnement ou de leur usage.

  • Quels sont les défis et les limitations actuels de Voyager et des modèles de langage similaires?

    -Les défis et les limitations comprennent l'incapacity à planifier de manière réelle et à anticiper des actions pour atteindre des objectifs lointains. Les modèles de langage, comme Voyager, sont principalement capables d'adapter des plans et des objectifs vus dans leurs ensembles de données à des situations données.

Outlines

00:00

🤖 L'IA Voyager et son entraînement dans Minecraft

Le paragraphe introduit Voyager, un bot IA développé par Nvidia, capable d'explorer Minecraft sans assistance humaine. Il effectue des tâches complexes que les humains ne pourraient comprendre aussi rapidement. L'IA est utilisée dans Minecraft pour ses propriétés d'open-world, offrant des possibilités infinies et un terrain de jeu pour le développement de l'IA. Le script mentionne également une offre de serveur de Minecraft par Hostinger, ainsi que des projets précédents de Microsoft utilisant Minecraft pour le renforcement de l'apprentissage. Voyager est spécialisé dans l'exploration de Minecraft, utilisant une méthode appelée 'coding as action' pour convertir le monde 3D en texte, ce qui lui permet d'envoyer des informations à GPT4, qui analyse la situation et propose des objectifs à atteindre.

05:03

🔨 La capacité d'auto-correction de Voyager et son apprentissage persistant

Ce paragraphe détaille comment Voyager est capable de corriger ses erreurs à l'aide d'une boucle d'autovérification. Si Voyager ne parvient pas à créer un outil, comme une hache en acacia qui n'est pas possible, il reçoit des instructions de GPT4 pour effectuer une action corrective. Voyager a également la capacité de stocker de nouvelles compétences dans une 'bibliothèque', créant ainsi une mémoire persistante. Le paragraphe mentionne également le succès de Voyager dans l'exploration de l'arbre technologique de Minecraft, atteignant des objectifs avancés comme la fabrication d'une épée en diamant.

10:04

🌐 Les implications du projet Voyager pour l'apprentissage de vie et l'IA

Le paragraphe discute des implications plus larges du projet Voyager, soulignant son rôle dans l'évolution des agents autonomes d'IA. Jim Fan, le chercheur à l'origine de Voyager, a une vision d'IA complète, capable d'apprendre et d'évoluer dans le monde réel, similaire à des personnages de science-fiction comme Wall-E ou les robots de Star Wars. Il mentionne d'autres projets comme Métamorphe et ISAACIM, qui cherchent à appliquer la même logique d'apprentissage de vie aux robots, en utilisant des modèles de fondation pour contrôler un large éventail d'actions et d'environnements.

15:06

🚀 Les défis et les perspectives d'avenir pour l'IA autonome

Ce dernier paragraphe aborde les défis actuels et les perspectives d'avenir pour l'IA autonome. Il souligne que les modèles actuels, bien que performants dans l'adaptation de plans et d'objectifs vus dans leurs ensembles de données, manquent de capacité à planifier de manière réelle et à anticiper des actions pour atteindre des objectifs lointains. Il mentionne le Visuus Challenge comme exemple d'un problème passionnant dans le domaine de l'IA, où un étudiant a réussi à déchiffrer un manuscrit ancien en utilisant l'IA.

Mindmap

Keywords

💡Voyageur

Voyageur est le nom d'un bot d'IA conçu par un chercheur de Nvidia, qui explore le monde de Minecraft sans assistance humaine. Ce bot est capable d'effectuer des tâches complexes dans le jeu, démontrant une intelligence artificielle autonome. Dans le script, il est utilisé comme exemple pour parler de l'avancée de l'IA dans les jeux et son potentiel d'application dans des contextes plus vastes, comme la robotique.

💡Minecraft

Minecraft est un jeu vidéo de type 'sandbox' où les joueurs peuvent explorer, construire et interagir avec un monde en 3D. Dans le script, il est mentionné comme un environnement de test pour l'entraînement d'IA, en raison de sa complexité et de ses possibilités infinies d'interaction, ce qui permet aux chercheurs d'étudier le comportement et l'apprentissage des algorithmes d'IA.

💡Intelligence Artificielle (IA)

L'Intelligence Artificielle (IA) fait référence à la capacité d'un ordinateur de raisonner, de décider et d'apprendre de manière similaire à un humain. Dans le script, l'IA est explorée à travers l'exemple de Voyageur, un bot capable d'apprendre et d'interagir avec l'environnement de Minecraft, illustrant les progrès de l'IA dans la résolution de problèmes et la prise de décisions.

💡Apprentissage par renforcement

L'apprentissage par renforcement est une forme d'apprentissage automatique où un algorithme apprend à atteindre un objectif en interagissant avec un environnement. Dans le script, il est mentionné que des projets comme Malmo utilisent Minecraft pour l'apprentissage par renforcement, permettant aux IA de développer des stratégies pour résoudre des problèmes dans le jeu.

💡Coding as Action

Coding as Action est une méthode utilisée par l'IA Voyageur pour explorer et interagir avec Minecraft. Elle implique la conversion du monde 3D en texte, permettant à l'IA sans vision de comprendre et de réagir à l'environnement. Dans le script, cette méthode est utilisée pour envoyer des informations à GPT4, qui analyse la situation et propose des actions à Voyager.

💡GPT4

GPT4 est un modèle de langage IA mentionné dans le script, qui reçoit des informations textuelles de Voyager et analyse la situation pour proposer des actions. Il est un exemple de l'utilisation d'IA pour la prise de décisions et la planification dans un environnement complexe comme Minecraft.

💡Autovérification

L'autovérification est un mécanisme utilisé par Voyager pour apprendre de ses erreurs et s'améliorer. Si Voyager commet une erreur, comme essayer de créer une hache en acacia (impossible dans Minecraft), il renvoie la situation à GPT4 pour une action corrective. Cette capacité d'auto-correction est cruciale pour l'apprentissage et l'amélioration continue de l'IA.

💡Mémoire persistante

La mémoire persistante est la capacité de Voyager à stocker et à retenir les compétences qu'il a apprises, comme la fabrication d'une pioche en fer. Cette capacité est importante pour l'apprentissage de l'IA, car elle permet à l'agent de se souvenir des solutions efficaces et de les réutiliser dans le futur, illustrant l'aspect de 'lifelong learning' mentionné dans le script.

💡Robotique

La robotique est l'application de l'IA et des technologies de contrôle à la conception et à la construction de robots. Dans le script, il est question de l'IA Voyageur comme une étape vers l'apprentissage et le développement de robots capables d'effectuer des tâches complexes dans le monde réel, comme ouvrir une porte ou nager, montrant le potentiel de transfert des compétences d'apprentissage d'IA d'un environnement virtuel à un environnement physique.

💡Lifelong Learning (Apprentissage de la vie)

L'apprentissage de la vie est un concept où une IA continue d'apprendre et de s'améliorer au fil du temps, tout comme un être humain. Dans le script, il est utilisé pour décrire l'ambition de créer des modèles d'IA capables d'apprendre et de s'adapter à de nouvelles situations sans avoir besoin de réentraînement complet, montrant l'évolution des capacités d'apprentissage des IA au-delà des tâches spécifiques.

Highlights

Voyageur est un bot d'IA conçu par Nvidia, capable d'explorer Minecraft sans assistance humaine.

Voyageur peut effectuer des tâches complexes dans Minecraft plus rapidement qu'un humain.

L'utilisation de Minecraft dans l'entraînement d'IA est plus répandue qu'anticipé, avec des projets comme Malmo de Microsoft.

Voyageur est spécialisé dans l'exploration de Minecraft, découvrant des items uniques et apprenant de ses erreurs.

Le bot utilise une API JavaScript pour convertir la vision 3D de Minecraft en texte, étant donné qu'il n'a pas de vision.

GPT4 est utilisé pour analyser la situation de Voyageur et proposer des objectifs à atteindre dans Minecraft.

Voyageur possède un mécanisme d'autovérification pour apprendre de ses erreurs et itérer sur ses actions.

Le bot a un système de mémoire persistante pour stocker de nouvelles compétences découvertes, comme la fabrication d'une pioche en fer.

Voyageur a atteint le sommet de l'arbre technologique de Minecraft, en obtenant par exemple une épée en diamant.

Minecraft est utilisé pour tester et entraîner des IA en raison de son monde ouvert et de ses possibilités infinies.

Les chercheurs explorent comment l'IA peut casser les barrières de la créativité dans Minecraft, un environnement similaire au monde réel simplifié.

Le concept de lifelong learning (apprentissage de vie) est appliqué à Voyageur, montrant le potentiel des modèles de langage pour effectuer des actions utiles.

Des start-up comme Adept travaillent sur des modèles d'action pour automatiser des tâches, comme réserver un vol ou transformer un tableau.

Jim Fan, le chercheur derrière Voyageur, a une vision d'IA autonome capable d'apprendre et évoluer dans le monde réel, similaire à des agents dans Star Wars.

Le projet Metamorphe vise à contrôler des milliers de robots en utilisant des modèles de fondation pour simuler la physique humaine.

ISAAC, un autre projet, apprend à une structure humaine à maîtriser 10 ans d'arts martiaux en seulement 3 jours, améliorant la réalisme des personnages dans les jeux vidéo.

Le projet GROOT, dirigé par Jim Fan, vise à créer un modèle de fondation unique pour tous les robots, indépendamment de leur environnement ou de leur cas d'utilisation.

Les démonstrations d'IA dans Minecraft montrent les limites actuelles de la planification et de l'anticipation des actions par rapport à ce que peuvent faire les humains.

Transcripts

play00:00

voyageer c'est le nom de ce bot de cette

play00:02

IA conçu par un chercheur de Nvidia pour

play00:05

explorer le monde de Minecraft

play00:07

complètement tout seul sans assistance

play00:09

humaine il parvient à effectuer des des

play00:11

tâches qu'un humain ne connaissant pas

play00:13

le jeu aurait du mal à comprendre aussi

play00:15

vite que lui mais après tout on pourrait

play00:17

se dire ça va rien nous apporter de

play00:19

l'utiliser dans Minecraft mais en fait

play00:21

le plus intéressant se cache dans les

play00:23

détails pourquoi Minecraft est si

play00:25

utilisé dans l'entraînement d'IA

play00:27

jusqu'ici on avait plutôt l'habitude de

play00:28

prendre un exemple le jeu de Go ou les

play00:30

échecs et surtout pourquoi voyageer

play00:32

pourrait avoir des conséquences bien

play00:34

plus importantes que celles d'un simple

play00:36

jeu comme Minecraft notamment en

play00:39

robotique mais juste avant j'ai un

play00:40

message pour les bidouilleurs de

play00:42

l'audience qui ont un serveur Linux qui

play00:44

doit tourner jour et nuit vous avez

play00:45

sûrement regarder du côté des serveurs

play00:47

privés virtuels plus performants que des

play00:49

petits serveurs mutualisés à des prix

play00:50

très abordables sans payer non plus trop

play00:52

cher si c'est votre cas hostinger et

play00:54

leur config très compétitive va vous

play00:56

intéresser pour 649 par mois vous avez

play00:59

un CPU à de 8 Go de RAM 100 Go d'espace

play01:02

disque sur nvme et 8 t de bande passante

play01:05

pour un WordPress un plex ou un serveur

play01:07

Minecraft vous êtes large surtout que

play01:09

vous aurez un réseau symétrique de 300 m

play01:12

des sauvegardes hebdomadaires gratuites

play01:14

ce qui est assez rare une protection

play01:15

antid dos très solides et même une a

play01:18

spécialisé sur la dog do Stinger si vous

play01:20

êtes pas un expert Linux avec le code

play01:21

underscore vous aurez encore 10 % de

play01:23

réduction sur tous les plans de 12 mois

play01:25

ou plus le lien est dans la description

play01:27

et on reprend ça n'est pas la première

play01:29

fois que Minecraft est utilisé pour

play01:31

tester et entraîner des IA Microsoft a

play01:35

qui à partir Minecraft le fait depuis

play01:37

très longtemps avec son projet malemo

play01:39

notamment qui est vraiment un projet de

play01:41

2016 donc c'est un vieux projet pour des

play01:43

chercheurs en nia notamment en

play01:45

renforcement learning en en

play01:47

apprentissage

play01:49

réenforcé voilà Tiffanie l'a fait dans

play01:52

notre émission est-ce que tu peux nous

play01:54

raconter un peu ce que tu as fait

play01:55

c'était au tout début de de GPT et du

play01:58

coup ben en fait quand j'envoyais des

play02:00

messages dans le dans le chat en bas ça

play02:03

discutait directement avec gpt3 qui lui

play02:06

ensuite interprétait ce que je disais

play02:08

pour générer le code qui faisait

play02:10

exécuter au bot une action donc Tiffany

play02:12

a utilisé Minecraft comme comme support

play02:14

pour ses recherches et pour ses

play02:15

démonstration d'IA plus récemment open a

play02:18

a utilisé Minecraft pour entraîner nia à

play02:20

l'aide de vidéos donc apprendre de

play02:21

gameplay humain voir un peu ce qui font

play02:24

comme action et essayer de reproduire à

play02:26

l'identique c'est c'est ce qu' s'appelle

play02:28

la méthode vipit donc pour VI

play02:30

prétraining lia qui nous intéresse

play02:31

aujourd'hui elle s'appelle voyager et

play02:35

elle est très spéciale ça n'est pas une

play02:37

nouvelle méthode pour collecter un max

play02:39

de données et se construire un un

play02:41

immense datadet ou bien pour je sais pas

play02:43

entraîner une nia à la reconnaissance

play02:46

d'image pas du tout d'ailleurs voyager

play02:48

ne possède pas de capacité de vision

play02:51

voyager a pour unique but d'explorer au

play02:54

maximum Minecraft en fait les chercheurs

play02:57

vont observer combien d'items uniques

play03:00

voyager est capable de découvrir et

play03:02

surtout en combien d'itération pourquoi

play03:05

ça c'est pour savoir si en gros elle

play03:07

galère si elle a besoin de recommencer

play03:09

beaucoup ou si plutôt elle est faste et

play03:11

àelle prend très très vite en fait ils

play03:13

utilisent une méthode qui s' appelle

play03:15

coding as action et la première étape

play03:18

c'est qu'ils utilisent une API en en

play03:20

Javascript de Minecraft et en fait elle

play03:23

a pour but de convertir le monde 3D que

play03:25

nous on voit dans Minecraft en texte

play03:28

parce que je le rappelle voyager pas de

play03:30

vision donc c'est une première étape

play03:31

importante grâce à ça en fait voyager va

play03:34

envoyer à gpt4 à un instant T déjà un ce

play03:38

qu'il y a dans son inventaire ce qu'il y

play03:40

a autour de lui dans son environnement

play03:42

et aussi un peu ses constantes de santé

play03:44

c'est comment comment il va dans le jeu

play03:47

c'est les trois choses qu'il envoie à

play03:49

gpt4 et à partir de ces éléments vous

play03:51

vous vous le voyez là à l'écran gpt4

play03:53

analyse la situation et il va proposer

play03:56

une tâche un objectif à atteindre pour

play03:59

voyageur

play04:00

je prends un exemple tu m'envoies que tu

play04:02

as faim ta ta jauge de faim est très

play04:05

très élevée ou ta santé est très basse

play04:07

comme vous voulez tu as un cochon à côté

play04:09

de toi tu m'as dit tente de tuer le

play04:12

cochon c'est vraiment ça c'est c'est le

play04:15

raisonnement de gpt4 donc la première

play04:17

ligne c'est raisonnement et si si on

play04:19

regarde la ligne suivante c'est tâche

play04:21

tue le cochon et voyageer via la pay qui

play04:23

est utilisé va effectuer la f on peut

play04:27

imaginer que tu es le cochon en fait

play04:28

c'est dirige-toi vers le cochon quand

play04:29

Quand tu es dans laarè tape avec ton

play04:31

épée tu voisouis complètement ça c'est

play04:32

la base euh mais en fait il y a d'autres

play04:35

agents autonomes dans Minecraft qui sont

play04:36

capables euh de faire ça c'est pas la

play04:38

spécificité de voyageer la deuxième

play04:40

étape c'est l'étape d'autovérification

play04:43

en fait voyager a un mécanisme de

play04:45

vérification et d'itération c'est-à-dire

play04:48

que voyager peut faire des erreurs il va

play04:51

faire des choses qui ne marchent pas

play04:52

mais il va apprendre de ces erreurs pour

play04:55

plus les faire et en fait s'il y a des

play04:57

erreurs il le renvoie à gpt4 dans une

play05:00

boucle gpt4 lui dit H comment faire et

play05:03

il va lui proposer une action corrective

play05:05

les chercheurs ont explicité un exemple

play05:07

de ça pour bien qu'on comprenne comment

play05:09

il fait de la correction d'erreurs à un

play05:10

moment gpt4 a proposé à voyageer de

play05:12

créer une hache en

play05:14

acacia sauf que ce n'est pas possible de

play05:17

faire une hache en Acassia et c'est

play05:19

plutôt logique et en fait c'est vrai oui

play05:21

voyager s'est aperçu que ça fonctionnait

play05:23

pas il avait toujours pas de H en acacia

play05:26

dans son inventaire donc du coup il y a

play05:27

une boucle d'autovérification et du coup

play05:30

gpt4 lui a dit bon ben fait une hache en

play05:32

bois ça ira très bien et en fait cette

play05:35

étape qui pour nous humains nous paraît

play05:37

tout à fait anodine en fait c'est l'une

play05:41

des premières grandes intelligences au

play05:43

sens informatique du terme très

play05:46

importante dans le fait que voyager est

play05:48

particulièrement capable d'avancer loin

play05:50

dans le jeu la troisème étape et la

play05:52

dernière étape c'est qu'une fois qu'il a

play05:54

appris qu'il a découvert une nouvelle

play05:56

compétence mature par exemple faire une

play05:59

pioche en fer voyager il a un mécanisme

play06:02

pour la stocker dans une bibliothèque

play06:05

c'est-à-dire que il se construit une

play06:06

mémoire persistante mais qui garde à

play06:08

tout jamais tant qu'il il est encore en

play06:10

vie et on va le voir ça marche super

play06:13

bien regardez ce graphique c'est c'est

play06:15

le graphique de l'arbre technologique de

play06:16

Minecraft et c'est comment les

play06:19

différents agents ont sont parvenus à à

play06:21

parcourir l'arbre technologique de

play06:23

Minecraft voyager est tout en haut et si

play06:26

vous voyez bien voyager est d'après les

play06:29

les chercheur le premier agent à avoir

play06:31

atteint l'épée en diamant pour vous

play06:33

donner une idée si vous n'avez jamais

play06:35

jamais joué à Minecraft c'est que quand

play06:37

même entre les petits exemples que là on

play06:38

a donné en mode récolter de trucs en

play06:40

bois et et créer une pioche en bois et

play06:43

obtenir des outils en diamant il y a un

play06:46

gap il y a besoin de fouiller de galérer

play06:48

de quasiment de créativité en fait pour

play06:51

débloquer des choses c'est super long et

play06:52

ce qui est intéressant c'est celle qui

play06:54

était juste en dessous donc on peut se

play06:55

dire pas si loin en fait c'est toujours

play06:57

voyageer bièque Labie donc vraiment en

play07:00

fait les autres ils sont euh vachement

play07:02

plus en dessous quoi ce qui est

play07:03

incroyable c'est que voyager est trop

play07:05

fort sans avoir failli tuner de modèle

play07:08

on n pas pris un modèle et on l'a pas

play07:09

façonné en disant tu vas être unea

play07:12

spécialisée dans Minecraft on y

play07:13

reviendra juste après mais c'est au

play07:14

final ce qui est le plus intéressant euh

play07:16

dans cette histoire mais alors pour

play07:18

revenir à notre question pourquoi

play07:20

utiliser Minecraft euh pour les

play07:22

recherches on y a de partout depuis

play07:24

plusieurs années parce queil y a il y a

play07:26

encore quelques années dans les années

play07:27

2010 2015 on avait plutôt l'habitude de

play07:30

de voir des challenges sur les jeux de

play07:32

jeu de Go notamment avec alpago qui a

play07:34

battu un un professionnel du jeu en 2015

play07:36

ou avec les échec notamment alpha Z0

play07:39

stock fish qui est un un moteur Open

play07:41

Source bref on a plutôt l'habitude de

play07:43

jeu en d'apparence très logique c'est

play07:46

d'abord une question que je voulais te

play07:47

poser à toi la première concernée

play07:49

Tiffanie pourquoi utiliser Minecraft

play07:51

rien que le fait que ce soit un open

play07:53

world donc un un monde complètement

play07:55

ouvert avec des possibilités

play07:56

complètement infinies sans scénario tout

play07:59

ass ça fait que ben comme tu l'as dit

play08:02

c'est un playground quoi l'intelligence

play08:03

artificielle elle peut un peu faire ce

play08:04

qu'elle veut et ce qui est très beau

play08:05

avec Minecraft je trouve c'est que il y

play08:07

a pas de limite dans ce que tu peux

play08:08

créer quoi pour pour les ceux qui

play08:09

connaissent pas ça peut aller vraiment

play08:11

très très très loin avec des circuits et

play08:12

des redstone et voilà je vais rentrer un

play08:15

dans le technique mais en vrai tu peux

play08:17

recréer de la logique tu des portes

play08:19

logiques tu peux recréer un ordinateur

play08:20

dans mineft tu peux recréer un

play08:21

ordinateur tu peux recréer une

play08:22

calculatrice en fait rien qu'avec tes

play08:25

circuits de 0 et de 1 et donc c'est très

play08:27

intéressant de voir comment une

play08:28

intelligence artificielle peut arriver à

play08:30

casser cette barrière de la créativité

play08:31

pour arriver à ne serait-ce que

play08:33

comprendre le jeu mais ensuite créer des

play08:34

choses quoi Minecraft d'une certaine

play08:35

manière c'est une approximation ultra

play08:38

simplifiée du monde réel ouais et tout

play08:40

ce qui ce qu'on voit dans ce genre de

play08:42

papier on ne rêverait même pas et que

play08:45

des robots en soit capable dans le vrai

play08:47

monde là vous vous dites pas que demain

play08:48

un robot de Boston Dynamics il peut

play08:50

aller miner du charbon et forger et

play08:54

forger une épée tu vois comme tu disais

play08:55

c'est potentiellement la meilleure

play08:57

approximation qu'on a qui est

play08:58

suffisamment simple pour que des modèles

play09:01

existants puissent faire joujou dedans

play09:02

et là où vous voyez juste sur le côté

play09:03

euh c'est une approximation un peu du du

play09:05

monde réel et du monde physique c'est

play09:07

que ce que fait voyager les chercheurs

play09:09

ont décidé d'appeler ça le lifelong

play09:11

learning donc un petit peu le

play09:13

l'apprentissage de la vie euh avec un un

play09:17

LLM alors avec son système de tâche et

play09:20

et d'autovérification dont on a parlé ça

play09:22

montre l'énorme potentiel que vont avoir

play09:24

les modèles de langage pour effectuer

play09:26

des actions utiles dans sur nos

play09:28

ordinateurs on a déjà un peu parlé avec

play09:31

au moment où on a parlé de rabbit donc

play09:33

c'était cet assistant on a parlé de

play09:35

modèle d'action et c'est également ce

play09:37

que tente de faire une autre start-up

play09:39

alors j'ai choisi de vous parler de

play09:40

celle-là mais il y en a différentes qui

play09:41

s'appelle adept c'est une start-up

play09:42

cofondée par un ancien de Open et et de

play09:45

Google comme souvent et en fait eux ils

play09:47

mettent au point un modèle d'action qui

play09:48

s'appelle Act one et c'est exactement

play09:51

pour ça pour automatiser certaines

play09:53

tâches alors pour l'instant il montre

play09:54

des exemples pour réserver un vol ou

play09:56

pour transformer un tableau là

play09:58

actuellement on pas

play09:59

ça va cher ma vie changer ma vie

play10:02

actuellement mais mais honnêtement ça

play10:04

pourrait avoir de de très gros impacts

play10:06

sur nos nos façons de travailler si

play10:08

évidemment ces modèles commencent à

play10:10

prendre un peu forme mais moi ce que je

play10:12

vous propose c'est de voir un peu plus

play10:13

loin notamment du côté du chercheur de

play10:15

Nvidia qui est avec son équipe à

play10:18

l'origine de voyager il s'appelle Jim

play10:21

fan en fait pour lui voyager c'est

play10:23

qu'une étape dans l'évolution des des

play10:26

agents autonomes d'intelligence

play10:27

artificielle et en fait ce qui est très

play10:30

intéressant c'est quand il dit agent il

play10:31

pense évidemment au monde virtuel comme

play10:33

on l'a vu dans Minecraft mais lui il

play10:36

pense aussi comme ce que tu disais au

play10:38

monde réel parce que à côté de mettre en

play10:41

place une IA capable d'apprendre à

play10:43

évoluer tout seul juste au contact de

play10:44

son environnement il a mené d'autres

play10:47

travaux notamment avec des robots il a

play10:51

entraîné des bonels pour que des robots

play10:53

puisse répéter 10000 fois le même geste

play10:56

par exemple ouvrir une porte et 10000

play10:58

fois avec des situation et des

play11:00

comportements différents pourquoi il a

play11:02

fait ça parce qu'il a envie que de sorte

play11:04

que la 10000è et une fois le robot si il

play11:08

connaît pas exactement la typologie de

play11:09

porte qui soit dans des situations

play11:10

différentes il soit quand même capable

play11:12

de l'ouvrir et pour faire ça je peux pas

play11:15

très brièvement parler de deux projets

play11:16

le premier projet c'est métamorphe en

play11:18

fait c'est un modèle de fondation pour

play11:19

contrôler des milliers de robots et qui

play11:22

sacheent par exemple monter dans des

play11:24

escaliers traverser dans un champ et en

play11:26

fait ça va simuler un peu la la physique

play11:29

humaine des bras des jambes et cetera

play11:31

pour l'appliquer à des robots il y a un

play11:33

autre projet super intéressant où il il

play11:36

apprend à une structure humaine en 3

play11:38

jours à maîtriser 10 ans d'arts martiaux

play11:40

c'est super impressionnant ça permet de

play11:42

faire des des des personnages vachement

play11:44

plus réalistes dans dans les jeux vidéos

play11:46

concrètement ça donne lieu à des des

play11:48

robots aussi fous que ce que vous allez

play11:50

pouvoir voir à l'écran qui sont vraiment

play11:53

capable de se déplacer quasiment comme

play11:55

des humains alors là ils ont des roues

play11:56

mais moi je trouve ça encore plus

play11:57

impressionnant mais moi ce que je trouve

play11:59

difficile ile c'est de savoir tu vois on

play12:00

a vu du Boston Dynamics ou des choses

play12:02

comme ça c'est de savoir quelle barrière

play12:04

ont été franchies tu vois entre ça et

play12:05

quelqu'un qui marche justement pourquoi

play12:07

je vous parle de ça parce que ça paraît

play12:08

très loin de Minecraft et de voyageur et

play12:10

en fait Jim fan donc c'est un ponte de

play12:12

Lia chez nvilia il a une vision celle un

play12:16

jour d'avoir des IA aussi complètes que

play12:19

ce que pourrait faire un un Wally ou un

play12:21

il cite aussi les les robots de dans

play12:23

dans Star Wars et en fait pour ça il a

play12:26

rassemblé ses différentes briques donc

play12:28

la prère que je vous ai présenté en long

play12:30

aujourd'hui voyageer et puis deux autres

play12:32

sur lesqueles je je me suis pas attardé

play12:35

vous allez pouvoir le voir sur ce sur le

play12:37

schéma donc voilà on voit métamorphe

play12:39

dont je vous ai très très rapidement

play12:41

parlé un autre qui s'appelle isacim qui

play12:42

est très impressionnant aussi et et et

play12:44

voyageur et donc il a son petit

play12:45

graphique et son but c'est d'arriver à

play12:47

un modèle de fondation pour les robots

play12:49

et c'est le projet groot ça a été

play12:52

annoncé dans la dernière conférence de

play12:55

de Nvidia et en fait son projet c'est

play12:58

que quelques soit le robot autonome quel

play13:00

que soit l'environnement dans lequel il

play13:02

évolu quel que soit le le cas d'usage

play13:04

tous les robots utilisent le même modèle

play13:08

fondamental le même modèle de fondation

play13:10

et en fait à l'image d'un modèle de

play13:13

langage le cas particul d'un robot soit

play13:15

juste un prompte différent comme si nous

play13:18

on utilise un modèle de langage parfois

play13:19

on va lui demander une recette de

play13:21

cuisine et parfois on va lui demander de

play13:22

nous résumer un texte et ben là son

play13:24

ambition c'est de faire la même chose de

play13:26

prendre autant de hauteur de vue pour

play13:28

faire un modèle de fond

play13:31

avec tous les robots et en fait il

play13:32

aimerait que ce qui est possible de

play13:34

faire apprendre à voyageur virtuellement

play13:37

dans Minecraft il puissent le faire dans

play13:39

le monde réel non plus du coup avec des

play13:41

instructions avec du code mais avec des

play13:43

instructions qui agissent sur des

play13:45

actionneurs sur des moteurs et donc qui

play13:47

contrôl des robots et on se rappelle que

play13:49

le responsable en chef de ce projet qui

play13:51

s'appelle groot est à l'origine de

play13:53

voyageurs oui c'est la m et donc moi ce

play13:55

qui me tue c'est qu'en gros aujourd'hui

play13:57

Minecraft sert entraîner des robots

play13:59

humanoïdes pour plus tard il y a quand

play14:01

même un problème dis-moi sans vouloir

play14:03

plomber l'ambiance euh les

play14:05

démonstrations magnifiques que vous avez

play14:06

vu actuellement dans Minecraft ont quand

play14:08

même une limite fondamentale c'est que

play14:10

elle marche avec des LLM en réalité ce

play14:12

que font ces modèles c'est adapter des

play14:15

des plans et des objectifs qu'ils ont vu

play14:17

dans leur dataset euh à une situation

play14:19

donnée donc en fait ils ont pas de

play14:21

réelle capacité à planifier ils ont

play14:23

plutôt des des grandes capacités de

play14:25

compression de la donnée qui leur permet

play14:27

d'interpoler entre tous les objectifs et

play14:29

entre toutes les planifications qui sont

play14:30

déjà vues quelque chose qui colle à peu

play14:31

près en fait ce qui serait intéressant

play14:34

et ce que fait un humain c'est que on a

play14:36

une vision plus large sur euh l'arbre de

play14:38

technologie et donc se dire ok pour

play14:41

pouvoir atteindre un objectif

play14:43

potentiellement plus lointin pour

play14:44

pouvoir anticiper une action j'ai besoin

play14:46

de faire ça et donc c'est ça qui manque

play14:47

et ça cette étape euh en effet euh c'est

play14:50

un problème euh que voyager ne sait pas

play14:52

résoudre et que plein d'autres choses ne

play14:54

se pas résoudre sur lesquelles les

play14:55

chercheurs travaillent d'HP en ce moment

play14:57

et c'est un problème passionnant si vous

play14:59

avez pas suivi l'histoire du visuus

play15:01

challenge ou comment un papyus a été

play15:03

décrypté par un étudiant en nia allez

play15:05

voir cette vidéo c'était vraiment

play15:07

passionnant

Rate This

5.0 / 5 (0 votes)

Related Tags
IA autonomeMinecraftNvidia ApprentissageRobotiqueVoyageerGPTCréativitéRésolution de problèmesÉducation technologique
Do you need a summary in English?