CSUnplugged - L'intelligence artificielle 2

Samuel Chalifour
26 Feb 202106:07

Summary

TLDRDans cet épisode captivant, nous explorons l'intelligence artificielle et son application dans les jeux, en nous concentrant sur le concept d'apprentissage. Depuis la résolution du jeu du tic-tac-toe par ordinateur en 1952, les algorithmes ont évolué pour gérer des jeux plus complexes comme les échecs et le Go, où l'apprentissage par l'IA a permis de surpasser les capacités humaines. Le script nous entraîne dans la découverte d'une machine électromécanique de 1940 capable de jouer au jeu de Nîmes, et nous propose un jeu simple avec des allumettes qui illustre la stratégie gagnante. En utilisant des gobelets et des jetons, nous pouvons déduire un algorithme complet pour gagner à chaque coup. L'apprentissage par l'erreur est également abordé, montrant que jouer contre un adversaire aléatoire prend plus de temps pour apprendre la stratégie gagnante que de s'affronter avec un adversaire connaissant déjà l'algorithme. Ce résumé invite les utilisateurs à s'immerger dans le monde de l'IA et à comprendre l'importance de l'apprentissage dans le développement de compétences.

Takeaways

  • 🎲 Le jeu du tic-tac-toe est résolu par ordinateur depuis 1952, avec un match nul en jouant de façon optimale.
  • 🧮 L'algorithme complet pour le tic-tac-toe est accessible à la lecture humaine, tandis que pour le jeu des échecs, il y a plus de 4000 milliards de positions possibles.
  • 🤖 Les ordinateurs battent les humains aux échecs grâce à la puissance de calcul brute, sans nécessiter un apprentissage.
  • 📈 Les ordinateurs n'ont battu les meilleurs humains au Go qu'en 2010, grâce à des algorithmes d'apprentissage.
  • 🔁 Les intelligences artificielles s'entraînent les unes contre les autres pour devenir plus performantes dans des tâches très spécialisées.
  • 🏳️‍🌈 La première machine capable de jouer et de gagner un jeu, basée sur des relais électromécaniques, a été présentée en 1940.
  • 🧩 Le jeu de Nîmes est un exemple de jeu simple où l'intelligence artificielle peut être appliquée pour trouver une stratégie gagnante.
  • 🔢 Pour le jeu de prise d'allumettes, il existe un algorithme complet qui permet à un joueur de gagner à chaque coup si le nombre d'allumettes est un multiple de 4.
  • 🧪 Utiliser des gobelets ou des conteneurs pour marquer les allumettes restantes est une méthode pour trouver l'algorithme gagnant du jeu.
  • 🤓 L'apprentissage par l'erreur est plus efficace pour trouver l'algorithme gagnant que de jouer contre un adversaire qui joue au hasard.
  • 📊 En jouant contre un robot qui connaît déjà l'algorithme gagnant, un robot apprenant trouve la stratégie gagnante plus rapidement qu'en jouant contre un robot aléatoire.
  • 🎓 L'apprentissage par les erreurs est un aspect important de la pédagogie générale, montrant que la prise de risques et les erreurs peuvent accélérer l'apprentissage.

Q & A

  • Quelle est la date de résolution du jeu du tic tac toe par ordinateur ?

    -Le jeu du tic tac toe a été résolu par ordinateur en 1952.

  • Comment le premier joueur peut-il toujours gagner au tic tac toe s'il joue de façon optimale ?

    -En jouant de façon optimale, le premier joueur peut toujours forcer un match nul, car le tic tac toe est un jeu à somme nulle.

  • Quelle est la différence entre le tic tac toe et le jeu des échecs en termes de combinatoire ?

    -Le tic tac toe a une combinatoire beaucoup moins complexe que les échecs. Même si le jeu du tic tac toe est résolu, le jeu des échecs, avec un espace de recherche beaucoup plus vaste, n'a pas encore de solution connue pour toutes les positions possibles.

  • Comment les ordinateurs ont-ils commencé à battre les humains au jeu de go ?

    -Les ordinateurs ont commencé à battre les humains au jeu de go en utilisant des algorithmes d'apprentissage, notamment après l'année 2010.

  • Quel est le nom de la première machine capable de jouer et de gagner un jeu ?

    -La première machine capable de jouer et de gagner un jeu s'appelait 'IHM à 30 présentation 1940'.

  • Comment fonctionne le jeu de Nîmes ?

    -Le jeu de Nîmes est un jeu où deux joueurs prennent tour à tour une, deux ou trois allumettes jusqu'à en rester aucune. Le joueur qui prend la dernière allumette gagne.

  • Comment un joueur peut-il être assuré de gagner au jeu de Nîmes ?

    -Un joueur peut être assuré de gagner en amenant le jeu à un certain nombre d'allumettes qui est un multiple de 4, comme 4, 8, 12, 16, 20, etc.

  • Quelle stratégie est utilisée pour trouver l'algorithme gagnant du jeu de Nîmes ?

    -On utilise des gobelets ou des conteneurs marqués correspondant au nombre d'allumettes restant pour trouver l'algorithme gagnant du jeu de Nîmes.

  • Combien de parties a fallu au robot pour apprendre l'algorithme gagnant s'il joue contre un robot qui joue au hasard ?

    -Il a fallu en moyenne 110 parties au robot pour apprendre l'algorithme gagnant s'il joue contre un robot qui joue au hasard.

  • Combien de parties a fallu au robot pour apprendre l'algorithme gagnant s'il joue contre un robot connaissant déjà l'algorithme ?

    -Il a fallu en moyenne environ 40 parties au robot pour apprendre l'algorithme gagnant s'il joue contre un robot qui connaît déjà l'algorithme.

  • Quelle est la conclusion philosophique tirée de l'apprentissage du robot ?

    -La conclusion philosophique est que l'apprentissage est plus rapide en perdant et en se trompant beaucoup, car cela permet d'apprendre beaucoup plus vite.

  • Comment peut-on voir la vidéo présentant le même algorithme de jeu de Nîmes ?

    -On peut voir la vidéo sur YouTube en recherchant la vidéo présentant l'algorithme de jeu de Nîmes.

Outlines

00:00

😀 Intelligence Artificielle et Apprentissage dans les Jeux

Dans le dixième épisode, l'accent est mis sur l'intelligence artificielle et son application au domaine du jeu, en particulier l'apprentissage. Le tic-tac-toe et le morpion, des jeux résolus par ordinateur depuis 1952, illustrent comment un algorithme complet peut conduire à un match nul en jouant de manière optimale. L'augmentation de la combinatoire pour le jeu du puissance 4 ne change pas le principe, mais dépasse la capacité humaine de maîtriser l'algorithme. Les échecs, avec leur complexité exponentielle, montrent comment les ordinateurs ont battu les humains grâce à la puissance de calcul brute, sans nécessiter d'apprentissage. Cependant, pour le jeu de go, où les dispositions possibles sont encore plus grandes, les ordinateurs n'ont commencé à battre les meilleurs humains qu'en 2010 grâce à des algorithmes d'apprentissage. Les intelligences artificielles s'entraînent les unes contre les autres pour s'améliorer. Le script mentionne également une machine de 1940 capable de jouer au jeu de Nîmes, qui simulait la réflexion pour ne pas frustrer les joueurs humains. Le jeu de prise d'allumettes est utilisé pour montrer comment l'intelligence artificielle peut être appliquée à la résolution de problèmes de stratégie, en utilisant des gobelets pour représenter les différentes positions du jeu et déterminer l'algorithme gagnant.

05:05

🤖 Apprentissage par les Robots : Stratégies et Erreurs

Le deuxième paragraphe explore la pédagogie de l'apprentissage par les erreurs dans le contexte de robots jouant à des jeux. Il est mentionné que si un robot apprend à jouer contre un robot qui joue au hasard, il lui faut en moyenne 110 parties pour trouver l'algorithme gagnant, car les victoires aléatoires ne permettent pas d'apprendre. En revanche, lorsqu'il joue contre un robot qui connaît déjà l'algorithme gagnant, il lui faut seulement environ 40 parties pour apprendre, soulignant l'importance de l'apprentissage par les erreurs. La conclusion philosophique est que l'apprentissage est plus efficace lorsqu'il est basé sur des erreurs et des défaites plutôt que sur des succès aléatoires. Le paragraphe encourage également le téléchargement d'une vidéo sur YouTube qui présente le même algorithme d'apprentissage pour résoudre des problèmes de stratégie, comme le jeu du morpion, impliquant une grande quantité de boîtes d'allumettes et de temps pour parvenir à la stratégie gagnante.

Mindmap

Keywords

💡Intelligence artificielle

L'intelligence artificielle (IA) est un domaine de l'informatique qui traite de la conception de systèmes capables de réaliser des tâches qui nécessitent normalement l'intelligence humaine, telles que la reconnaissance de la parole, la détection d'objets, la planification et le raisonnement. Dans la vidéo, l'IA est utilisée pour parler de l'apprentissage et de son application dans les jeux, montrant comment elle peut dépasser les capacités humaines dans des tâches très spécialisées.

💡Apprentissage

L'apprentissage fait référence au processus par lequel les systèmes d'IA acquièrent et améliorent leurs compétences à partir de l'expérience ou des données. Dans le script, l'apprentissage est crucial pour la manière dont les algorithmes d'IA sont utilisés dans les jeux, comme le tic-tac-toe, le morpion, les échecs et le jeu de Nim, où les IA s'entraînent et s'améliorent pour atteindre des niveaux de performance supérieurs à ceux des humains.

💡Tic-tac-toe

Tic-tac-toe, ou le jeu du morpion en français, est un jeu de société simple où deux joueurs alternent les mouvements pour placer leurs symboles dans un tableau à neuf cases. Dans le script, il est mentionné que le tic-tac-toe peut être résolu par ordinateur depuis 1952, ce qui signifie qu'il existe un algorithme optimal pour que le jeu se termine en échec si les deux joueurs jouent correctement.

💡Échecs

Les échecs sont un jeu de stratégie complexe qui implique des pièces avec différentes capacités de mouvement sur un échiquier. Dans la vidéo, il est mentionné que les ordinateurs peuvent maintenant battre n'importe quel humain aux échecs grâce à l'IA, mais il n'existe pas encore de solution complète pour le jeu, ce qui signifie qu'il n'y a pas encore de méthode garantie pour gagner à chaque fois.

💡Go

Go est un jeu de stratégie ancien originaire de Chine qui a connu un regain d'intérêt grâce à l'IA. Dans le script, le Go est cité comme un exemple de jeu où les ordinateurs n'ont commencé à battre les meilleurs humains qu'en 2010, grâce à des avancées dans les algorithmes d'apprentissage. Le Go est notoirement difficile pour l'IA en raison de l'énorme espace de recherche des parties possibles.

💡Algorithme complet

Un algorithme complet est un programme informatique qui est capable de trouver une solution optimale pour un problème donné, en examinant toutes les possibilités. Dans le contexte du script, les algorithmes complets sont utilisés pour résoudre des jeux comme le tic-tac-toe et le morpion, où la combinatoire est gérable, mais ils sont moins pratiques pour des jeux comme les échecs et le Go, qui ont un espace de recherche beaucoup plus vaste.

💡Nim

Nim est un jeu mathématique de stratégie où les joueurs s'alternent pour prendre un certain nombre d'objets (par exemple, des allumettes), et le but est de ne pas être le dernier à prendre. Dans le script, le jeu de Nim est utilisé pour illustrer comment un algorithme complet peut être utilisé pour garantir une victoire si les règles du jeu sont suivies correctement.

💡Machine à jouer

Dans le script, une machine à jouer est présentée comme la première machine conçue pour jouer et gagner un jeu. Elle est décrite comme une machine électromécanique basée sur des relais, qui permettait de jouer au jeu de Nim. Cette machine est un exemple précurseur des systèmes d'IA qui jouent des jeux aujourd'hui.

💡Gobelets

Dans le contexte du jeu de Nim décrit dans le script, les gobelets servent à stocker et à compter les allumettes. Chaque gobelet représente un certain nombre d'allumettes restant sur la table, et les jetons placés dans les gobelets correspondent au nombre d'allumettes que le joueur peut prendre à son tour. Les gobelets sont utilisés pour visualiser et simplifier la stratégie du jeu.

💡Robots apprenants

Les robots apprenants mentionnés dans le script sont des systèmes d'IA conçus pour s'entraîner et améliorer à travers l'expérience de jouer. Ils sont utilisés pour illustrer le processus d'apprentissage et la manière dont ils peuvent trouver des algorithmes gagnants en jouant un grand nombre de parties, en particulier lorsqu'ils jouent contre d'autres robots qui connaissent déjà la stratégie gagnante.

💡Stratégie gagnante

La stratégie gagnante fait référence à un ensemble de règles ou de mouvements qui garantissent la victoire dans un jeu, si suivie correctement. Dans le script, la recherche d'une stratégie gagnante est un aspect clé du processus d'apprentissage des IA, qui doivent apprendre à jouer de manière optimale pour remporter le jeu à chaque coup.

Highlights

Présentation de l'utilisation de l'intelligence artificielle dans les jeux comme le tic-tac-toe et le puissance 4, expliquant la résolution de ces jeux par des algorithmes complets.

Discussion sur la capacité des ordinateurs à battre les humains aux échecs grâce à la puissance de calcul, sans apprentissage machine.

Introduction du jeu de Go, où les ordinateurs ont surpassé les capacités humaines grâce à des algorithmes d'apprentissage avancés.

Évocation de la première machine de jeu, créée dans les années 1940, capable de jouer et gagner un jeu de stratégie simple, utilisant des relais électromécaniques.

Explication du jeu de Nim et de son intérêt pédagogique pour les jeunes enfants, enseignant que prendre le plus n'est pas toujours synonyme de victoire.

Description de la méthode utilisée pour découvrir l'algorithme de victoire au jeu de Nim, utilisant des gobelets et des jetons pour simuler les choix possibles.

Révélation de la stratégie gagnante au jeu de Nim, qui consiste à amener l'autre joueur à un nombre d'allumettes multiple de quatre.

Analyse de l'apprentissage machine en action, illustrée par la programmation de deux robots jouant au jeu de Nim, avec un focus sur le processus d'apprentissage accéléré.

Comparaison de la vitesse d'apprentissage entre jouer contre un robot aléatoire et un robot qui connaît déjà l'algorithme gagnant, soulignant l'importance de l'échec dans l'apprentissage rapide.

Conclusion philosophique sur l'apprentissage, mettant en lumière que perdre et se tromper sont essentiels pour apprendre efficacement.

Invitation à découvrir une vidéo sur YouTube présentant la même méthode d'apprentissage pour le morpion, nécessitant de nombreuses boîtes d'allumettes et du temps.

Transcripts

play00:02

[Musique]

play00:05

bonjour

play00:06

pour ce dixième épisode nous allons

play00:08

parler d'intelligence artificielle mais

play00:10

plus précisément du côté apprentissage

play00:11

et de son utilisation dans les jeux

play00:14

le jeu du tic tac toe ou le morpion en

play00:16

français est résolu par ordinateur

play00:18

depuis 1952

play00:19

c'est à dire qu'en jouant de façon

play00:21

optimale il y aura toujours match nul

play00:23

entre les deux joueurs ont dit que son

play00:25

algorithme est complet la taille des

play00:28

coûts possibles est accessible à lecture

play00:29

humaine sans trop de soucis

play00:31

pour le puissance 4 on augmente

play00:33

largement la combinatoire mais le

play00:35

principe est le même en jouant de façon

play00:37

optimale

play00:38

le premier joueur peut gagner à tous les

play00:39

coups on dépasse par contre la capacité

play00:42

humaine normale de maîtriser cet

play00:43

algorithme complet on est à plus de 4000

play00:46

milliards de positions possibles mais ce

play00:48

n'est encore rien comparé aux échecs

play00:50

si les ordinateurs peuvent maintenant

play00:52

battre n'importe quel humain à ce jeu il

play00:54

n'a pas encore été démontrée s'il

play00:55

existait ou non un algorithme complet

play00:57

jusque là les ordinateurs ont réussi à

play00:59

battre les humains sans en passer par la

play01:01

case apprentissage juste par une

play01:03

puissance de calcul brute du coup est ce

play01:05

vraiment d'intelligence pour le jeu de

play01:08

go il a fallu attendre l'année 2010 est

play01:10

pour que les ordinateurs battre les

play01:12

meilleurs humains et cette fois ci c'est

play01:13

grâce à des algorithmes d'apprentissage

play01:14

c'est que de 10 puissance 40 positions

play01:17

aux échecs on considère 10 puissance 160

play01:21

dispositions possibles pour le go depuis

play01:23

les intelligences artificielles

play01:24

s'entraînent les unes contre les autres

play01:26

pour devenir de plus en plus

play01:27

performantes et largement dépassé les

play01:29

capacités humaines sur ses tâches très

play01:31

spécialisées pour notre activité

play01:33

d'informatique débranché nous allons

play01:35

prendre un jeu encore plus simple que le

play01:36

morpion

play01:36

voilà la première machine capable de

play01:38

jouer et de gagner ce jeu mystérieux il

play01:41

s'agit d'une ihm à 30 présentation 1940

play01:44

aucun transistors basé sur des relais

play01:46

électromécaniques cette machine

play01:48

permettait de jouer au jeu de nîmes

play01:50

de façon assez amusante cette machine

play01:52

était même ralenti et faisait semblant

play01:54

de réfléchir pour ne pas frustrer les

play01:56

joueurs humains

play01:57

en quoi consiste ce jeu prenons deux

play02:00

joueurs 15 allumettes

play02:04

à tour de rôle chaque joueur peut

play02:05

prendre une deux ou trois à lui même

play02:08

on continue jusqu'à ne plus avoir

play02:10

d'allumettes celui qui prend la dernière

play02:12

a gagné c'est un excellent jeu de

play02:15

réflexion pour les jeunes enfants

play02:16

puisque cela va leur apprendre que ce

play02:18

n'est pas forcément celui qui prend le

play02:19

plus d'allumettes qui gagne

play02:21

contrairement aux intuitions général

play02:22

dans les jeux qu'ils connaissent autre

play02:24

élément la position des allumettes

play02:26

comprend n'a aucune importance dans la

play02:28

stratégie employée

play02:30

pour trouver l'algorithme qui permet de

play02:32

gagner à ce jeu nous allons utiliser des

play02:34

gobelets ou des verts ou tout autre

play02:36

conteneur il en faut autant que le

play02:38

nombre initial d'allumettes

play02:39

l'un des joueurs qui jouera le rôle de

play02:41

l'ordinateur des branches et utilisera

play02:44

ses gobelets et des jetons marquer un

play02:45

deux ou trois que l'on place dans les

play02:47

gobelets pour simplifier prenons un jeu

play02:49

à huit allumettes donc les gobelets sont

play02:53

marqués de 1 à 8

play02:54

chaque gobelet correspond au nombre

play02:56

d'allumettes restant sur la table dans

play02:59

le gobelet 8

play02:59

on place trois jetons correspondant au

play03:02

coût possible à ce stade c'est pour cela

play03:05

que dans le gobelet deux seuls deux

play03:06

jetons sont nécessaires on ne peut pas

play03:08

prendre trois à l'hymne est alors qu'il

play03:10

ne reste que deux camps la partie

play03:12

commence le joueur des branches et tire

play03:13

au sort un des jetons et prend le nombre

play03:17

d'allumettes indiqué

play03:21

le joueur humain prend le nombre

play03:23

d'allumettes qu'il veut la partie

play03:25

continue jusqu'au bout si le joueur

play03:27

débrancher père il jette le dernier pion

play03:30

piocher et remet les autres dans leur

play03:32

gobelet au bout d'un certain nombre de

play03:35

parties vous devriez obtenir la

play03:36

situation suivante dans les gobelets

play03:38

c'est la situation qui permet aux

play03:40

joueurs des branches et de gagner à tous

play03:41

les coups s'il ne commence pas et de

play03:43

gagner à tous les coups s'il commence et

play03:45

que l'autre fait une erreur il existe

play03:47

donc un algorithme complet pour que l'un

play03:49

des deux joueurs gagnent à tous les

play03:51

coups

play03:51

il faut ne pas tomber sur les verts 4 ou

play03:54

8 sur 8

play03:56

le premier joueur ne peut pas amener

play03:58

l'autre sur le vert 4 et pour tous ses

play04:00

coups possibles l'autre joueur peut

play04:01

ramener la partie sur le vert 4 est de

play04:04

même sur le maire 4 le premier joueur ne

play04:06

peut pas amener la partie sur 0 ce qui

play04:08

ferait gagner

play04:09

et quel que soit son coup l'autre joueur

play04:11

lui peut remporter la victoire en

play04:14

prenant la dernière allumettes

play04:15

plus généralement il faut amener l'autre

play04:17

joueur sur un nombre d'allumettes

play04:19

multiple de 4 donc 48 12 16 20 etc

play04:25

pour illustrer cet apprentissage nous

play04:27

proposons de programmer deux robots dont

play04:30

l'un va apprendre à jouer avec ces

play04:32

gobelets voilà en accéléré ce que cela

play04:35

donne

play04:36

[Musique]

play04:53

[Musique]

play05:05

je suis devenu intelligent en passant

play05:07

par qui vous pouvez vous rendre compte

play05:09

qu'il lui a quand même fallu 60 parties

play05:12

pour trouver l'algorithme gagnant choses

play05:14

très intéressantes pour la pédagogie

play05:15

générale de l'apprentissage c'est que si

play05:17

ce robot apprenant joue contre un robot

play05:20

qui jouent complètement au hasard

play05:21

il lui faudra en moyenne 110 parties

play05:23

pour trouver l'algorithme gagnant parce

play05:25

que le hasard faisant il réussit à

play05:27

gagner certaines parties donc il

play05:28

n'apprend rien alors que s'il joue

play05:30

contre un robot qui connaît déjà

play05:31

l'algorithme gagnant il ne lui faudra en

play05:34

moyenne qu environ 40 parties pour

play05:36

apprendre là le rythme gagnant c'est en

play05:38

perdant beaucoup donc en se trompant

play05:40

beaucoup qu'il apprend beaucoup plus

play05:42

vite sur cette conclusion tout

play05:44

philosophique

play05:44

je vous souhaite de trouver sur youtube

play05:46

la vidéo présentant le même algorithme

play05:48

me débrancher d'apprentissage pour

play05:50

apprendre à des boîtes d'allumettes à

play05:52

jouer au morpion

play05:53

il vous faudra beaucoup de boîtes

play05:55

d'allumettes et de temps pour arriver à

play05:57

la stratégie gagnante par contre à

play06:00

bientôt

play06:01

[Musique]

Rate This

5.0 / 5 (0 votes)

Related Tags
Intelligence ArtificielleApprentissage AutomatiqueJeux de SociétéTic-Tac-ToeMorpionÉchecsGoAlgorithme CompletPuissance de CalculÉducationPédagogieRobots
Do you need a summary in English?