CSUnplugged - L'intelligence artificielle 2
Summary
TLDRDans cet épisode captivant, nous explorons l'intelligence artificielle et son application dans les jeux, en nous concentrant sur le concept d'apprentissage. Depuis la résolution du jeu du tic-tac-toe par ordinateur en 1952, les algorithmes ont évolué pour gérer des jeux plus complexes comme les échecs et le Go, où l'apprentissage par l'IA a permis de surpasser les capacités humaines. Le script nous entraîne dans la découverte d'une machine électromécanique de 1940 capable de jouer au jeu de Nîmes, et nous propose un jeu simple avec des allumettes qui illustre la stratégie gagnante. En utilisant des gobelets et des jetons, nous pouvons déduire un algorithme complet pour gagner à chaque coup. L'apprentissage par l'erreur est également abordé, montrant que jouer contre un adversaire aléatoire prend plus de temps pour apprendre la stratégie gagnante que de s'affronter avec un adversaire connaissant déjà l'algorithme. Ce résumé invite les utilisateurs à s'immerger dans le monde de l'IA et à comprendre l'importance de l'apprentissage dans le développement de compétences.
Takeaways
- 🎲 Le jeu du tic-tac-toe est résolu par ordinateur depuis 1952, avec un match nul en jouant de façon optimale.
- 🧮 L'algorithme complet pour le tic-tac-toe est accessible à la lecture humaine, tandis que pour le jeu des échecs, il y a plus de 4000 milliards de positions possibles.
- 🤖 Les ordinateurs battent les humains aux échecs grâce à la puissance de calcul brute, sans nécessiter un apprentissage.
- 📈 Les ordinateurs n'ont battu les meilleurs humains au Go qu'en 2010, grâce à des algorithmes d'apprentissage.
- 🔁 Les intelligences artificielles s'entraînent les unes contre les autres pour devenir plus performantes dans des tâches très spécialisées.
- 🏳️🌈 La première machine capable de jouer et de gagner un jeu, basée sur des relais électromécaniques, a été présentée en 1940.
- 🧩 Le jeu de Nîmes est un exemple de jeu simple où l'intelligence artificielle peut être appliquée pour trouver une stratégie gagnante.
- 🔢 Pour le jeu de prise d'allumettes, il existe un algorithme complet qui permet à un joueur de gagner à chaque coup si le nombre d'allumettes est un multiple de 4.
- 🧪 Utiliser des gobelets ou des conteneurs pour marquer les allumettes restantes est une méthode pour trouver l'algorithme gagnant du jeu.
- 🤓 L'apprentissage par l'erreur est plus efficace pour trouver l'algorithme gagnant que de jouer contre un adversaire qui joue au hasard.
- 📊 En jouant contre un robot qui connaît déjà l'algorithme gagnant, un robot apprenant trouve la stratégie gagnante plus rapidement qu'en jouant contre un robot aléatoire.
- 🎓 L'apprentissage par les erreurs est un aspect important de la pédagogie générale, montrant que la prise de risques et les erreurs peuvent accélérer l'apprentissage.
Q & A
Quelle est la date de résolution du jeu du tic tac toe par ordinateur ?
-Le jeu du tic tac toe a été résolu par ordinateur en 1952.
Comment le premier joueur peut-il toujours gagner au tic tac toe s'il joue de façon optimale ?
-En jouant de façon optimale, le premier joueur peut toujours forcer un match nul, car le tic tac toe est un jeu à somme nulle.
Quelle est la différence entre le tic tac toe et le jeu des échecs en termes de combinatoire ?
-Le tic tac toe a une combinatoire beaucoup moins complexe que les échecs. Même si le jeu du tic tac toe est résolu, le jeu des échecs, avec un espace de recherche beaucoup plus vaste, n'a pas encore de solution connue pour toutes les positions possibles.
Comment les ordinateurs ont-ils commencé à battre les humains au jeu de go ?
-Les ordinateurs ont commencé à battre les humains au jeu de go en utilisant des algorithmes d'apprentissage, notamment après l'année 2010.
Quel est le nom de la première machine capable de jouer et de gagner un jeu ?
-La première machine capable de jouer et de gagner un jeu s'appelait 'IHM à 30 présentation 1940'.
Comment fonctionne le jeu de Nîmes ?
-Le jeu de Nîmes est un jeu où deux joueurs prennent tour à tour une, deux ou trois allumettes jusqu'à en rester aucune. Le joueur qui prend la dernière allumette gagne.
Comment un joueur peut-il être assuré de gagner au jeu de Nîmes ?
-Un joueur peut être assuré de gagner en amenant le jeu à un certain nombre d'allumettes qui est un multiple de 4, comme 4, 8, 12, 16, 20, etc.
Quelle stratégie est utilisée pour trouver l'algorithme gagnant du jeu de Nîmes ?
-On utilise des gobelets ou des conteneurs marqués correspondant au nombre d'allumettes restant pour trouver l'algorithme gagnant du jeu de Nîmes.
Combien de parties a fallu au robot pour apprendre l'algorithme gagnant s'il joue contre un robot qui joue au hasard ?
-Il a fallu en moyenne 110 parties au robot pour apprendre l'algorithme gagnant s'il joue contre un robot qui joue au hasard.
Combien de parties a fallu au robot pour apprendre l'algorithme gagnant s'il joue contre un robot connaissant déjà l'algorithme ?
-Il a fallu en moyenne environ 40 parties au robot pour apprendre l'algorithme gagnant s'il joue contre un robot qui connaît déjà l'algorithme.
Quelle est la conclusion philosophique tirée de l'apprentissage du robot ?
-La conclusion philosophique est que l'apprentissage est plus rapide en perdant et en se trompant beaucoup, car cela permet d'apprendre beaucoup plus vite.
Comment peut-on voir la vidéo présentant le même algorithme de jeu de Nîmes ?
-On peut voir la vidéo sur YouTube en recherchant la vidéo présentant l'algorithme de jeu de Nîmes.
Outlines
😀 Intelligence Artificielle et Apprentissage dans les Jeux
Dans le dixième épisode, l'accent est mis sur l'intelligence artificielle et son application au domaine du jeu, en particulier l'apprentissage. Le tic-tac-toe et le morpion, des jeux résolus par ordinateur depuis 1952, illustrent comment un algorithme complet peut conduire à un match nul en jouant de manière optimale. L'augmentation de la combinatoire pour le jeu du puissance 4 ne change pas le principe, mais dépasse la capacité humaine de maîtriser l'algorithme. Les échecs, avec leur complexité exponentielle, montrent comment les ordinateurs ont battu les humains grâce à la puissance de calcul brute, sans nécessiter d'apprentissage. Cependant, pour le jeu de go, où les dispositions possibles sont encore plus grandes, les ordinateurs n'ont commencé à battre les meilleurs humains qu'en 2010 grâce à des algorithmes d'apprentissage. Les intelligences artificielles s'entraînent les unes contre les autres pour s'améliorer. Le script mentionne également une machine de 1940 capable de jouer au jeu de Nîmes, qui simulait la réflexion pour ne pas frustrer les joueurs humains. Le jeu de prise d'allumettes est utilisé pour montrer comment l'intelligence artificielle peut être appliquée à la résolution de problèmes de stratégie, en utilisant des gobelets pour représenter les différentes positions du jeu et déterminer l'algorithme gagnant.
🤖 Apprentissage par les Robots : Stratégies et Erreurs
Le deuxième paragraphe explore la pédagogie de l'apprentissage par les erreurs dans le contexte de robots jouant à des jeux. Il est mentionné que si un robot apprend à jouer contre un robot qui joue au hasard, il lui faut en moyenne 110 parties pour trouver l'algorithme gagnant, car les victoires aléatoires ne permettent pas d'apprendre. En revanche, lorsqu'il joue contre un robot qui connaît déjà l'algorithme gagnant, il lui faut seulement environ 40 parties pour apprendre, soulignant l'importance de l'apprentissage par les erreurs. La conclusion philosophique est que l'apprentissage est plus efficace lorsqu'il est basé sur des erreurs et des défaites plutôt que sur des succès aléatoires. Le paragraphe encourage également le téléchargement d'une vidéo sur YouTube qui présente le même algorithme d'apprentissage pour résoudre des problèmes de stratégie, comme le jeu du morpion, impliquant une grande quantité de boîtes d'allumettes et de temps pour parvenir à la stratégie gagnante.
Mindmap
Keywords
💡Intelligence artificielle
💡Apprentissage
💡Tic-tac-toe
💡Échecs
💡Go
💡Algorithme complet
💡Nim
💡Machine à jouer
💡Gobelets
💡Robots apprenants
💡Stratégie gagnante
Highlights
Présentation de l'utilisation de l'intelligence artificielle dans les jeux comme le tic-tac-toe et le puissance 4, expliquant la résolution de ces jeux par des algorithmes complets.
Discussion sur la capacité des ordinateurs à battre les humains aux échecs grâce à la puissance de calcul, sans apprentissage machine.
Introduction du jeu de Go, où les ordinateurs ont surpassé les capacités humaines grâce à des algorithmes d'apprentissage avancés.
Évocation de la première machine de jeu, créée dans les années 1940, capable de jouer et gagner un jeu de stratégie simple, utilisant des relais électromécaniques.
Explication du jeu de Nim et de son intérêt pédagogique pour les jeunes enfants, enseignant que prendre le plus n'est pas toujours synonyme de victoire.
Description de la méthode utilisée pour découvrir l'algorithme de victoire au jeu de Nim, utilisant des gobelets et des jetons pour simuler les choix possibles.
Révélation de la stratégie gagnante au jeu de Nim, qui consiste à amener l'autre joueur à un nombre d'allumettes multiple de quatre.
Analyse de l'apprentissage machine en action, illustrée par la programmation de deux robots jouant au jeu de Nim, avec un focus sur le processus d'apprentissage accéléré.
Comparaison de la vitesse d'apprentissage entre jouer contre un robot aléatoire et un robot qui connaît déjà l'algorithme gagnant, soulignant l'importance de l'échec dans l'apprentissage rapide.
Conclusion philosophique sur l'apprentissage, mettant en lumière que perdre et se tromper sont essentiels pour apprendre efficacement.
Invitation à découvrir une vidéo sur YouTube présentant la même méthode d'apprentissage pour le morpion, nécessitant de nombreuses boîtes d'allumettes et du temps.
Transcripts
[Musique]
bonjour
pour ce dixième épisode nous allons
parler d'intelligence artificielle mais
plus précisément du côté apprentissage
et de son utilisation dans les jeux
le jeu du tic tac toe ou le morpion en
français est résolu par ordinateur
depuis 1952
c'est à dire qu'en jouant de façon
optimale il y aura toujours match nul
entre les deux joueurs ont dit que son
algorithme est complet la taille des
coûts possibles est accessible à lecture
humaine sans trop de soucis
pour le puissance 4 on augmente
largement la combinatoire mais le
principe est le même en jouant de façon
optimale
le premier joueur peut gagner à tous les
coups on dépasse par contre la capacité
humaine normale de maîtriser cet
algorithme complet on est à plus de 4000
milliards de positions possibles mais ce
n'est encore rien comparé aux échecs
si les ordinateurs peuvent maintenant
battre n'importe quel humain à ce jeu il
n'a pas encore été démontrée s'il
existait ou non un algorithme complet
jusque là les ordinateurs ont réussi à
battre les humains sans en passer par la
case apprentissage juste par une
puissance de calcul brute du coup est ce
vraiment d'intelligence pour le jeu de
go il a fallu attendre l'année 2010 est
pour que les ordinateurs battre les
meilleurs humains et cette fois ci c'est
grâce à des algorithmes d'apprentissage
c'est que de 10 puissance 40 positions
aux échecs on considère 10 puissance 160
dispositions possibles pour le go depuis
les intelligences artificielles
s'entraînent les unes contre les autres
pour devenir de plus en plus
performantes et largement dépassé les
capacités humaines sur ses tâches très
spécialisées pour notre activité
d'informatique débranché nous allons
prendre un jeu encore plus simple que le
morpion
voilà la première machine capable de
jouer et de gagner ce jeu mystérieux il
s'agit d'une ihm à 30 présentation 1940
aucun transistors basé sur des relais
électromécaniques cette machine
permettait de jouer au jeu de nîmes
de façon assez amusante cette machine
était même ralenti et faisait semblant
de réfléchir pour ne pas frustrer les
joueurs humains
en quoi consiste ce jeu prenons deux
joueurs 15 allumettes
à tour de rôle chaque joueur peut
prendre une deux ou trois à lui même
on continue jusqu'à ne plus avoir
d'allumettes celui qui prend la dernière
a gagné c'est un excellent jeu de
réflexion pour les jeunes enfants
puisque cela va leur apprendre que ce
n'est pas forcément celui qui prend le
plus d'allumettes qui gagne
contrairement aux intuitions général
dans les jeux qu'ils connaissent autre
élément la position des allumettes
comprend n'a aucune importance dans la
stratégie employée
pour trouver l'algorithme qui permet de
gagner à ce jeu nous allons utiliser des
gobelets ou des verts ou tout autre
conteneur il en faut autant que le
nombre initial d'allumettes
l'un des joueurs qui jouera le rôle de
l'ordinateur des branches et utilisera
ses gobelets et des jetons marquer un
deux ou trois que l'on place dans les
gobelets pour simplifier prenons un jeu
à huit allumettes donc les gobelets sont
marqués de 1 à 8
chaque gobelet correspond au nombre
d'allumettes restant sur la table dans
le gobelet 8
on place trois jetons correspondant au
coût possible à ce stade c'est pour cela
que dans le gobelet deux seuls deux
jetons sont nécessaires on ne peut pas
prendre trois à l'hymne est alors qu'il
ne reste que deux camps la partie
commence le joueur des branches et tire
au sort un des jetons et prend le nombre
d'allumettes indiqué
le joueur humain prend le nombre
d'allumettes qu'il veut la partie
continue jusqu'au bout si le joueur
débrancher père il jette le dernier pion
piocher et remet les autres dans leur
gobelet au bout d'un certain nombre de
parties vous devriez obtenir la
situation suivante dans les gobelets
c'est la situation qui permet aux
joueurs des branches et de gagner à tous
les coups s'il ne commence pas et de
gagner à tous les coups s'il commence et
que l'autre fait une erreur il existe
donc un algorithme complet pour que l'un
des deux joueurs gagnent à tous les
coups
il faut ne pas tomber sur les verts 4 ou
8 sur 8
le premier joueur ne peut pas amener
l'autre sur le vert 4 et pour tous ses
coups possibles l'autre joueur peut
ramener la partie sur le vert 4 est de
même sur le maire 4 le premier joueur ne
peut pas amener la partie sur 0 ce qui
ferait gagner
et quel que soit son coup l'autre joueur
lui peut remporter la victoire en
prenant la dernière allumettes
plus généralement il faut amener l'autre
joueur sur un nombre d'allumettes
multiple de 4 donc 48 12 16 20 etc
pour illustrer cet apprentissage nous
proposons de programmer deux robots dont
l'un va apprendre à jouer avec ces
gobelets voilà en accéléré ce que cela
donne
[Musique]
[Musique]
je suis devenu intelligent en passant
par qui vous pouvez vous rendre compte
qu'il lui a quand même fallu 60 parties
pour trouver l'algorithme gagnant choses
très intéressantes pour la pédagogie
générale de l'apprentissage c'est que si
ce robot apprenant joue contre un robot
qui jouent complètement au hasard
il lui faudra en moyenne 110 parties
pour trouver l'algorithme gagnant parce
que le hasard faisant il réussit à
gagner certaines parties donc il
n'apprend rien alors que s'il joue
contre un robot qui connaît déjà
l'algorithme gagnant il ne lui faudra en
moyenne qu environ 40 parties pour
apprendre là le rythme gagnant c'est en
perdant beaucoup donc en se trompant
beaucoup qu'il apprend beaucoup plus
vite sur cette conclusion tout
philosophique
je vous souhaite de trouver sur youtube
la vidéo présentant le même algorithme
me débrancher d'apprentissage pour
apprendre à des boîtes d'allumettes à
jouer au morpion
il vous faudra beaucoup de boîtes
d'allumettes et de temps pour arriver à
la stratégie gagnante par contre à
bientôt
[Musique]
Parcourir plus de vidéos associées
![](https://i.ytimg.com/vi/J4RqCSD--Dg/hq720.jpg)
What is AI? - AI Basics
![](https://i.ytimg.com/vi/c82ciP2VXaA/hq720.jpg)
AI and Physics: new Math?
![](https://i.ytimg.com/vi/zRAMfXeTu6o/hq720.jpg)
L'expérience de la nature | Les chemins du sacré (1/5) | ARTE
![](https://i.ytimg.com/vi/bK_fnLCgF9M/hq720.jpg)
How to Become a Creative Director with Alexa Chung | Future of Fashion | British Vogue
![](https://i.ytimg.com/vi/cASDYP2dm10/hqdefault.jpg?sqp=-oaymwEXCJADEOABSFryq4qpAwkIARUAAIhCGAE=&rs=AOn4CLBpCnJw1huP71ZQA1cVZNRz3LsPfg)
History of Food 2/5: The Agricultural Revolution
![](https://i.ytimg.com/vi/bpQyJndfdyk/hqdefault.jpg?sqp=-oaymwEXCJADEOABSFryq4qpAwkIARUAAIhCGAE=&rs=AOn4CLBJ4ZkgV4yLeR6efIsseVhgNrZk9g)
Board Game Business Podcast - How to Get Into Distribution
5.0 / 5 (0 votes)