Dans cette vidéo, les auteurs ont observé des agents qui apprenaient progressivement à utiliser des outils de plus en plus complexes en jouant à un simple jeu de cache-cache. En s'entraînant dans un nouvel environnement de simulation de cache-cache, les agents ont développé une série de six stratégies et contre-stratégies distinctes, dont certaines étaient inconnues jusqu'alors. La complexité émergente auto-supervisée dans cet environnement simple suggère que la co-adaptation multi-agent pourrait un jour produire des comportements extrêmement complexes et intelligents.
OUIC
Fondateur
0
0
créé le : 13/04/2023
mis à jour le : 04/09/2025
Trop intéressant !
Fataaa
Premium
0
0
créé le : 14/04/2023
mis à jour le : 14/04/2023
une autre IA qui joue à débloquer des situations :
Deviaweb est soucieux de l'importance de vos données personnelles.
Vous ne verrez jamais de publicité ici.
Nous ne collectons que les informations strictement nécessaires pour vous offrir une expérience utilisateur optimale.
Nous ne :
vendons pas vos données
les louons pas
les utilisons pas pour vous envoyer des spams
Votre anonymat et votre confort de navigation sont nos priorités.