Dans cette vidéo, les auteurs ont observé des agents qui apprenaient progressivement à utiliser des outils de plus en plus complexes en jouant à un simple jeu de cache-cache. En s'entraînant dans un nouvel environnement de simulation de cache-cache, les agents ont développé une série de six stratégies et contre-stratégies distinctes, dont certaines étaient inconnues jusqu'alors. La complexité émergente auto-supervisée dans cet environnement simple suggère que la co-adaptation multi-agent pourrait un jour produire des comportements extrêmement complexes et intelligents.
OUIC
administrateur
0
0
créé le : 13/04/2023
mis à jour le : 05/04/2025
Trop intéressant !
Fataaa
moderateur
0
0
créé le : 14/04/2023
mis à jour le : 14/04/2023
une autre IA qui joue à débloquer des situations :