Source: Cur de la machine

Cet article est � propos de 2853 mots , Il est recommand� de lire 7 minutes .

Cet article pr�sente un �mulateur Gameboy �crit en Python qui a attir� une large attention sur les r�seaux sociaux.

Pour de nombreux apr�s-80 et apr�s 90, Nintendo Gameboy repr�sente une grande partie de la jeunesse. Beaucoup de jeux que nous connaissons �taient � l'origine port�s sur cet ordinateur de poche 8 bits, y compris les c�l�bres s�ries "Mario" et "Zelda". Pour les joueurs nationaux, c'est la s�rie "Pokemon" que nous avons le plus jou�.

Cela fait 30 ans que cette console de jeu est sortie pour la premi�re fois, mais l'enthousiasme des gens pour elle n'a pas diminu�. Hier, un �mulateur Gameboy �crit en Python a attir� une large attention sur les r�seaux sociaux.

La jeunesse de Lord est de retour? La publication de l'auteur sur Reddit a rapidement re�u des milliers de likes.

Mads Ynddal, l'un des auteurs du projet, a annonc� que la version 1.0 de PyBoy �tait officiellement publi�e.

Qu'est-ce que PyBoy?

En bref, il s'agit d'un �mulateur Game Boy �crit enti�rement � partir de z�ro en Python, et prend en charge les scripts via API. Les chercheurs ont ajout� des d�finitions de type afin de pouvoir utiliser Cython pour compiler le logiciel, obtenant ainsi des performances comparables � celles des simulateurs �crits en C et C ++.

Lien du projet: https://github.com/Baekalfen/PyBoy

Caract�ristiques

PyBoy est con�u pour �tre accessible via Python, il soutient et encourage donc les gens � faire de la recherche exp�rimentale, et les robots et l'intelligence artificielle exp�rimentent. Les chercheurs cr�ent des wrappers sp�cifiques au jeu. Actuellement, les wrappers permettent aux programmeurs d'interagir avec Tetris et Super Mario sans avoir besoin d'avoir une connaissance approfondie de Game Boy. Vous pouvez vous r�f�rer au document: https://docs.pyboy.dk.

Les auteurs du projet veulent �galement apprendre et essayer des fonctions plus particuli�res. Selon les recherches du projet universitaire, ils ont ajout� une fonction de rembobinage au simulateur, ce qui signifie que vous pouvez revenir en arri�re dans n'importe quel jeu.

Architecture du simulateur PyBoy

En 1990, Nintendo a demand� un brevet pour la Game Boy. La figure ci-dessous montre l'int�gration et la connexion entre le CPU, la RAM, la cassette et l'affichage dans ce brevet.

Diagramme d'architecture dans le brevet Game Boy.

Sur cette base, les membres du projet PyBoy ont d�velopp� une classe pour chaque composant en Python, �tablissant ainsi une base pour le �syst�me client� sur le �syst�me h�te� (le syst�me ex�cute Python). Le syst�me client est le mat�riel virtuel Game Boy. En th�orie, il peut ex�cuter toutes les parties du logiciel �crit pour la Game Boy.

La figure suivante montre toutes les classes et leurs relations dans le simulateur PyBoy:

L'importance de PyBoy pour l'apprentissage par renforcement et sa comparaison avec d'autres environnements

Au fil des ans, de nombreuses personnes ont d�velopp� des �mulateurs Gameboy, et il existe maintenant des outils qui peuvent fonctionner sur des ordinateurs et des t�l�phones portables. Pourquoi en �crire un en Python? Bien s�r, il est utilis� pour former l'intelligence artificielle.

Envie de jouer � des jeux? Gameboy est un peu "difficile � apprendre" pour les gens de nos jours.

L'approche la plus proche de l'apprentissage g�n�ral par renforcement de l'intelligence artificielle

Le concept d'intelligence artificielle g�n�rale fait r�f�rence � la capacit� des machines � mener � bien toute t�che intellectuelle que les humains peuvent accomplir. � l'heure actuelle, nos recherches sur l'IA sont encore loin de cet objectif. Wu Enda a dit auparavant que ce que fait l'apprentissage profond, c'est seulement un �ajustement de courbe� de haute dimension.

Contrairement � ces algorithmes d'apprentissage automatique qui reposent sur des donn�es pr�-collect�es (m�me n�cessitant beaucoup d'�tiquetage manuel), l'apprentissage par renforcement est un algorithme qui n'est entra�n� que gr�ce � des r�compenses environnementales, et son m�canisme de fonctionnement est similaire au syst�me de dopamine � l'int�rieur du corps humain. L'apprentissage par renforcement est actuellement l'algorithme d'apprentissage automatique qui se rapproche le plus de la capacit� des humains � apprendre de l'exp�rience, et est particuli�rement adapt� aux sc�narios o� les agents doivent prendre des d�cisions en fonction de leur environnement.

La figure suivante montre comment l'agent RL utilise uniquement des images de jeu comme entr�e pour apprendre les strat�gies de contr�le de Mario.

Pourquoi de nombreuses recherches sur la RL sont-elles men�es sur Atari au lieu d'autres questions plus pratiques?

La recherche sur la RL utilise Atari comme r�f�rence pour les raisons suivantes:

L'environnement Atari nous permet d'utiliser le m�me algorithme pour tester plusieurs environnements diff�rents afin de v�rifier la polyvalence de l'algorithme RL;

Puisque l'entr�e n'est que l'image du jeu, la complexit� du probl�me est augment�e;

Atari fournit aux chercheurs une plateforme de test reconnue capable de comparer �quitablement les performances de diff�rents algorithmes;

RL n�cessite une grande quantit� de donn�es interactives pour l'apprentissage.Avant le test r�el dans l'environnement r�el, Atari fournit une plate-forme de test s�re, rapide et �conomique pour la v�rification initiale de l'algorithme.

L'image suivante montre certains environnements Atari:

Comparaison d'Atari, PySC2 et d'autres environnements avec PyBoy

La section pr�c�dente pr�sentait les nombreux avantages de la formation des agents RL dans l'environnement Atari, mais avec le d�veloppement de RL, cet environnement relativement simple ne convient progressivement plus aux nouvelles recherches RL actuelles. Il n'y a pas si longtemps, l'Agent57 propos� par DeepMind d�passait le niveau moyen des joueurs humains dans tous les environnements Atari, ce qui indiquait �galement que la recherche RL sur les environnements Atari touche progressivement � sa fin.

Les environnements plus difficiles tels que DeepMind et PySC2 de Blizzard exigent que les agents apprennent des strat�gies complexes de coordination et de confrontation. Bien qu'AlphaStar ait obtenu des r�sultats impressionnants dans cet environnement, il reste encore de nombreux probl�mes � r�soudre. Ce qui suit est un diagramme sch�matique de l'environnement PySC2.

On peut dire que la difficult� de l'environnement PyBoy se situe entre Atari et PySC2, elle nous fournit un nouveau benchmark pour v�rifier les performances de RL. Avant d'appliquer RL � des probl�mes pratiques plus complexes, nous pouvons effectuer des tests peu co�teux et efficaces dans cet environnement mod�r�ment difficile.

Comme la dit Andrej Karpathy, directeur de lintelligence artificielle et de la conduite autonome de Tesla, �il faut toujours essayer un pistolet BB avant datteindre le Bazooka�.

Introduction � Github

comment installer?

Si vous avez configur� un environnement qui peut ex�cuter Python normalement, l'installation sera tr�s simple:

Installez SDL2 via le gestionnaire de packages (sudo apt install libsdl2-dev ou brew install sdl2)

Utilisez pip install pyboy pour installer Pyboy

Vous pouvez utiliser PyBoy directement depuis le terminal $ pyboy file.rom ou l'utiliser dans un script Python:

depuis pyboy import PyBoypyboy = PyBoy ('ROMs / gamerom.gb') alors que pas pyboy.tick (): pass

Le projet prend �galement en charge macOS, Raspberry Pi (Raspbian), Linux (Ubuntu) et Windows 10.

Documentation de l'API PyBoy

Si les utilisateurs ont besoin de cr�er leur propre robot ou IA, vous pouvez trouver tous les composants externes � prendre en charge dans la documentation PyBoy (https://baekalfen.github.io/PyBoy/index.html). Les diff�rentes classes et leur utilisation sont toutes C'est tr�s d�taill�, donc je ne les r�p�terai pas ici. (L'index de structure comme indiqu� ci-dessous)

Exemple court

PyBoy peut �tre charg� en tant qu'objet en Python. Ainsi, il peut �tre initialis� � partir d'un autre script et peut �tre contr�l� et d�tect� par ce script. Jetez un il � un "robot" rugueux sur gamewrapper_tetris.py, interagissant avec le jeu. Bien s�r, tous les composants externes peuvent �tre trouv�s dans la documentation PyBoy.

Pour les documents g�n�raux sur Game Boy, vous pouvez afficher les documents Pan, qui contiennent des informations d�taill�es sur chaque sujet.

Ce qui suit est une courte d�mo de lecture de donn�es � partir de l'�cran, le code peut �galement �tre trouv� dans gamewrapper_mario.py:

import osimport sysfrom pyboy import PyBoy, WindowEvent # Nous permet d'importer PyBoy depuis le r�pertoire ci-dessousfile_path = os.path.dirname (os.path.realpath (__ file __)) sys.path.insert (0, file_path + "/ .." ) # V�rifiez si la ROM est fournie via argvif len (sys.argv) > 1: filename = sys.argvelse: print ("Utilisation: python mario_boiler_plate.py") exit (1) quiet = "--quiet" in sys.argvpyboy = PyBoy (filename, window_type = "headless" if quiet else "SDL2" , window_scale = 3, debug = not quiet, game_wrapper = True) pyboy.set_emulation_speed (0) assert pyboy.cartridge_title () == "SUPER MARIOLAN" mario = pyboy.game_wrapper () mario.start_game () assert mario.score == 0assert mario.lives_left == 2assert mario.time_left == 400assert mario.world == (1, 1) assert mario.fitness == 0 # Un score de fitness int�gr� pour le d�veloppement de l'IAlast_fitness = 0print (mario) pyboy.send_input (WindowEvent .PRESS_ARROW_RIGHT) pour _ dans la plage (1000): assert mario.fitness > = last_fitness last_fitness = mario.fitness pyboy.tick () if mario.lives_left == 1: assert last_fitness == 27700 assert mario.fitness == 17700 # Perdre un live, signifie 10.000 points dans cette empreinte de fitness (mario) breakelse: print ( "Mario n'est pas mort?") Exit (2) mario.reset_game () assert mario.lives_left == 2pyboy.stop ()

Si vous ex�cutez le code ci-dessus avec Super Mario Land ROM charg�, vous obtiendrez l'image et la sortie du terminal ci-dessous. Il est � noter que le mod�le de Mario est affich� sous la forme d'index 0, 1, 16, 17.

A propos de l'auteur

Les auteurs du projet Asger Anders Lund Hansen, Mads Ynddal et Troels Ynddal sont tous originaires du Danemark. Mads Ynddal, dipl�m� de l'Universit� de Copenhague au Danemark, a d�clar� qu'en fait, ce simulateur Gameboy remonte � son projet en 2015 lorsqu'il �tait � l'universit�.

La version 1.0 de l'�mulateur Gameboy a �t� publi�e, mais les d�veloppeurs peuvent encore faire beaucoup de choses. Le d�veloppeur du projet a d�clar� que les directions actuelles qui peuvent �tre avanc�es incluent l'ajout de son, de couleur, de connexion de simulation Gameboy au simulateur et d'empaquetage de plus de jeux, et bien s�r, il existe des exemples de formation de r�seaux de neurones.

J'esp�re qu'avec les efforts des gens, les jeux de Gameboy pourront �galement rena�tre. Plus important encore, il a d�sormais pour mission de former l'intelligence artificielle.

-Terminer-

Suivez la plate-forme publique officielle WeChat de l'Institut Tsinghua-Qingdao pour la science des donn�es " Tarte aux donn�es AI "Et le num�ro de soeur" Tarte aux donn�es JEU "Obtenez plus d'avantages de cours et un contenu de qualit�.

Route de la soie

Apprenez � conna�tre la Chine

Utilisez Python pour �crire un �mulateur Gameboy et entra�ner des mod�les d'IA!

Introduction � Github