DeepMind et Blizzard d�veloppent conjointement des outils edit'e et ensembles de donn�es de lecture, de sorte que de jouer plus de chercheurs StarCraft 2 sur la grippe aviaire

Lei Feng r�seau AI Technology Review par: la fin de l'ann�e derni�re, quand nous savons tous DeepMind intelligence artificielle pour commencer � jouer Starcraft, et aujourd'hui DeepMind papiers officiellement lib�r�s et connexes Bowen d�crit ses r�alisations dans ce domaine, ils ont publi� conjointement Blizzard un ensemble d'outils pour faciliter davantage de chercheurs � participer � la (que AI) pour jouer � StarCraft II. Lei Feng r�seau AI Technology Review compil� comme suit.

DeepMind ont �t� un objectif scientifique: pour construire le syst�me peut apprendre � r�soudre des probl�mes complexes, afin de continuellement faire avancer le d�veloppement de pointe intelligence artificielle. � cette fin, DeepMind a d�velopp� une vari�t� d'agent, puis utiliser une grande vari�t� d'essais environnementaux eux sur leur propre plate-forme construite DeepMind Lab.

Un important environnement de test de classe est le jeu. Bien qu'ils ne sont pas sp�cifiquement con�us pour l'�tude de l'intelligence artificielle, mais que les �tres humains peuvent avoir un bon temps, ce qui est une m�thode importante de l'�valuation des performances de l'intelligence artificielle. Allez et jouer � des jeux Atari sont plus qualifi�s apr�s, DeepMind cette �tude d�crit les progr�s r�alis�s dans le nouveau jeu: StarCraft 2.

DeepMind et Blizzard lib�r� SC2LE ensemble, cela est une aide aux chercheurs d'apprendre � faire l'intelligence artificielle pour jouer � ce jeu RTS StarCraft 2 bo�te � outils. La lib�ration de SC2LE comprennent:
Une API d'apprentissage machine, d�velopp�e par la temp�te de neige, il peut aider l'acc�s aux chercheurs et aux d�veloppeurs du jeu. Il a �galement pour la premi�re fois comprend un outil pour ex�cuter sous Linux.
Un ensemble de donn�es anonymes replay du jeu, seulement 65000 le terrain dans les prochaines semaines augmentera � environ 500000 le terrain.
DeepMind version open source de la bo�te � outils PySC2, les chercheurs peuvent l'utiliser pour faire facilement l'utilisation de l'API de niveau de fonction d'agent de Blizzard.
Un complet DeepMind et Blizzard document commun, qui d�crit � peu pr�s la composition de l'environnement, r�alis� dans un jeu de test dans les premiers r�sultats de r�f�rence, apprendre � suivre la rediffusion, ainsi que 1c1 confrontation d'�chelle avec l'IA dans le jeu.

Starcraft et Starcraft 2 est consid�r� comme le plus grand jeu de tous, le plus grand succ�s de ce groupe, les joueurs se battent dans ces jeux o� il y a plus de 20 ans. Non seulement Starcraft 2, Starcraft a �galement �t� la premi�re g�n�ration de chercheurs en intelligence artificielle et d'apprentissage de la machine a utilis� un environnement de test, sera l'h�te de l'intelligence artificielle de concours annuel interstellaire AIIDE. Starcraft est si la long�vit�, une grande partie de la raison est en raison de son jeu riche, aux multiples facettes, de sorte qu'il est devenu au fil de l'environnement de la recherche en intelligence artificielle de.

Par exemple, le but ultime interstellaire est de battre l'adversaire, mais les joueurs ont encore besoin d'effectuer une s�rie de ressources collectons, construire ce b�timent cible et trouver un �quilibre entre eux. De plus, un jeu le temps pass� aussi court que quelques minutes ou jusqu'� une heure, puis les mesures prises t�t dans le jeu ne peut pas voir un gain correspondant dans un temps tr�s long. Enfin, seule une partie de la zone sur la carte est visible, l'agent devra utiliser une capacit� de m�moire et de la planification int�gr�e, afin d'obtenir la victoire.

De plus, il y a d'autres aspects de ce jeu est aussi attrayant pour les chercheurs, comme chaque jour un grand nombre de joueurs de confrontation de jeu en ligne. Cela garantit qu'il y aura des donn�es de relecture massive pour l'agent d'apprendre, et de l'agent et aura �galement de nombreux adversaires talentueux peuvent apprendre.

Cependant, le sous-jacent � fonctionner m�me si seules op�rations interplan�taires sont un d�fi de taille, tout le temps qui peut �tre s�lectionn� plus de 300 sortes. Ce jeu avec Atari pour former une distinction claire, qu'il est une action en option pas plus de 10 types (tels que vertical et horizontal). Sur cette base, il fonctionne �galement dans les niveaux interstellaires peuvent �tre modifi�s et am�lior�s, de nombreuses op�rations doivent cliquer sur l'�cran. M�me si seulement comme un 84x84 petit �cran, toutes les actions possibles ajouteront jusqu'� des centaines de millions d'esp�ces.

Et l'agent humain, en fonction des diff�rentes unit�s, diff�rentes op�rations s�lectionn�es peut �tre effectu�e

Apr�s la sortie de cet outil, les chercheurs peuvent utiliser des outils propres de Blizzard pour r�soudre certains probl�mes mentionn�s ci-dessus, de sorte que vous pouvez cr�er vos propres t�ches et mod�les plus facilement.

DeepMind du paquet d'outils de classification de l'environnement PySC2, qui fournit une interface flexible et facile � utiliser pour l'agent d'apprentissage de renforcement pour les aider � jouer le jeu. Dans la version initiale de ce lancement, PySC2 le jeu est devenu une division des diff�rents �l�ments de diff�rents � niveau de fonctionnalit� �, tels que diff�rents types d'unit�s, la valeur de la vie, et ainsi la visibilit� de la carte sera s�par�e de l'autre, tout en jeu maintenant le noyau d'�l�ments visuels et spatiaux.

affichage de jeu diff�rents types de contenu dans les diff�rentes couches

Kit d'outils SC2LE comprend en outre une s�rie de jeu de tests, que le jeu entier est divis� en une pluralit� de segments de diff�rentes contr�lable, de sorte que la performance de l'agent peut �tre test� dans une t�che sp�cifique, cet angle est chang�, comme des unit�s d'exploitation mini�re ou s�lectionn�s . Les chercheurs peuvent tester ce petit jeu dans leur technologie, mais peut aussi aider � construire plus des mini-jeux d'essai, les chercheurs continuent � favoriser une plus grande concurrence et l'�valuation.

jeu d'apprentissage de renforcement simple qui permet aux chercheurs de tester les performances de l'agent dans une t�che particuli�re

Les progr�s DeepMind actuellement, leur agent doit jouer une bonne performance dans des t�ches sp�cifiques de ce petit jeu, mais le jeu entier, m�me une base relativement forte, telle A3C AI aussi n'a pas gagn�, � simple � dans le jeu AI. Par exemple, la figure d'action suivante dans la gauche de la formation initiale est un organisme intelligent, il ne peut pas laisser miner l'exploitation mini�re, sans effort pour l'homme. Apr�s la formation, l'intelligence a pr�sent� une action significative, mais si vous les rendre comp�titifs, il faut aussi avoir une perc�e plus en profondeur dans l'apprentissage de renforcement et des domaines connexes.

chercheurs DeepMind trouv� un moyen pour l'agent d'apprendre la strat�gie plus de comp�tences est d'apprendre � imiter. Ces m�thodes d'apprentissage seront bient�t devenir plus facile avec l'aide de Blizzard, ils ont promis de continuer � publier rediffusion de jeu anonyme sur des centaines d'�chelle Starcraft 2 de milliers manches. Cela permet non seulement des chercheurs form�s par l'agent de la m�thode d'apprentissage supervis�, mais aussi pour la pr�vision de la s�rie, la m�moire � long terme, et ainsi d'autres domaines de la recherche possible.

DeepMind espoir que ces outils nouvellement lib�r�s permet communaut� d'intelligence artificielle sur le jeu Starcraft r�sultats de recherche existants vont encore plus loin pour encourager davantage de personnes � se livrer � une �tude approfondie des �tudes intensives, les chercheurs ont �galement rendu plus facile de suivre le champ avant-garde du d�veloppement. DeepMind �galement nous r�jouissons � la communaut� de l'intelligence artificielle peut avoir des d�couvertes merveilleuses.

Adresse Papers: https: //deepmind.com/documents/110/sc2le.pdf

PySC2 adresse github: https: //github.com/deepmind/pysc2

Starcraft 2 adresses API de Blizzard (inclut la version Linux de l'information, des jeux et d'autres rediffusion de contenu): https: //github.com/Blizzard/s2client-proto

via DeepMind Blog de recherche, Lei Feng r�seau compil� AI Technology Review

Route de la soie

Apprenez � conna�tre la Chine

DeepMind et Blizzard d�veloppent conjointement des outils edit'e et ensembles de donn�es de lecture, de sorte que de jouer plus de chercheurs StarCraft 2 sur la grippe aviaire