DeepMind et Blizzard développent conjointement des outils edit'e et ensembles de données de lecture, de sorte que de jouer plus de chercheurs StarCraft 2 sur la grippe aviaire

Lei Feng réseau AI Technology Review par: la fin de l'année dernière, quand nous savons tous DeepMind intelligence artificielle pour commencer à jouer Starcraft, et aujourd'hui DeepMind papiers officiellement libérés et connexes Bowen décrit ses réalisations dans ce domaine, ils ont publié conjointement Blizzard un ensemble d'outils pour faciliter davantage de chercheurs à participer à la (que AI) pour jouer à StarCraft II. Lei Feng réseau AI Technology Review compilé comme suit.

DeepMind ont été un objectif scientifique: pour construire le système peut apprendre à résoudre des problèmes complexes, afin de continuellement faire avancer le développement de pointe intelligence artificielle. À cette fin, DeepMind a développé une variété d'agent, puis utiliser une grande variété d'essais environnementaux eux sur leur propre plate-forme construite DeepMind Lab.

Un important environnement de test de classe est le jeu. Bien qu'ils ne sont pas spécifiquement conçus pour l'étude de l'intelligence artificielle, mais que les êtres humains peuvent avoir un bon temps, ce qui est une méthode importante de l'évaluation des performances de l'intelligence artificielle. Allez et jouer à des jeux Atari sont plus qualifiés après, DeepMind cette étude décrit les progrès réalisés dans le nouveau jeu: StarCraft 2.

  • DeepMind et Blizzard libéré SC2LE ensemble, cela est une aide aux chercheurs d'apprendre à faire l'intelligence artificielle pour jouer à ce jeu RTS StarCraft 2 boîte à outils. La libération de SC2LE comprennent:

  • Une API d'apprentissage machine, développée par la tempête de neige, il peut aider l'accès aux chercheurs et aux développeurs du jeu. Il a également pour la première fois comprend un outil pour exécuter sous Linux.

  • Un ensemble de données anonymes replay du jeu, seulement 65000 le terrain dans les prochaines semaines augmentera à environ 500000 le terrain.

  • DeepMind version open source de la boîte à outils PySC2, les chercheurs peuvent l'utiliser pour faire facilement l'utilisation de l'API de niveau de fonction d'agent de Blizzard.

  • Un complet DeepMind et Blizzard document commun, qui décrit à peu près la composition de l'environnement, réalisé dans un jeu de test dans les premiers résultats de référence, apprendre à suivre la rediffusion, ainsi que 1c1 confrontation d'échelle avec l'IA dans le jeu.

Starcraft et Starcraft 2 est considéré comme le plus grand jeu de tous, le plus grand succès de ce groupe, les joueurs se battent dans ces jeux où il y a plus de 20 ans. Non seulement Starcraft 2, Starcraft a également été la première génération de chercheurs en intelligence artificielle et d'apprentissage de la machine a utilisé un environnement de test, sera l'hôte de l'intelligence artificielle de concours annuel interstellaire AIIDE. Starcraft est si la longévité, une grande partie de la raison est en raison de son jeu riche, aux multiples facettes, de sorte qu'il est devenu au fil de l'environnement de la recherche en intelligence artificielle de.

Par exemple, le but ultime interstellaire est de battre l'adversaire, mais les joueurs ont encore besoin d'effectuer une série de ressources collectons, construire ce bâtiment cible et trouver un équilibre entre eux. De plus, un jeu le temps passé aussi court que quelques minutes ou jusqu'à une heure, puis les mesures prises tôt dans le jeu ne peut pas voir un gain correspondant dans un temps très long. Enfin, seule une partie de la zone sur la carte est visible, l'agent devra utiliser une capacité de mémoire et de la planification intégrée, afin d'obtenir la victoire.

De plus, il y a d'autres aspects de ce jeu est aussi attrayant pour les chercheurs, comme chaque jour un grand nombre de joueurs de confrontation de jeu en ligne. Cela garantit qu'il y aura des données de relecture massive pour l'agent d'apprendre, et de l'agent et aura également de nombreux adversaires talentueux peuvent apprendre.

Cependant, le sous-jacent à fonctionner même si seules opérations interplanétaires sont un défi de taille, tout le temps qui peut être sélectionné plus de 300 sortes. Ce jeu avec Atari pour former une distinction claire, qu'il est une action en option pas plus de 10 types (tels que vertical et horizontal). Sur cette base, il fonctionne également dans les niveaux interstellaires peuvent être modifiés et améliorés, de nombreuses opérations doivent cliquer sur l'écran. Même si seulement comme un 84x84 petit écran, toutes les actions possibles ajouteront jusqu'à des centaines de millions d'espèces.

Et l'agent humain, en fonction des différentes unités, différentes opérations sélectionnées peut être effectuée

Après la sortie de cet outil, les chercheurs peuvent utiliser des outils propres de Blizzard pour résoudre certains problèmes mentionnés ci-dessus, de sorte que vous pouvez créer vos propres tâches et modèles plus facilement.

DeepMind du paquet d'outils de classification de l'environnement PySC2, qui fournit une interface flexible et facile à utiliser pour l'agent d'apprentissage de renforcement pour les aider à jouer le jeu. Dans la version initiale de ce lancement, PySC2 le jeu est devenu une division des différents éléments de différents « niveau de fonctionnalité », tels que différents types d'unités, la valeur de la vie, et ainsi la visibilité de la carte sera séparée de l'autre, tout en jeu maintenant le noyau d'éléments visuels et spatiaux.

affichage de jeu différents types de contenu dans les différentes couches

Kit d'outils SC2LE comprend en outre une série de jeu de tests, que le jeu entier est divisé en une pluralité de segments de différentes contrôlable, de sorte que la performance de l'agent peut être testé dans une tâche spécifique, cet angle est changé, comme des unités d'exploitation minière ou sélectionnés . Les chercheurs peuvent tester ce petit jeu dans leur technologie, mais peut aussi aider à construire plus des mini-jeux d'essai, les chercheurs continuent à favoriser une plus grande concurrence et l'évaluation.

jeu d'apprentissage de renforcement simple qui permet aux chercheurs de tester les performances de l'agent dans une tâche particulière

Les progrès DeepMind actuellement, leur agent doit jouer une bonne performance dans des tâches spécifiques de ce petit jeu, mais le jeu entier, même une base relativement forte, telle A3C AI aussi n'a pas gagné, « simple » dans le jeu AI. Par exemple, la figure d'action suivante dans la gauche de la formation initiale est un organisme intelligent, il ne peut pas laisser miner l'exploitation minière, sans effort pour l'homme. Après la formation, l'intelligence a présenté une action significative, mais si vous les rendre compétitifs, il faut aussi avoir une percée plus en profondeur dans l'apprentissage de renforcement et des domaines connexes.

chercheurs DeepMind trouvé un moyen pour l'agent d'apprendre la stratégie plus de compétences est d'apprendre à imiter. Ces méthodes d'apprentissage seront bientôt devenir plus facile avec l'aide de Blizzard, ils ont promis de continuer à publier rediffusion de jeu anonyme sur des centaines d'échelle Starcraft 2 de milliers manches. Cela permet non seulement des chercheurs formés par l'agent de la méthode d'apprentissage supervisé, mais aussi pour la prévision de la série, la mémoire à long terme, et ainsi d'autres domaines de la recherche possible.

DeepMind espoir que ces outils nouvellement libérés permet communauté d'intelligence artificielle sur le jeu Starcraft résultats de recherche existants vont encore plus loin pour encourager davantage de personnes à se livrer à une étude approfondie des études intensives, les chercheurs ont également rendu plus facile de suivre le champ avant-garde du développement. DeepMind également nous réjouissons à la communauté de l'intelligence artificielle peut avoir des découvertes merveilleuses.

Adresse Papers: https: //deepmind.com/documents/110/sc2le.pdf

PySC2 adresse github: https: //github.com/deepmind/pysc2

Starcraft 2 adresses API de Blizzard (inclut la version Linux de l'information, des jeux et d'autres rediffusion de contenu): https: //github.com/Blizzard/s2client-proto

via DeepMind Blog de recherche, Lei Feng réseau compilé AI Technology Review

meilleurs films, version d'arts martiaux chinois de re-lier Aliens vs. Feng Xiaogang, cinémas cette semaine pour les voir
Précédent
Avec dix heures principales « histoire de retours » veulent montrer un monde parallèle intéressant
Prochain
Université de Shenzhen, en coopération avec Tencent QQ, premier badge AR Chine a émis
Vallée de la rivière Jinsha est maintenant le « grand halo » durent jusqu'à deux heures
EMUI9.1 le fond du couteau derrière Android, Huawei conflit avec Apple dans la deuxième moitié
Nous avons parlé de l'équipe de production « Spider-Man », et analysé ces projets sont axés
Geek Cuisine: Nouvelle année chinoise - feuilles de moutarde édition vapeur de porc
Cao Bao-Ping série Burning Heart deuxième « tuer son » Start Fan Bingbing Huang Xuan se joindre à l'interprétation de l'amour et de vengeance
Sennheiser lance MOMENTUM vrai casque sans fil
Une nouvelle série inductance parallèle puissance syntonisée amplificateur DE-1
Nous avons vu beaucoup comme le festival de théâtre américain à Macao ou Hong Kong et Kara Hui, ensemble Tse Kwan Ho
Bureau de thé, veuillez la formation des enseignants de langue à l'école primaire vivent par
Etude entrelacée convertisseur parallèle CCM Boost PFC
Ne soyez pas les données « tricher »: les bénéfices des entreprises élaborées de ceux de la « fosse »