StarCraft 201:10 perdu AI humaine! DeepMind � AlphaStar � �volution rapide

Juste, encore une fois, nous avons assist� � des progr�s significatifs dans l'IA et PK humaine! DeepMind P�kin le 25 Janvier de 02h00 a annonc� son record de la grippe aviaire dans � StarCraft 2 � et la course deux avantages: AlphaStar 5: 0 victoire sur pro TLO, 5: 0 victoire sur WSC 2018 runner-up Austin mANA. Et deux course aux adversaires humains s�par�s par environ deux semaines, AI autodidacte, est pass� de la guerre TLO niveau recrue, le processus d'�volution � un fonctionnement parfait, surtout avec le manas de la guerre, a commenc� � se manifester peut aller au-del� des limites de l'homme capacit�.

La d�monstration aussi DeepMind StarCraft 2 AI AlphaStar premi�re apparition publique. En plus de l'�mission de jeu vid�o pr�c�dente, AlphaStar est �galement venu sur la sc�ne et MANA manche, mais a perdu les joueurs humains Alphastar Inning MANA.

Carte | MaNa se concentrent sur le jeu (Figure Source: Youtube)

DeepMind introduit dans la d�mo, le jeu entre les deux parties fixe carte Catalyst LE, en utilisant la 4.6.2 version du jeu, mais seulement la guerre civile Protoss, les deux parties proc�deront cinq jeux. Tout d'abord, l'invitation est clan liquide Zerg joueur TLO, num�ro mondial actuel 68.

Carte | TLO (Figure Source: Youtube)

Premier match, TLO 10 appara�t en heures, 4 heures Alphastar apparaissent dans une direction diagonale. L'ouverture de TLO est tr�s traditionnelle, avec une fermeture caserne deux d�but route, mais AlphaStar et aucune fermeture de route, la question avait �t� les agriculteurs TLO � l'enqu�te, il r�solut de tirer sur les ap�tres, avec une strat�gie commune pour tuer le harc�lement paysan.

Bien que Alphastar aucune fermeture de route, directement dans les ap�tres TLO, mais doubles casernes Alphastar cr�ent �galement la d�fense Ap�tre, menant au premier harc�lement TLO seulement tu� deux agriculteurs, et le reste des ap�tres a �chou� .

Ensuite, les deux parties commencent � remplir la chasse, TLO a commenc� � harceler le proph�te. Les deux parties ont eu un certain nombre de la guerre � petite �chelle, plusieurs vagues d'�change est presque une cravate, plus d'agriculteurs perte AlphaStar, TLO a perdu plus que les ap�tres. Dans la guerre, nous voyons le AlphaStar �taient humains comme microgestion, tout en se retirant, tout en jouant le TLO anti-chasse, tandis que les troupes de prisme de transmission.

Carte | vision AlphaStar, on peut voir ce qui se passe en dehors du brouillard carte enti�re de la guerre, puis prendre des d�cisions, r�aliser la planification globale des ressources (Figure Source: Youtube)

Mais cette fois-ci TLO deux mienne vient de terminer, AlphaStar qu'une seule mine, se traduira par une plus grande force �conomique, et donc plus AlphaStar cass� la chasse, la s�lection directe offensive des mines, la chasse de TLO en inf�riorit� num�rique en apr�s avoir �t� an�anties la pi�ce principale force GG.

Le premier jeu � gagner est le r�sultat de DeepMind, nous avons vu des pratiques inhabituelles Alphastar, comme le harc�lement des agriculteurs ne choisissent pas, mais directement avec les forces de d�fense, puis captur� apr�s la d�couverte deuxi�me mine TLO, devant le champ de bataille dans plusieurs chasse a poursuivi la r�pression.

Apr�s en raison des contraintes de temps, la pr�sentation ne joue pas tous les jeux, mais montrant un autre jeu vid�o, il donne l'OTL a perdu tout record de cinq jeux. Cependant, toutes les vid�os seront diffus�es sur le site officiel DeepMind pour les personnes � t�l�charger.

TLO Dans la d�monstration, a dit qu'il pensait qu'il pouvait encore gagner, si nous pouvons avoir plus de temps de formation, plus de compr�hension de AlphaStar, est s�r de trouver les faiblesses Alphastar, puis gagner.

Suivie par les d�buts de l'�quipe est liquide MaNa, comme class� 19 joueur Protoss, il est plus puissant que TLO. Si AlphaStar peut le battre, ce qui expliquerait AlphaStar a vraiment la force des joueurs de haut humain.

Carte | AlphaStar et joueurs humains APM ne diff�re pas beaucoup (Figure Source: Youtube)

MaNa la premi�re manche, les deux c�t�s sont des start � normales �, les fermetures de routes, MANA Alphastar aucune fermeture de route. Mais AlphaStar a adopt� une variante strat�gique, choisir de fixer leur cristal pr�s de la base MaNa, captur� deux casernes, pr�t � profiter de la caserne de l'attaque. MaNa cette fois aussi, conform�ment � la pens�e humaine, l'utilisation des ap�tres harc�lent les agriculteurs.

Lorsque la caserne Alphastar est presque termin�e, et est MaNa a constat� qu'il a pris des mesures d�fensives d�cisives en pente haute construit deux stations de charge, les fermetures de routes et pr�ts � profiter de la forte pente de l'avantage � venir chasser d'une arm�e d�fensive. MaNa conform�ment � l'id�e de � joueurs humains normaux ne va pas � se lancer sur la pente �lev�e. �

Mais AlphaStar n'est pas humain, il choisit une attaque directe sur les hauteurs apr�s avoir h�sit� deux fois, parce que le nombre de MaNa de roulement traqu�, casernes sauvages encore en permanence sortie chassaient, la station de charge est presque aucun effet, apr�s plusieurs tours �clatent, manas de Stalker appauvri, finalement retir� tous les agriculteurs ont �chou� � sortir une victoire, a �chou�.

Dans les deux disque suivant r�enregistrement, nous avons vu microgestion fort et la r�flexion tactique AlphaStar, il va essayer d'apprendre et de fermetures de routes tactiques de l'humanit�, les agriculteurs produisent Att�nuer suppl�mentaires l'impact caus� par le harc�lement. Dans un jeu, on voit l'utilisation de tactiques de chasse pures Alphastar, en se fondant sur micro puissant MaNa contre la combinaison chasse, l'immortalit� et la fourche de l'arm�e mixte.

Carte | guerre en temps r�el (Figure Source: Youtube)

AlphaStar La chasse est divis�e en plus de 30 groupes 2-3, MaNa double �quipe attaquer les forces de trois directions, puis s'�chapper par le clignotement neuf attaque immortelle, cette exploitation non humaine chambre MaNa compl�tement d�truite de manuvre - que ce soit il a construit le nombre d'immortalit�, il n'y a aucun moyen de r�sister � l'arm�e traqu�. � Cette situation ne se produira pas au m�me niveau dans le jeu humain, � MaNa contrecur dit dans un discours.

Les r�sultats finaux aussi MaNa 0-5 d�faite des r�sultats 10 jeu sont tous les �tres humains et l'�chec AlphaStar.

Cependant, dans la pr�sentation en direct, DeepMind semblait l'expansion, la s�lection et MANA a r�alis� une exposition en temps r�el, qui a dit aussi qu'ils doivent nommer le clan liquide, clan et d�fendre l'honneur de l'humanit�.

Les deux parties commencent routine, et pas � grande �chelle au d�but de la lutte. Mais MaNa viennent apparemment pr�par�, ne pas utiliser le harc�lement des ap�tres et des proph�tes, mais de se concentrer sur les enqu�tes et la technologie en hausse. Apr�s avoir d�couvert AlphaStar encore produit une vaste multi-chasse, MaNa utilise une tactique de harc�lement immortelles de transport de prisme, et remplir l'immortel, fourchettes et consuls et autre force hybride. Cela peut �tre d�crit comme un coup de g�nie tout le jeu.

Figure | Proph�te autour de trois prismes montre (fig. Source: Youtube)

Lorsque parachutages harc�lement immortel des agriculteurs, AlphaStar n'a pas choisi de remplir le Phoenix a frapp� prisme, mais pas attaquer les unit�s a�riennes suivi du prisme du proph�te, compl�t� par des dizaines de retour de chasse-et-vient vers et depuis la ligne de front et � la maison. Il semble qu'elle croit chasser pour une attaque a�rienne, et donc ne pas besoin de remplir le Phoenix, mais il semble que tous sont traqu�s dans un groupe, aucun des lots ont �t� ex�cut�s t�ches offensives et d�fensives.

Nous voyons donc un joueur humain typique contre la m�thode AI: forcer ce dernier dans une boucle de cercle vicieux pour effectuer certaines t�ches, ce qui en fait un �norme gaspillage de temps et de ressources, ne peut pas porter un jugement valable de la situation.

De cette fa�on, la consommation MaNa � leurs troupes de moulage, puis une vague de r�pression directement � l'effondrement de Alphastar troupes pure chasse. Ce dernier a �galement essay� d'utiliser des tactiques de blocage double �quipe MaNa, mais cette fois les troupes de MANA suffisantes, pour chasser la retenue immortelle est tr�s claire, il n'y a aucune trace laiss�e aux op�rations de hasard AlphaStar, pour effacer l'adversaire, a gagn� la victoire pr�cieuse.

Carte | Jeux d'exposition MANA pour obtenir la victoire, exposant les fans de sourire (Figure Source: Youtube)

Bien que TLO et vid�o MaNa pris fin avec la d�faite compl�te, a proclam� la force de DeepMind AlphaStar a �t� tout � fait diff�rent, mais cette exposition AlphaStar enti�rement expos� les lacunes actuelles.

Nous pouvons voir que, malgr� ses r�seaux de neurones ont tendance � optimiser le long terme, mais semble toujours tomber dans optimum local dans une certaine mesure, a �t� d�couvert mod�le fixe, tomber dans le pi�ge, et de 5 � tenir ensemble un peu Jingle, pour chasser pur les troupes, ont montr� qu'il est pas encore en place pour comprendre le jeu des armes, si le dernier match, car il peut �tre directement envoy� prisme d�fensif Phoenix comme les humains, peut-�tre il continuera avec des super micro-ondes ras�es mANA.

Concours pendant la lecture, l'h�te a demand� aux scientifiques DeepMind, g�n�ralement comment former AlphaStar, DeepMind scientifiques Oriol Vinyals, David Silver dit que l'imitation est la premi�re �tude, l'�quipe a gagn� beaucoup de jeux qui jouent les donn�es de retour d'un certain nombre de joueurs l�-bas et essayer d'obtenir en observant une AI l'environnement dans lequel les gens, autant que possible d'imiter une action particuli�re, afin de comprendre les bases de StarCraft. Parmi les documents de formation utilis�s pour inclure non seulement les athl�tes professionnels, mais aussi des joueurs amateurs. Ceci est la premi�re �tape AlphaStar moulage.

�Carte | DeepMind scientifiques Oriol Vinyals (Figure Source: Youtube)

�Carte | DeepMind scientifique David Silver (Figure Source: Youtube)

Apr�s cela, l'�quipe utilisera une m�thode appel�e � Alpha League � de. Dans cette m�thode, Alpha League premier concurrent est form� des donn�es humaines du r�seau de neurones, et puis encore et encore it�rations, et g�n�rer de nouvelles branche d'agent de cro�tre � Alpha League �.

Figure | Alpha League sch�ma (figure Source:. Youtube)

Ensuite, le processus d'apprentissage par renforcement de l'agent dans le jeu avec d'autres concurrents, � Alpha League � afin de vaincre toutes ces diff�rentes strat�gies aussi efficacement que possible. En outre, il peut aussi encourager la concurrence en ajustant vers leurs objectifs d'apprentissage personnels Evolution mani�re particuli�re, par exemple, est con�u pour obtenir une r�compense sp�cifique.

Enfin, l'�quipe Agent � Alpha League � s�lectionn� pour �tre utilis� moins probable, que l'on appelle � la nash de la Ligue �, qui est la bataille 5 TLO.

Route de la soie

Apprenez � conna�tre la Chine

StarCraft 201:10 perdu AI humaine! DeepMind � AlphaStar � �volution rapide