OpanAI a annonc� les d�tails du jeu Dota AI, jeu pour le rendre au-del� du moi humain

Allez apr�s la prise de chercheurs en intelligence artificielle semble invariablement jeu e-sport comme les motifs suivants de formation. Zhou Lei Feng en ligne a rapport� Ti7 tournoi international Dota2, OpenAI premier � montrer leurs r�alisations, que AI � Seattle a battu pro en 1v1 jeu, mis � feu une fois la discussion sur l'IA.

Lei Feng r�sultat net de la comp�tition ont �t� aussi beaucoup d'analyse sur le point de vue actuel, en fait, peut-�tre plus simple que le jeu 1v1 Go, gagner en 1v1 jeu, il ne peut pas expliquer le jeu complet en 5v5 peut surmonter l'humanit�, mais aussi de maintenir un certain la dignit�.

Apr�s environ une semaine de temps ,, mais il a encore des r�serves, ne pr�cise pas les d�tails techniques. Enfin, ils ont aussi dit que le but ultime est de l'homme d�faite dans 5v5 jeu.

La figure est un jeu note AI TrueSkill (comme une note d'�checs ELO) change de score, est calcul�e entre le jeu de simulation de jeu AI, gagner et observ�. TrueSkill syst�me est un syst�me de notation bas� sur l'inf�rence bay�sienne, mis au point par Microsoft Research, principalement pour le mode multijoueur matches. Ce syst�me de notation tient compte du niveau d'incertitude des joueurs, compte tenu de gagner des niveaux et fluctuations de pourcentage possible du joueur, plut�t que simplement parce que le score gagnant.

La figure montre la tendance est lin�aire, ce qui signifie que l'IA d'am�liorer le niveau de croissance exponentielle.

OpenAI �galement d�crit sp�cifiquement le calendrier de d�veloppement du projet. D'un point de vue, 15% des joueurs en dessous du MMR 1.5K, 58% des joueurs de moins de 3k, et 99,99% de moins que 7.5k.

MMR est un syst�me de notation de jeu de correspondance, le nom complet du match de faire le classement, la compr�hension est souvent simplement lesdits points d'�chelle Dota.

Mars 1: Les premiers r�sultats ont �t� obtenus dans un environnement d'apprentissage de renforcement classique dans un simple Dota, op�ration Ranger noir AI peut faire face � une vache sacr�e.
8 mai: 1.5K niveau MMR de personnes test�es, ils sont plus rapides que l'IA.
D�but Juin: Appareils de contr�le au niveau du MMR beat 1.5k
30 juin: Dans les testeurs ROR 3k gagnera la majorit� du jeu
8 juillet: niveau MMR bataille 7.5K de testeurs semi-professionnels, a finalement gagn� un.
7 ao�t: d�faite 3-0 Blitz (6.2k anciens joueurs professionnels) Les, victoire de 2-1 sur Pajkatt (8.5k pros), 3-0 victoire sur CC & C (8,9k pros), mais nous croyons tous, le syst�me a battu encore les meilleurs joueurs Sumail.
9 ao�t: 10-0 d�faite Arteezy (10k pro) 10-0, mais il croit que le syst�me ne peut pas g�rer Sumail.
10 ao�t: 6-0 Sumail (8.3k Les joueurs professionnels, meilleurs joueurs 1v1), mais dans la bataille avec les r�sultats d'ao�t 9 �dition du syst�me est 2-1.
11 ao�t: d�faite 2-0 Dendi (joueurs professionnels de 7.3k, ancien champion du monde) 2-0. Cette fois-ci du syst�me de jour de la version d'avant-guerre, pourcentage de gain est de 60%.

jeu AI et Sumail

La version compl�te du jeu est 5v5, 1v1, mais est �galement apparu dans un certain nombre de tournois. a �crit OpenAI, syst�me de combat est selon les r�gles standard du jeu, ne l'a pas simplifi� comme AI dans 1c1 sp�ciale.

environnement du syst�me d'exploitation sont les suivants:

Watch: Jeu Bot interfaces API, avec la m�me perspective caract�ristique de jeu et les joueurs humains, et seront affect�s par le h�ros, soldat, messager et terrain � proximit�. Le jeu entier pour le syst�me AI fait partie de l'observable.
Op�ration: API appelle �galement Bot, la fr�quence de fonctionnement est limit�e � un niveau consid�rable de l'homme, y compris le d�placement � une position, en utilisant une fr�quence d'attaques ou de l'article.
Commentaires: Apr�s avoir gagn� le syst�me de jeu sera r�compens�, d'autres indicateurs de base, tels que le statut de h�ros de la vie et le coup final, affectent �galement les incitations.

Le syst�me peut �galement choisir d'utiliser des dizaines d'accessoires et de l'�quipement, �valueront et s�lectionneront. OpenAI �galement utilis� pour renforcer le bloc de formation technique traditionnelle avant que les soldats commencent � se s�parer, ce qui est fondamentalement le 1v1 de fonctionnement standard.

jeu AI et Arteezy

OpenAI que les m�thodes qu'ils utilisent conjointement avec une petite quantit� de type � Coach � de la formation et de l'auto-bataille, peut grandement am�liorer la journ�e. Pendant ce temps, comme le jeu de TI lundi soir, quand la Pajkatt a �galement remport� les syst�mes, quand il a utilis� un �quipement inhabituel t�t acheter une baguette magique. Plus tard OpenAI Cette op�ration a �t� ajout� � la formation d'entre eux.

Mercredi apr�s-midi OpenAI test� � nouveau le nouveau syst�me. IA du jeu dans la premi�re vague d'attaque et a perdu plus de la moiti� du sang, tout comme les chercheurs pensent que le syst�me devrait r�pondre � la version originale, ils ont remarqu� un d�veloppement surprenant, l'original est dans la premi�re vague d'attaques induisent l'autre partie � adopter plus radicale attaques. Le syst�me comporte en outre l'auto-jeu r�solu progressivement le probl�me, et a appris � r�sister � la strat�gie de leurre.

Apr�s le match avec Arteezy, OpenAI mod�le de blocs mis � jour des soldats, de sorte que le point TrueSkill du syst�me augmente un peu. Ensuite, avant le match avec Sumail a men� la formation continue, les points de TrueSkill ont augment� de deux points. Apr�s Sumail que dire, AI et m�me appris � pistolet ombre de presse sur la ligne de mire d'un ennemi, afin que vous puissiez r�pondre � interrompre l'ennemi hors de la vue.

Arteezy a �galement jou� un match avec la cote de 7.5k testeurs semi-professionnels de OpenAI. Arteezy a gagn� le jeu, mais les testeurs utilis� un truc appris du syst�me AI qui, en effet, surprenant. Arteezy a dit plus tard, ce sont les autres tours qu'il utilisait avant avec le jeu Paparazi, peu de gens utiliseront.

Cette situation est �galement apparue dans Go, apr�s la victoire sur AlphaGo Shishi, alors il est jeu avec Ke Jie, les joueurs humains sont de plus en plus commenc� � apprendre la mise en page de mettre pied � terre.

Sumail a d�clar� dans l'apr�s-guerre, les syst�mes d'IA sont � invincibles �, mais je me demande s'il sera toujours m�lang� avec les mesures dans les conditions rencontr�es avaient d�j� une situation tr�s diff�rente. Le jeu de TI en ce moment-l�, OpenAI �galement mis en place un jeu LAN beaucoup de gens se joindre � eux, de diverses mani�res et jouer contre le syst�me AI, a recueilli un total de plus de 1000 donn�es de jeu. Finalement trouv� beaucoup de d�fauts dans le syst�me, vous pouvez surmonter, il existe trois types:

Conduit ses troupes: Quand le soldat d'attaquer et attaquer, ils peuvent continuer � tirer le feu et laissez-vous suivre pour ex�cuter, cela peut conduire � une de la tour de d�fense AI est consomm� soldat est mort.
Poison perle + Wind Spirit de grain: acheter ces �quipements peut fournir des avantages significatifs � la vitesse de d�placement de la phase 1 fois, de sorte que vous pouvez obtenir rapidement un sang AI de. Avec un bon d�part pour vaincre l'ordinateur est facile.
Niveau 1 pression Ombre: avec celui-ci a battu l'ordinateur a besoin de beaucoup de comp�tences, mais selon OpenAI � dire, il y a plusieurs joueurs de niveau 6-7k pour appuyer sur une peu de temps par rapport au pistolet d'ombre 3-5 record, juste � temps pour le niveau 1 tuer le syst�me AI.

Ce sont de petits bug dans 1v1 jeu, il est facile de corriger l'erreur. Mais pour 5v5 jeu, ce type de probl�me est tout simplement pas une �chappatoire, c'est un moment de besoin peut faire face � des situations inattendues et �trange syst�me.

Enfin, OpenAI signifie qu'ils ne sont pas pr�ts � annoncer la structure sp�cifique de l'agence de d�veloppement AI, l'accent de l'�quipe est d'abord r�soudre le jeu 5v5. Si le jeu 1v1 est tr�s complexe, il est un ensemble complexe de 5v5 concurrence, et pour r�soudre ce probl�me permettra de promouvoir davantage les progr�s de la grippe aviaire.

OpenAI estiment qu'une meilleure fa�on de proc�der est de clonage de conduite. Il y a environ un million de jeux Dota Ouvert tous les jours, ces donn�es de relecture du jeu seront stock�s sur les serveurs de Valve pendant deux semaines. Lei Feng r�seau a appris que depuis Novembre dernier, OpenAI donn�es de lecture a �t� t�l�charg� chaque joueur au niveau des experts, les donn�es ont �t� recueillies 5,8 millions de tours de jeu (chaque tour sont 10 personnes impliqu�es dans le jeu pendant 45 minutes).

OpenAI de spectacles syst�me Dota 2 que s'il y a suffisamment de calcul, la performance auto-jeu du syst�me d'apprentissage de la machine peut �tre augment�e de bien au-dessous du niveau de l'humanit� � transcender l'humanit�. Dans un mois, ils ne peuvent pas comparer les joueurs de haut niveau du syst�me, mis au point pour battre les pros de haut, et continue d'am�liorer. Syst�me d'apprentissage supervis� en profondeur ne peut �tre aussi bon que l'ensemble des donn�es de formation, mais dans les syst�mes d'auto-jeu, comme l'agence de mieux, les donn�es disponibles permettra d'am�liorer automatiquement.

Route de la soie

Apprenez � conna�tre la Chine

OpanAI a annonc� les d�tails du jeu Dota AI, jeu pour le rendre au-del� du moi humain