OpanAI a annoncé les détails du jeu Dota AI, jeu pour le rendre au-delà du moi humain

Allez après la prise de chercheurs en intelligence artificielle semble invariablement jeu e-sport comme les motifs suivants de formation. Zhou Lei Feng en ligne a rapporté Ti7 tournoi international Dota2, OpenAI premier à montrer leurs réalisations, que AI à Seattle a battu pro en 1v1 jeu, mis à feu une fois la discussion sur l'IA.

Lei Feng résultat net de la compétition ont été aussi beaucoup d'analyse sur le point de vue actuel, en fait, peut-être plus simple que le jeu 1v1 Go, gagner en 1v1 jeu, il ne peut pas expliquer le jeu complet en 5v5 peut surmonter l'humanité, mais aussi de maintenir un certain la dignité.

Après environ une semaine de temps ,, mais il a encore des réserves, ne précise pas les détails techniques. Enfin, ils ont aussi dit que le but ultime est de l'homme défaite dans 5v5 jeu.

La figure est un jeu note AI TrueSkill (comme une note d'échecs ELO) change de score, est calculée entre le jeu de simulation de jeu AI, gagner et observé. TrueSkill système est un système de notation basé sur l'inférence bayésienne, mis au point par Microsoft Research, principalement pour le mode multijoueur matches. Ce système de notation tient compte du niveau d'incertitude des joueurs, compte tenu de gagner des niveaux et fluctuations de pourcentage possible du joueur, plutôt que simplement parce que le score gagnant.

La figure montre la tendance est linéaire, ce qui signifie que l'IA d'améliorer le niveau de croissance exponentielle.

OpenAI également décrit spécifiquement le calendrier de développement du projet. D'un point de vue, 15% des joueurs en dessous du MMR 1.5K, 58% des joueurs de moins de 3k, et 99,99% de moins que 7.5k.

MMR est un système de notation de jeu de correspondance, le nom complet du match de faire le classement, la compréhension est souvent simplement lesdits points d'échelle Dota.

  • Mars 1: Les premiers résultats ont été obtenus dans un environnement d'apprentissage de renforcement classique dans un simple Dota, opération Ranger noir AI peut faire face à une vache sacrée.

  • 8 mai: 1.5K niveau MMR de personnes testées, ils sont plus rapides que l'IA.

  • Début Juin: Appareils de contrôle au niveau du MMR beat 1.5k

  • 30 juin: Dans les testeurs ROR 3k gagnera la majorité du jeu

  • 8 juillet: niveau MMR bataille 7.5K de testeurs semi-professionnels, a finalement gagné un.

  • 7 août: défaite 3-0 Blitz (6.2k anciens joueurs professionnels) Les, victoire de 2-1 sur Pajkatt (8.5k pros), 3-0 victoire sur CC & C (8,9k pros), mais nous croyons tous, le système a battu encore les meilleurs joueurs Sumail.

  • 9 août: 10-0 défaite Arteezy (10k pro) 10-0, mais il croit que le système ne peut pas gérer Sumail.

  • 10 août: 6-0 Sumail (8.3k Les joueurs professionnels, meilleurs joueurs 1v1), mais dans la bataille avec les résultats d'août 9 édition du système est 2-1.

  • 11 août: défaite 2-0 Dendi (joueurs professionnels de 7.3k, ancien champion du monde) 2-0. Cette fois-ci du système de jour de la version d'avant-guerre, pourcentage de gain est de 60%.

jeu AI et Sumail

La version complète du jeu est 5v5, 1v1, mais est également apparu dans un certain nombre de tournois. a écrit OpenAI, système de combat est selon les règles standard du jeu, ne l'a pas simplifié comme AI dans 1c1 spéciale.

environnement du système d'exploitation sont les suivants:

  • Watch: Jeu Bot interfaces API, avec la même perspective caractéristique de jeu et les joueurs humains, et seront affectés par le héros, soldat, messager et terrain à proximité. Le jeu entier pour le système AI fait partie de l'observable.

  • Opération: API appelle également Bot, la fréquence de fonctionnement est limitée à un niveau considérable de l'homme, y compris le déplacement à une position, en utilisant une fréquence d'attaques ou de l'article.

  • Commentaires: Après avoir gagné le système de jeu sera récompensé, d'autres indicateurs de base, tels que le statut de héros de la vie et le coup final, affectent également les incitations.

Le système peut également choisir d'utiliser des dizaines d'accessoires et de l'équipement, évalueront et sélectionneront. OpenAI également utilisé pour renforcer le bloc de formation technique traditionnelle avant que les soldats commencent à se séparer, ce qui est fondamentalement le 1v1 de fonctionnement standard.

jeu AI et Arteezy

OpenAI que les méthodes qu'ils utilisent conjointement avec une petite quantité de type « Coach » de la formation et de l'auto-bataille, peut grandement améliorer la journée. Pendant ce temps, comme le jeu de TI lundi soir, quand la Pajkatt a également remporté les systèmes, quand il a utilisé un équipement inhabituel tôt acheter une baguette magique. Plus tard OpenAI Cette opération a été ajouté à la formation d'entre eux.

Mercredi après-midi OpenAI testé à nouveau le nouveau système. IA du jeu dans la première vague d'attaque et a perdu plus de la moitié du sang, tout comme les chercheurs pensent que le système devrait répondre à la version originale, ils ont remarqué un développement surprenant, l'original est dans la première vague d'attaques induisent l'autre partie à adopter plus radicale attaques. Le système comporte en outre l'auto-jeu résolu progressivement le problème, et a appris à résister à la stratégie de leurre.

Après le match avec Arteezy, OpenAI modèle de blocs mis à jour des soldats, de sorte que le point TrueSkill du système augmente un peu. Ensuite, avant le match avec Sumail a mené la formation continue, les points de TrueSkill ont augmenté de deux points. Après Sumail que dire, AI et même appris à pistolet ombre de presse sur la ligne de mire d'un ennemi, afin que vous puissiez répondre à interrompre l'ennemi hors de la vue.

Arteezy a également joué un match avec la cote de 7.5k testeurs semi-professionnels de OpenAI. Arteezy a gagné le jeu, mais les testeurs utilisé un truc appris du système AI qui, en effet, surprenant. Arteezy a dit plus tard, ce sont les autres tours qu'il utilisait avant avec le jeu Paparazi, peu de gens utiliseront.

Cette situation est également apparue dans Go, après la victoire sur AlphaGo Shishi, alors il est jeu avec Ke Jie, les joueurs humains sont de plus en plus commencé à apprendre la mise en page de mettre pied à terre.

Sumail a déclaré dans l'après-guerre, les systèmes d'IA sont « invincibles », mais je me demande s'il sera toujours mélangé avec les mesures dans les conditions rencontrées avaient déjà une situation très différente. Le jeu de TI en ce moment-là, OpenAI également mis en place un jeu LAN beaucoup de gens se joindre à eux, de diverses manières et jouer contre le système AI, a recueilli un total de plus de 1000 données de jeu. Finalement trouvé beaucoup de défauts dans le système, vous pouvez surmonter, il existe trois types:

  • Conduit ses troupes: Quand le soldat d'attaquer et attaquer, ils peuvent continuer à tirer le feu et laissez-vous suivre pour exécuter, cela peut conduire à une de la tour de défense AI est consommé soldat est mort.

  • Poison perle + Wind Spirit de grain: acheter ces équipements peut fournir des avantages significatifs à la vitesse de déplacement de la phase 1 fois, de sorte que vous pouvez obtenir rapidement un sang AI de. Avec un bon départ pour vaincre l'ordinateur est facile.

  • Niveau 1 pression Ombre: avec celui-ci a battu l'ordinateur a besoin de beaucoup de compétences, mais selon OpenAI à dire, il y a plusieurs joueurs de niveau 6-7k pour appuyer sur une peu de temps par rapport au pistolet d'ombre 3-5 record, juste à temps pour le niveau 1 tuer le système AI.

Ce sont de petits bug dans 1v1 jeu, il est facile de corriger l'erreur. Mais pour 5v5 jeu, ce type de problème est tout simplement pas une échappatoire, c'est un moment de besoin peut faire face à des situations inattendues et étrange système.

Enfin, OpenAI signifie qu'ils ne sont pas prêts à annoncer la structure spécifique de l'agence de développement AI, l'accent de l'équipe est d'abord résoudre le jeu 5v5. Si le jeu 1v1 est très complexe, il est un ensemble complexe de 5v5 concurrence, et pour résoudre ce problème permettra de promouvoir davantage les progrès de la grippe aviaire.

OpenAI estiment qu'une meilleure façon de procéder est de clonage de conduite. Il y a environ un million de jeux Dota Ouvert tous les jours, ces données de relecture du jeu seront stockés sur les serveurs de Valve pendant deux semaines. Lei Feng réseau a appris que depuis Novembre dernier, OpenAI données de lecture a été téléchargé chaque joueur au niveau des experts, les données ont été recueillies 5,8 millions de tours de jeu (chaque tour sont 10 personnes impliquées dans le jeu pendant 45 minutes).

OpenAI de spectacles système Dota 2 que s'il y a suffisamment de calcul, la performance auto-jeu du système d'apprentissage de la machine peut être augmentée de bien au-dessous du niveau de l'humanité à transcender l'humanité. Dans un mois, ils ne peuvent pas comparer les joueurs de haut niveau du système, mis au point pour battre les pros de haut, et continue d'améliorer. Système d'apprentissage supervisé en profondeur ne peut être aussi bon que l'ensemble des données de formation, mais dans les systèmes d'auto-jeu, comme l'agence de mieux, les données disponibles permettra d'améliorer automatiquement.

Quatre IKEA joint-venture commerciale appropriée dans la voiture un arrière-plan
Précédent
Zotye SR9 est une version civile de la légende Porsche vraiment faire?
Prochain
Chine Intelligent Manufacturing Rapport annuel sur le développement du marché de la fabrication intelligente en 2020 dépassera 220 milliards
Sandra Ng Chan Chengdu « détestent » rire plus « choc » comédie « démon Boll » au nord et au sud
photo ligne: Las Vegas ne dort jamais sous le OPPO R17 Pro lentille
« Bowen préféré » utiliser XDMA obtenir AXI-Lite cartographié PCIE pour configurer le VDMA
China Mobile a finalement fournir un service cellulaire d'Apple Watch, qui soutient sept villes, aussi libre
Apprendre à comprendre comment la direction de gradient d'image histogramme (histogramme de gradient)
Choqué! « Elle explique: » le feu vert à la deuxième semaine au champion du box-office?
La ville connue sous le nom « Silver City », mais maintenant elle est devenue une « ville intelligente »
algorithme de reconnaissance de comportement humain basé sur la profondeur de l'apprentissage
Yann LeCun nouveau travail: 473 types de grand modèle de contraste, au Japon et en Corée du Sud, qui codant pour utiliser la classification de texte à la fin?
Regardez Yuelu sommet « Hunan Mobile » Comment aider le développement du Hunan
étude approfondie tensorflow basée sur la reconnaissance de chiffres manuscrits et applications