Thunder CMU, le nouvel algorithme DeepStack premier à conquérir le Texas Hold'em Test de Turing

Dans les milieux universitaires étrangers, il y a un feu de papier. Les recherches menées montre de thèse que, pour la première fois dans l'histoire humaine, Amnesty International a remporté les joueurs professionnels de l'homme sur le Texas Hold'em. La percée de cet article est: AI dans un jeu d'informations non complète chance de gagner les adversaires de l'occupation humaine .

Le nom de cet article est "DeepStack: No Limit poker intelligence artificielle au niveau des experts" (DeepStack: Expert niveau d'intelligence artificielle dans le Poker No-Limit), No. 6 Janvier soumis au ArXiv.

Les auteurs Université de l'Alberta, le Canada, l'Université Charles tchèque, Université technique tchèque de Prague chercheurs de. Le sujet de thèse dans le DeepStack, est un nouveau nom de l'algorithme, thèse pour expliquer " DeepStack est un algorithme général, une catégorie de jeu peut être une séquence d'information non complète «Dans l'étude portant sur des dizaines de participants et 44000 à la main au poker, DeepStack devenir le premier au monde dans le » joueur de poker professionnel a battu un programme informatique d'un Limit Hold « em « sur.

Qu'est-ce qu'un "one-Limit Hold'em" (HUNL)

Texas Hold'em est le nom anglais "Texas Hold'em" et "un Limit Hold'em" (no-limit Heads-up, appelée HUNL) qui signifie, est d'avoir deux joueurs et pas de puces de paris. Ce document est l'ordinateur où les joueurs naturels et professionnels, un par un jeu.

Bien que le poker, mais avec les propriétaires encore très différents, il est le « casino » articles très populaires. Ici recours à la vidéo pour aider les gens à comprendre ce que les règles et jouer au Texas Hold'em.

De la vidéo ci-dessus, on comprend généralement le jeu du Texas Hold'em sera deux types d'informations: Affecté deux joueurs chaque main de cartes « informations privées » et les cartes communes sur la table, « information » . Les joueurs choisissent cinq cartes communes dans les trois, une combinaison de deux cartes fermées et les mains, le dernier afin d'obtenir la meilleure combinaison de cinq cartes. Selon « carte Classement » pour déterminer le vainqueur final.

Jouer au Texas Hold'em célébrité en Chine, Wang Feng est un professeur, un autre est Kai-fu Lee professeur. Sachez presque sous le « Quelles sont les compétences, l'expérience ou les principes de poker ont? » Question, numéro un, qui est, la réponse de l'enseignant Kai-fu Lee, il a évoqué en particulier Le jeu clé bonne bluff (Bluffer, les techniques classiques de maître) est d'apprendre les statistiques .

Le Texas Hold'em est une nouvelle génération de test de Turing?

Texas Hold'em est devenu un test très populaire de la recherche sur l'intelligence artificielle, chaque joueur tenant une main de poker de cartes « informations privées », les autres joueurs ne peuvent pas voir, il est connu comme « l'information non complet » (informations Imperfect) jeu. Ceci est très différent avec Go, Go est un jeu de divulgation de l'information complète, les joueurs peuvent voir chaque drapeau sur la carte, selon toute probabilité considération Lazi. Alors Texas Hold'em pour l'intelligence artificielle, plus difficile.

Il a dit la communication de l'interview « DeepStack » papier de Michael Bowling avait reçu « New Scientist » au début 2015: « Texas Hold'em le plus intéressants que Lieux vous ne pouvez pas obtenir des informations complètes. »

Professeur (CMU) Tuomas Sandholm Carnegie Mellon University, a également déclaré: " Poker est devenu une information non complète, la mesure (ordinateur) de niveau standard de l'intelligence de ...... et il peut être considéré comme une présence au-delà du test de Turing. "

Fait intéressant, ces deux professeurs dirigent leurs équipes pour surmonter ce nouveau test de Turing, l'Université de l'Alberta au Canada, un à l'Université CMU.

Il y a quelques jours, la CMU a émis un avis: système d'intelligence artificielle de libratus développé par le leadership Professeur Tuomas Sandholm, heure locale, le 11 Janvier, Rivers Casino à Pittsburgh, en Pennsylvanie, avec quatre pros jouant 120000 mains HUNL, et rivalisez pour 200000 $ en prix. Dès 2015, le prédécesseur de libratus Claudico et jouer contre des joueurs humains pour la première fois, 80000 défaite totale entre les mains du duel, cette fois-ci être un come-back de la CMU.

Mais nous savons déjà le résultat, l'Alberta dans le temps avant la CMU, la question est venue sur le papier. les milieux universitaires ont exprimé des éloges, disant repère DeepStack (bien sûr, ce document n'a pas été examinée par des pairs par étape) mais avec CMU libratus plusieurs jours avant l'échauffement par rapport à la pompe, DeepStack ne pas obtenir la même quantité de traitement des médias, également conduit à une certaine insatisfaction.

CMU prend la route AlphaGo année, faire un spectacle au casino magnifique, les meilleurs joueurs humains de jouer contre, et 20 millions de dollars gimmick. Ainsi, bien que ces documents Deepstack plus tôt que la CMU a fait une percée, mais ce dernier est meilleur défilé des grands médias les ignora, mais aussi raisonnable.

En un mot, Alberta a volé avant, CMU volé vif (Compétition académique est féroce).

Les résultats de ces copies papier Deepstack

au total DeepStack de 4,4 millions de contrats dans le concours avec 33 joueurs humains, jeu en ligne organisé séparément entre le 7 Novembre 2016 et 12 Décembre. Le vainqueur final des trois meilleurs joueurs, respectivement, 5000,2500 et 1250 récompense de dollars canadiens. Ce qui suit est le résultat du jeu. Les résultats montrent que le taux deepstack victoire moyenne de 492 MBB / g (les joueurs de l'homme en général à 50 MBB / g est considéré comme ayant un plus grand avantage, 750mbb / g est l'adversaire pour gagner chaque défausse carte de taux de jeu).

Nous avons mentionné plus tôt, une information de poker peut être divisé en « privé » et « public », au milieu de la table et cinq cartes ouvertes pour former une dynamique « d'état ouvert. » séquences possibles divulgués état de la configuration du jeu dans un arbre Publication (arbre public), où chaque sous-arbre est divulgué une divulgation a un état associé (subtree public).

partie supérieure figure HUNL est décrit dans l'arbre. lignes rouges et bleues représentent le mouvement des joueurs, les lignes vertes représentent les cartes communes ouvertes. noeud rond représente la fin du jeu.

Cette figure DeepStack architecture d'ensemble est divisé en (a) (b) (c) trois parties. En (a) de, dans chaque état Deepstack décrit où il doit être opération recalculé, dans lequel la valeur du sous-arbre (valeur Subtree) sera bonne profondeur réseau de neurones du réseau neuronal (b) est calculée par une formation, et la formation échantillon par réseau de neurones est (c).

En général, une combinaison de raisonnement récursif Deepstack (de raisonnement récursif) pour traiter l'asymétrie d'information, comprend également la décomposition (décomposition) aux décisions connexes informatique centralisée, et est formée sur une intuition de toute carte (Intuition), qui sorte d'intuition peut être utilisé pour l'auto-apprentissage de la profondeur à jouer aux cartes et l'apprentissage automatique.

Pour libratus guerre de casino DeepStack et 11 Janvier de la CMU, Lei Feng réseau va suivre la couverture en profondeur.

PS: Lei Feng numéro de préoccupation publique nette (Lei Feng réseau)

Malgré le goût du brouhaha seul
Précédent
Libérés cinq jours seulement 23.270.000, box office appel Yang Mi à la fin d'accord?
Prochain
3 unités peuvent être aussi agréable que huit unités, Commentaires Sony-REI Z1R | Titane-off
ASUS Chang 370 Xiaolong ceci: Je ne suis même pas débranché l'évaluation de l'expérience WiFi
Les meilleures notes dans l'histoire de l'âge d'exposition qui oratorios vous avez vu un
Jouer commande de mode: peut piloter jusqu'à MS, Jean nombre de conduire Shenmu flamme haute de combustion
Avec lui, mais aussi ce support de téléphone? | Travail acharné
Stephen Chow nouveau film « D plan » terrain d'exposition, les utilisateurs: en plus de Yeh, il est le seul le plus approprié!
Chine hommes les plus beaux à l'aide
Module de jeu de commande: bouclier variable de tireur d'élite Jim oiseaux
Phone App répulsif efficace? | Il esquive 159
chef d'oeuvre du barrage « Raging armée: Réinstaller » avec vos rêves années nonante
Vente de 3,4 millions, et un succès blockbuster hollywoodien, Chow Yun Fat adversaire réel à venir!
coup double carte nationale Publié: double porteuse de service à succès pour atteindre une forte croissance, le nombre d'incubateurs en 2017, soit une augmentation de 25%