Thunder CMU, le nouvel algorithme DeepStack premier � conqu�rir le Texas Hold'em Test de Turing

Dans les milieux universitaires �trangers, il y a un feu de papier. Les recherches men�es montre de th�se que, pour la premi�re fois dans l'histoire humaine, Amnesty International a remport� les joueurs professionnels de l'homme sur le Texas Hold'em. La perc�e de cet article est: AI dans un jeu d'informations non compl�te chance de gagner les adversaires de l'occupation humaine .

Le nom de cet article est "DeepStack: No Limit poker intelligence artificielle au niveau des experts" (DeepStack: Expert niveau d'intelligence artificielle dans le Poker No-Limit), No. 6 Janvier soumis au ArXiv.

Les auteurs Universit� de l'Alberta, le Canada, l'Universit� Charles tch�que, Universit� technique tch�que de Prague chercheurs de. Le sujet de th�se dans le DeepStack, est un nouveau nom de l'algorithme, th�se pour expliquer " DeepStack est un algorithme g�n�ral, une cat�gorie de jeu peut �tre une s�quence d'information non compl�te �Dans l'�tude portant sur des dizaines de participants et 44000 � la main au poker, DeepStack devenir le premier au monde dans le � joueur de poker professionnel a battu un programme informatique d'un Limit Hold � em � sur.

Qu'est-ce qu'un "one-Limit Hold'em" (HUNL)

Texas Hold'em est le nom anglais "Texas Hold'em" et "un Limit Hold'em" (no-limit Heads-up, appel�e HUNL) qui signifie, est d'avoir deux joueurs et pas de puces de paris. Ce document est l'ordinateur o� les joueurs naturels et professionnels, un par un jeu.

Bien que le poker, mais avec les propri�taires encore tr�s diff�rents, il est le � casino � articles tr�s populaires. Ici recours � la vid�o pour aider les gens � comprendre ce que les r�gles et jouer au Texas Hold'em.

De la vid�o ci-dessus, on comprend g�n�ralement le jeu du Texas Hold'em sera deux types d'informations: Affect� deux joueurs chaque main de cartes � informations priv�es � et les cartes communes sur la table, � information � . Les joueurs choisissent cinq cartes communes dans les trois, une combinaison de deux cartes ferm�es et les mains, le dernier afin d'obtenir la meilleure combinaison de cinq cartes. Selon � carte Classement � pour d�terminer le vainqueur final.

Jouer au Texas Hold'em c�l�brit� en Chine, Wang Feng est un professeur, un autre est Kai-fu Lee professeur. Sachez presque sous le � Quelles sont les comp�tences, l'exp�rience ou les principes de poker ont? � Question, num�ro un, qui est, la r�ponse de l'enseignant Kai-fu Lee, il a �voqu� en particulier Le jeu cl� bonne bluff (Bluffer, les techniques classiques de ma�tre) est d'apprendre les statistiques .

Le Texas Hold'em est une nouvelle g�n�ration de test de Turing?

Texas Hold'em est devenu un test tr�s populaire de la recherche sur l'intelligence artificielle, chaque joueur tenant une main de poker de cartes � informations priv�es �, les autres joueurs ne peuvent pas voir, il est connu comme � l'information non complet � (informations Imperfect) jeu. Ceci est tr�s diff�rent avec Go, Go est un jeu de divulgation de l'information compl�te, les joueurs peuvent voir chaque drapeau sur la carte, selon toute probabilit� consid�ration Lazi. Alors Texas Hold'em pour l'intelligence artificielle, plus difficile.

Il a dit la communication de l'interview � DeepStack � papier de Michael Bowling avait re�u � New Scientist � au d�but 2015: � Texas Hold'em le plus int�ressants que Lieux vous ne pouvez pas obtenir des informations compl�tes. �

Professeur (CMU) Tuomas Sandholm Carnegie Mellon University, a �galement d�clar�: " Poker est devenu une information non compl�te, la mesure (ordinateur) de niveau standard de l'intelligence de ...... et il peut �tre consid�r� comme une pr�sence au-del� du test de Turing. "

Fait int�ressant, ces deux professeurs dirigent leurs �quipes pour surmonter ce nouveau test de Turing, l'Universit� de l'Alberta au Canada, un � l'Universit� CMU.

Il y a quelques jours, la CMU a �mis un avis: syst�me d'intelligence artificielle de libratus d�velopp� par le leadership Professeur Tuomas Sandholm, heure locale, le 11 Janvier, Rivers Casino � Pittsburgh, en Pennsylvanie, avec quatre pros jouant 120000 mains HUNL, et rivalisez pour 200000 $ en prix. D�s 2015, le pr�d�cesseur de libratus Claudico et jouer contre des joueurs humains pour la premi�re fois, 80000 d�faite totale entre les mains du duel, cette fois-ci �tre un come-back de la CMU.

Mais nous savons d�j� le r�sultat, l'Alberta dans le temps avant la CMU, la question est venue sur le papier. les milieux universitaires ont exprim� des �loges, disant rep�re DeepStack (bien s�r, ce document n'a pas �t� examin�e par des pairs par �tape) mais avec CMU libratus plusieurs jours avant l'�chauffement par rapport � la pompe, DeepStack ne pas obtenir la m�me quantit� de traitement des m�dias, �galement conduit � une certaine insatisfaction.

CMU prend la route AlphaGo ann�e, faire un spectacle au casino magnifique, les meilleurs joueurs humains de jouer contre, et 20 millions de dollars gimmick. Ainsi, bien que ces documents Deepstack plus t�t que la CMU a fait une perc�e, mais ce dernier est meilleur d�fil� des grands m�dias les ignora, mais aussi raisonnable.

En un mot, Alberta a vol� avant, CMU vol� vif (Comp�tition acad�mique est f�roce).

Les r�sultats de ces copies papier Deepstack

au total DeepStack de 4,4 millions de contrats dans le concours avec 33 joueurs humains, jeu en ligne organis� s�par�ment entre le 7 Novembre 2016 et 12 D�cembre. Le vainqueur final des trois meilleurs joueurs, respectivement, 5000,2500 et 1250 r�compense de dollars canadiens. Ce qui suit est le r�sultat du jeu. Les r�sultats montrent que le taux deepstack victoire moyenne de 492 MBB / g (les joueurs de l'homme en g�n�ral � 50 MBB / g est consid�r� comme ayant un plus grand avantage, 750mbb / g est l'adversaire pour gagner chaque d�fausse carte de taux de jeu).

Nous avons mentionn� plus t�t, une information de poker peut �tre divis� en � priv� � et � public �, au milieu de la table et cinq cartes ouvertes pour former une dynamique � d'�tat ouvert. � s�quences possibles divulgu�s �tat de la configuration du jeu dans un arbre Publication (arbre public), o� chaque sous-arbre est divulgu� une divulgation a un �tat associ� (subtree public).

partie sup�rieure figure HUNL est d�crit dans l'arbre. lignes rouges et bleues repr�sentent le mouvement des joueurs, les lignes vertes repr�sentent les cartes communes ouvertes. noeud rond repr�sente la fin du jeu.

Cette figure DeepStack architecture d'ensemble est divis� en (a) (b) (c) trois parties. En (a) de, dans chaque �tat Deepstack d�crit o� il doit �tre op�ration recalcul�, dans lequel la valeur du sous-arbre (valeur Subtree) sera bonne profondeur r�seau de neurones du r�seau neuronal (b) est calcul�e par une formation, et la formation �chantillon par r�seau de neurones est (c).

En g�n�ral, une combinaison de raisonnement r�cursif Deepstack (de raisonnement r�cursif) pour traiter l'asym�trie d'information, comprend �galement la d�composition (d�composition) aux d�cisions connexes informatique centralis�e, et est form�e sur une intuition de toute carte (Intuition), qui sorte d'intuition peut �tre utilis� pour l'auto-apprentissage de la profondeur � jouer aux cartes et l'apprentissage automatique.

Pour libratus guerre de casino DeepStack et 11 Janvier de la CMU, Lei Feng r�seau va suivre la couverture en profondeur.

PS: Lei Feng num�ro de pr�occupation publique nette (Lei Feng r�seau)

Route de la soie

Apprenez � conna�tre la Chine

Thunder CMU, le nouvel algorithme DeepStack premier � conqu�rir le Texas Hold'em Test de Turing

Qu'est-ce qu'un "one-Limit Hold'em" (HUNL)

Le Texas Hold'em est une nouvelle g�n�ration de test de Turing?

Les r�sultats de ces copies papier Deepstack