guerre homme-machine Ke Jie comment perdre?

avertissement avant, avertissement avant haute �nergie, avertissement nucl�aire avant, qui peuvent appara�tre dans une vari�t� de fait, vous ne comprenez pas, je ne sais pas comment le plan professionnel.

Vous pouvez allumer l'ordinateur, alors que Baidu regarder.

Hier Ke Jie et Alpha Dog ont termin� le premier jeu, non, termin� sous la premi�re manche. Alpha Dog pour gagner le r�sultat final termin�, Ke Jie au cours de la prochaine p�riode a contribu� aussi beaucoup de paquet d'expression. De plus, le nom est Ke Jie, pas la propret� est pas Ke Lan est pas Conan.

Selon la pr�diction �quipe Deepmind et Ke Jie bataille de AlphaGo Ma�tre Shishi que l'an dernier avec une forte jeu contre trois sous AlphaGo Lee.

Trois sous-Quel est le concept? Ke Jie a �t� cit� comme disant, ma�tre d'arts martiaux dans la bataille quand les adversaires vous permettent de le fourrer Mito. Certains internautes ont plaisant�, ce qui signifie Ke Jie plus fort que LiShiShi trois sous.

Halo LiShiShi pleurer dans les toilettes, couch� dans le pistolet

Alpha Dog est d'aider Lazi Huang Li Shijie Shishi, que ce soit ou Ke Jie, la question suivante, alors qu'en fait ils sont confront�s, qui est la force motrice derri�re le chien alpha.

Pourquoi ne peut pas le chien alpha fait un robot qui peut jouer aux �checs, peut parfois interagir et adversaires, non plus regarder le point � normal �? Pour la machine, il est vraiment pas si simple.

Nous savons tous ce qu'il est comme carte Go, il y a un aspect de chaque conseil sera divis� en 19361 intersection droite, les morceaux vont � l'intersection de la carte. Tant l'espace, de sorte que l'humanit� trouver la meilleure r�gion de placement n�cessite beaucoup de physique et mentale. Mais l'intelligence artificielle de ne pas besoin, ils peuvent seulement chauffer la CPU. AI il suffit d'utiliser d'�normes donn�es peuvent �tre utiliser pour faire la vitesse de fonctionnement rapide pour optimiser la recherche.

Ici, nous voulons exporter trois concepts, qui est, la profondeur de l'apprentissage (DL), l'apprentissage de renforcement (RL) et Monte Carlo Arbre recherche (SCTM).

l'apprentissage en profondeur, et l'apprentissage est principalement utilis� pour la construction de deux r�seaux de mod�le. Tout d'abord, la fa�on d'examiner l'�tat actuel du conseil d'administration. Ce combat � l'�tat actuel du sous-conseil, gagner �valuer les attentes, il est le r�seau de valeur (ValueNetwork). Carte d'entr�e 19x19 est un �tat de chaque point avec aucun promoteur ou d'un promoteur, est de gagner attente de sortie.

Si assez intelligent, venez alors de trouver un math�maticien peut �crire une formule pour exprimer sur la carte. Mais l'intelligence artificielle de n'a pas �t� enseign� que la fonction � d�brouillardise �, � ma�trise �, de sorte qu'il ne peut �tre un r�seau de neurones multicouche � l'expression approximative des fonctions avanc�es.

En second lieu, en l'�tat actuel du conseil d'administration, un pion de d�cider comment aller afin d'avoir la plus grande probabilit� de gagner, il est le r�seau de la politique AlphaGo (Policy Network). En d'autres termes, donner l'�tat d'un jeu d'�checs 19x19, tous sont vides � la meilleure option Lazes, il y aura le plus grand taux de victoire.

De m�me, on peut aussi utiliser une fonction pour d�crire, tel que l'entr�e est l'�tat actuel de la carte, la sortie de chaque zone de mise en place et l'on souhaite gagner attentes. Cependant, cette fonction ne dispose pas d'un haut niveau de formules math�matiques, donc, �ventuellement recours � multicouches r�seau de neurones.

Les soi-disant r�seau d'apprentissage en profondeur est la fa�on dont il est l'intelligence artificielle Fun? Ici, nous voulons proposer un autre terme, appel�e descente de gradient stochastique (SGD).

Allez pas de formule de solution, ou n'ont pas une formule relativement simple � r�soudre, ne peut avoir recours � l'it�ration de l'intelligence artificielle, l'it�ration de descente de gradient stochastique. Expliquez bri�vement, se sent les pierres. AI compte d�sesp�r�ment jusqu'� ce qu'il consid�rait comme un r�sultat satisfaisant. Ce processus encore et encore, lui-m�me est tr�s simple en fait. Selon nos paroles, l'intelligence artificielle avec l'approche la plus � stupide �. Supposons que nous avons trouv� une formule pour faire ces questions � choix multiples avec quatre options, la fa�on la plus stupide est d'apporter dans ces quatre options sont consid�r�es � nouveau. Ceci est le style de l'intelligence artificielle.

Bien s�r, les donn�es de base ont �t� saisies dans les pr�d�cesseurs Alpha Dog dans le serveur, l'�norme quantit� de donn�es Alpha Dog est impossible de calculer la sc�ne. Un tel chien alpha quand les �checs de jeu peut r�duire consid�rablement l'espace de recherche, la mauvaise herbe sur Lazes du tout.

Donc, si Alpha Dog a �t� consid�r� comme une mauvaise r�gion est mise pas n�cessairement mauvais, comment le faire? Ici, il est de renforcer le domaine de l'apprentissage, qui est, l'auto-play. Prenez la routine d'arts martiaux, ce qu'on appelle l'homme � la main droite Bo. Il a dit point d'image, deux chiens alpha devant les �checs, enregistr�s par l'apprentissage en profondeur du mod�le de r�seau, d'am�liorer l'effet des deux premiers mod�les du r�seau. Dans les algorithmes d'apprentissage par renforcement, mais il faut aussi beaucoup de calcul it�ratif, afin d'obtenir le meilleur des attentes, qui est, pour parvenir � une convergence.

A ce point du temps, le chien alpha peut d�j� �tre consid�r� comme un joueur normal. Mais dans le cas de beaucoup de choix que vous ne l'avez pas �t� s�lectionn�s, le chien alpha si vous ne pouvez pas garantir que toutes les �tapes des pr�dictions du mod�le sont la meilleure fa�on de le faire?

Le dernier terme est venu, qui est, Monte Carlo Arbre Recherche. Ceci est la mise en place progressive d'un arbre de recherche al�atoire asym�trique par le processus d�duisant du jeu. Probablement, il peut �tre divis� en quatre �tapes. S�lectionner (S�lection), dilatation (expansion), la simulation (Simulation), back-propagation (r�tropropagation).

Autrement dit, il est un simple et brut essayer de a. Nous savons que toute l'histoire cueillette des �pis de ma�s, non? D�s le d�but de la fin est venu dans un champ, choisissez-vous que le plus grand bl�. Certaines version est cueillir des pommes, mais presque. Monte-Carlo Arbre Recherche a �t� d�s le d�but � venir avec un tas de bl� ou une pomme, une comparaison avec la derni�re. Ensuite, le temps que vous choisissez doit �tre particuli�rement grande, sinon vous ne pouvez pas savoir si vous avez choisi le plus grand. Seulement la main-d'uvre limit�e, vous ne savez pas � la fin que vous choisissez est le plus grand, mais vous pouvez garantir que cela est sans aucun doute un relativement grand.

�couter fatigu�, non?

Mais Alpha Dog est le cas de � non flexible �, ou non � analogie. � Humaine la fa�on la plus stupide d'enseigner l'Alpha Dog, rapide si elle est pas pris en compte et ont une �norme base de donn�es, il ne peut se faire comme �a et la bataille Ke Jie.

Ce chien alpha peut �tre en mesure de surmonter Ke Jie, aspirations peut-�tre interstellaire, mais il est destin� � �crire cette formule E = mc�. Les �tres humains sont bons au transfert de l'apprentissage, et maintenant l'intelligence artificielle ne peuvent pas le faire.

Apr�s le match, les utilisateurs ont trouv� Sicong se fait au cynisme micro-Bo Ke Jie, laissant " Yo, puis au moment de Lee et alphago vous cet effort arrogants o� aller ? � Donc, un mot.

En g�n�ral, beaucoup consid�rent Sicong de net-citoyens sera fortement soutenu. Mais cette situation n'est pas trop diff�rente, Sicong �tait en col�re les utilisateurs d�testent.

Route de la soie

Apprenez � conna�tre la Chine

guerre homme-machine Ke Jie comment perdre?