guerre homme-machine Ke Jie comment perdre?

avertissement avant, avertissement avant haute énergie, avertissement nucléaire avant, qui peuvent apparaître dans une variété de fait, vous ne comprenez pas, je ne sais pas comment le plan professionnel.

Vous pouvez allumer l'ordinateur, alors que Baidu regarder.

Hier Ke Jie et Alpha Dog ont terminé le premier jeu, non, terminé sous la première manche. Alpha Dog pour gagner le résultat final terminé, Ke Jie au cours de la prochaine période a contribué aussi beaucoup de paquet d'expression. De plus, le nom est Ke Jie, pas la propreté est pas Ke Lan est pas Conan.

Selon la prédiction équipe Deepmind et Ke Jie bataille de AlphaGo Maître Shishi que l'an dernier avec une forte jeu contre trois sous AlphaGo Lee.

Trois sous-Quel est le concept? Ke Jie a été cité comme disant, maître d'arts martiaux dans la bataille quand les adversaires vous permettent de le fourrer Mito. Certains internautes ont plaisanté, ce qui signifie Ke Jie plus fort que LiShiShi trois sous.

Halo LiShiShi pleurer dans les toilettes, couché dans le pistolet

Alpha Dog est d'aider Lazi Huang Li Shijie Shishi, que ce soit ou Ke Jie, la question suivante, alors qu'en fait ils sont confrontés, qui est la force motrice derrière le chien alpha.

Pourquoi ne peut pas le chien alpha fait un robot qui peut jouer aux échecs, peut parfois interagir et adversaires, non plus regarder le point « normal »? Pour la machine, il est vraiment pas si simple.

Nous savons tous ce qu'il est comme carte Go, il y a un aspect de chaque conseil sera divisé en 19361 intersection droite, les morceaux vont à l'intersection de la carte. Tant l'espace, de sorte que l'humanité trouver la meilleure région de placement nécessite beaucoup de physique et mentale. Mais l'intelligence artificielle de ne pas besoin, ils peuvent seulement chauffer la CPU. AI il suffit d'utiliser d'énormes données peuvent être utiliser pour faire la vitesse de fonctionnement rapide pour optimiser la recherche.

Ici, nous voulons exporter trois concepts, qui est, la profondeur de l'apprentissage (DL), l'apprentissage de renforcement (RL) et Monte Carlo Arbre recherche (SCTM).

l'apprentissage en profondeur, et l'apprentissage est principalement utilisé pour la construction de deux réseaux de modèle. Tout d'abord, la façon d'examiner l'état actuel du conseil d'administration. Ce combat à l'état actuel du sous-conseil, gagner évaluer les attentes, il est le réseau de valeur (ValueNetwork). Carte d'entrée 19x19 est un état de chaque point avec aucun promoteur ou d'un promoteur, est de gagner attente de sortie.

Si assez intelligent, venez alors de trouver un mathématicien peut écrire une formule pour exprimer sur la carte. Mais l'intelligence artificielle de n'a pas été enseigné que la fonction « débrouillardise », « maîtrise », de sorte qu'il ne peut être un réseau de neurones multicouche à l'expression approximative des fonctions avancées.

En second lieu, en l'état actuel du conseil d'administration, un pion de décider comment aller afin d'avoir la plus grande probabilité de gagner, il est le réseau de la politique AlphaGo (Policy Network). En d'autres termes, donner l'état d'un jeu d'échecs 19x19, tous sont vides à la meilleure option Lazes, il y aura le plus grand taux de victoire.

De même, on peut aussi utiliser une fonction pour décrire, tel que l'entrée est l'état actuel de la carte, la sortie de chaque zone de mise en place et l'on souhaite gagner attentes. Cependant, cette fonction ne dispose pas d'un haut niveau de formules mathématiques, donc, éventuellement recours à multicouches réseau de neurones.

Les soi-disant réseau d'apprentissage en profondeur est la façon dont il est l'intelligence artificielle Fun? Ici, nous voulons proposer un autre terme, appelée descente de gradient stochastique (SGD).

Allez pas de formule de solution, ou n'ont pas une formule relativement simple à résoudre, ne peut avoir recours à l'itération de l'intelligence artificielle, l'itération de descente de gradient stochastique. Expliquez brièvement, se sent les pierres. AI compte désespérément jusqu'à ce qu'il considérait comme un résultat satisfaisant. Ce processus encore et encore, lui-même est très simple en fait. Selon nos paroles, l'intelligence artificielle avec l'approche la plus « stupide ». Supposons que nous avons trouvé une formule pour faire ces questions à choix multiples avec quatre options, la façon la plus stupide est d'apporter dans ces quatre options sont considérées à nouveau. Ceci est le style de l'intelligence artificielle.

Bien sûr, les données de base ont été saisies dans les prédécesseurs Alpha Dog dans le serveur, l'énorme quantité de données Alpha Dog est impossible de calculer la scène. Un tel chien alpha quand les échecs de jeu peut réduire considérablement l'espace de recherche, la mauvaise herbe sur Lazes du tout.

Donc, si Alpha Dog a été considéré comme une mauvaise région est mise pas nécessairement mauvais, comment le faire? Ici, il est de renforcer le domaine de l'apprentissage, qui est, l'auto-play. Prenez la routine d'arts martiaux, ce qu'on appelle l'homme à la main droite Bo. Il a dit point d'image, deux chiens alpha devant les échecs, enregistrés par l'apprentissage en profondeur du modèle de réseau, d'améliorer l'effet des deux premiers modèles du réseau. Dans les algorithmes d'apprentissage par renforcement, mais il faut aussi beaucoup de calcul itératif, afin d'obtenir le meilleur des attentes, qui est, pour parvenir à une convergence.

A ce point du temps, le chien alpha peut déjà être considéré comme un joueur normal. Mais dans le cas de beaucoup de choix que vous ne l'avez pas été sélectionnés, le chien alpha si vous ne pouvez pas garantir que toutes les étapes des prédictions du modèle sont la meilleure façon de le faire?

Le dernier terme est venu, qui est, Monte Carlo Arbre Recherche. Ceci est la mise en place progressive d'un arbre de recherche aléatoire asymétrique par le processus déduisant du jeu. Probablement, il peut être divisé en quatre étapes. Sélectionner (Sélection), dilatation (expansion), la simulation (Simulation), back-propagation (rétropropagation).

Autrement dit, il est un simple et brut essayer de a. Nous savons que toute l'histoire cueillette des épis de maïs, non? Dès le début de la fin est venu dans un champ, choisissez-vous que le plus grand blé. Certaines version est cueillir des pommes, mais presque. Monte-Carlo Arbre Recherche a été dès le début à venir avec un tas de blé ou une pomme, une comparaison avec la dernière. Ensuite, le temps que vous choisissez doit être particulièrement grande, sinon vous ne pouvez pas savoir si vous avez choisi le plus grand. Seulement la main-d'uvre limitée, vous ne savez pas à la fin que vous choisissez est le plus grand, mais vous pouvez garantir que cela est sans aucun doute un relativement grand.

Écouter fatigué, non?

Mais Alpha Dog est le cas de « non flexible », ou non « analogie. » Humaine la façon la plus stupide d'enseigner l'Alpha Dog, rapide si elle est pas pris en compte et ont une énorme base de données, il ne peut se faire comme ça et la bataille Ke Jie.

Ce chien alpha peut être en mesure de surmonter Ke Jie, aspirations peut-être interstellaire, mais il est destiné à écrire cette formule E = mc². Les êtres humains sont bons au transfert de l'apprentissage, et maintenant l'intelligence artificielle ne peuvent pas le faire.

Après le match, les utilisateurs ont trouvé Sicong se fait au cynisme micro-Bo Ke Jie, laissant " Yo, puis au moment de Lee et alphago vous cet effort arrogants où aller ? « Donc, un mot.

En général, beaucoup considèrent Sicong de net-citoyens sera fortement soutenu. Mais cette situation n'est pas trop différente, Sicong était en colère les utilisateurs détestent.

Les véhicules utilisés uniquement pour exécuter des médicaments? Il serait trop ennuyeux! Enfin, une exclusivité de tyran locale!
Précédent
maréchal exposition de classe mondiale transformée en adversaires nationaux de football, entraîneur quatre ans en Chine après un an de chômage
Prochain
« TFBOYS » « nouvelles » 190128 source de Wang Xi est vous conseille de prendre le garçon et la ligne et sans peur jeunesse Endeavor
Wang Lin Huatai équipe de communication: 5G Spark devenir pilote de feu de prairie V2X en plein essor
Yin et Yang: inventaire de 2018 a échoué à atteindre le « gâteau », où aller de la peau de Noël?
Une autre arrivée phare Xiaolong 835 unités, plus petit que le support Samsung Missoni une plus complète
190128 mille Xi magazine « TFBOYS « Les Scènes » Nouvelles de seconde bombe, juste comparable à une couverture de magazine
Super atterrissage dans l'AFC a remporté un autre ennemis officiels européens déclarés! Tianjin Ying droit à une bonne santé?
La plupart des capacités de sac à dos comptable des fournitures de poulet, le premier peu comme, les trois premiers types de inutiles!
Comment puis-je trouver la vie? Vous recherchez la biométrie dans l'univers
Suzhou: Zhangjiagang fleurs de pêche, fleurs Malédiction du peuple
Fantasy Westward Journey: frénésie d'activités en ligne fréquemment sur la ligne, combien de temps le nombre de requins de feu?
Quand les gens ont commencé à discuter de la restauration de Notre-Dame, le jeu tout à coup le feu
iPhone8 / nouvel iPad beaucoup d'exposition, conception étrange