Inspir� par la profondeur de l'apprentissage de renforcement + intelligente D�CISIONNEL humaine, il y a une interview accord�e � la vision des entreprises chinoises, � Kai Yuan monde. �

AI Technology Review par: La derni�re fois que nous avons fait �tat de la prise de d�cision entreprise intelligente de la Chine, � Kai Yuan monde �, en vertu de leur propre apprentissage de renforcement de la profondeur de la technologie de base et la plate-forme de renseignement de prise de d�cision, multi-agents dans NeurIPS 2018 concours � tournois de l'�quipe Bomberman � ont �t� obtenus en champion de l'apprentissage .

Kai Yuan monde choisissent d'�tudier la technologie pour la ligne de profondeur am�lior�e, qui rappelle les m�mes racines dans l'apprentissage de renforcement pour aller AI Intelligence artificielle AlphaGo c�l�bre entreprise DeepMind. Pendant ce temps, monde Qiyuan et aussi un �l�ment indispensable dans la vie des jeunes - Jeux - sont inextricablement li�s.

D'autre part, l'apprentissage par renforcement comme une technologie �mergente dans un domaine en �volution rapide, il y a beaucoup de d�fis en soi, comme reproductible, r�utilisabilit� et la robustesse des aspects du probl�me peut �galement limiter son application pratique. Kai Yuan monde o� viennent la profondeur de l'apprentissage de renforcement pour la prise de d�cision confiance et enthousiasme intelligente de? Comment ils per�oivent les d�fis de l'apprentissage de renforcement? Quels sont-ils et les r�alisations technologiques soutiennent leurs id�es ambitieuses? La tenue de ces curieux, nous avons interview� Kai Yuan Yuan Quan, fondateur et chef de la direction du monde.

Yuan Quan, fondateur du World Kai Yuan-directeur g�n�ral: Ali a servi en tant que directeur de laboratoire informatique cognitive, directeur principal, t�l�phone mobile algorithme de recommandation fondateur de l'�quipe Taobao Lynx, la cr�ation d'un bon stock, vous aimerez aussi les fournisseurs d'�lectricit� et d'autres produits personnalis�s bien connus , le double du taux de l'�quipe a remport� le 201511 CEO Prix de contribution sp�ciale. Avant de se joindre Ali, Yuan Quan a �t� chercheur � l'Institut de recherche IBM Chine pour �tudier et recommander algorithme de prise de d�cision intelligente, est le IBM 2011 Global Banking commanditaire t�te de s�rie de projets innovants. Bien que la pratique de l'industrie des applications � grande �chelle, qui sont r�sum�es et publi�es plus de trente articles dans des conf�rences internationales ACM haut RecSys, KDD, SDM et ainsi de suite. Yuan Quan a un certain nombre de brevets sino-am�ricaines, de longue date ACM RecSys, IEEE Transaction sur les examinateurs Jeux. Kai Yuan fond�e en 2017 est un monde de d�cision cognitive rendant la technologie intelligente au cur de la soci�t�, initi�e par l'ancien Ali, Netflix, les scientifiques d'IBM et de cadres, de doctorat et de ma�triser un certain nombre d'universit�s prestigieuses � se joindre, et ont Berkeley, CMU, etc. consultant distingu� institutions bien connues. Vision mondiale Kai Yuan est de � cr�er une intelligence de prise de d�cision de construire un monde parall�le pour stimuler le potentiel humain, � les comp�tences de base de l'�quipe � l'apprentissage en profondeur, l'apprentissage par renforcement, un grand parall�le � grande �chelle informatique bas�e, avec une exp�rience r�ussie dans de nombreux domaines de l'Internet, des jeux, etc., par domestique premi�re classe investisseurs �trangers de tous �ges.

Smart Reaper apr�s 10 la formation dans l'environnement et 10 confrontation Faucheur joueur contr�l�, montrant une retraite intelligente, Chase, encercl�e de regroupement, l'utilisation de la capacit� des manuvres de terrain saut

AI Technology Review: L'objectif principal du monde est la technologie du renseignement de d�cision cognitive Kai Yuan. Nous avons entendu parler de sc�narios de prise de d�cision intelligente, y compris le contr�le des risques financiers, le diagnostic m�dical, et ainsi de suite. Kai Yuan monde est objectif actuel sur lequel les industries sont plus des sc�nes? Comment les r�sultats? plans d'avenir quelles industries sc�ne participe?

Yuan Quan: Notre principale pr�occupation est le jeu, les industries li�es � l'intelligence et de simulation de r�seau. Notre profondeur de techniques d'apprentissage de renforcement, en fait, la premi�re formation vient du jeu, alors la d�cision Kai Yuan bas� sur la plateforme intelligente pour le d�veloppement et l'application. Nous utilisons donc plus naturel pour explorer l'industrie du jeu, comme la fourniture de services au moteur de jeu et soci�t� AI. Agent Notre AI ne peut pas seulement remplacer NPC traditionnel dans le jeu, et m�me accompagner les gens jouent beaucoup de plaisir (Jouer avec AI et vid�o StarCraft humaine voir Ainsi, l'industrie e-sport est de plus en plus notre attention. l'intelligence du r�seau et de renforcer la profondeur des zones de simulation d'apprentissage aussi avantageux.

Notre soci�t� a �t� fond�e plus d'un an, principalement de l'�nergie dans la technologie de base et le d�veloppement de produits, en particulier la plate-forme de renseignement de d�cision Qiyuan. Kai plate-forme de renseignement de d�cision Yuan apr�s plusieurs s�ries d'it�rations, le num�ro de build a atteint -v0.8. Kai Yuan a actuellement la plate-forme de renseignement d�cisionnel pr�sente les avantages concurrentiels suivants:

capacit� d'apprentissage continu En premier lieu,. La capacit� de continuer � apprendre est un agent cl� dans un anneau de formation. Au cours de la phase de formation, la n�cessit� d'agent de conserver les comp�tences acquises au cours du pass� pour apprendre de nouvelles comp�tences afin d'atteindre un tr�s haut niveau. plate-forme de renseignement de d�cision Qiyuan � s�lection naturelle �, de mani�re � atteindre l'apprentissage continu est r�alis�e par voie de match de groupe d'agent sportif. Dans le processus concurrentiel, retenu les forts et les faibles sont �limin�s. Apr�s les faibles sont �limin�s, la poste laiss� vacant est remplac� par le clone fort et clone la forte �volution continue est d�finie en fonction de la nouvelle super-r�f�rence. Dans le cas du budget des ressources informatiques fixe, plate-forme de renseignement de d�cision Kai Yuan pour explorer de nouvelles forte (exploration) gr�ce � ce m�canisme et de la racine de l'utilisation �quilibr�e des ressources informatiques entre l'ancien fort (exploitation).

Deuxi�mement, le soutien � la sc�ne multi-agents complexe de formation commune. Dans les probl�mes de jeu multi-agents, la retenue mutuelle entre les diff�rents organismes de renseignement sont plus fr�quentes, la possibilit� de convergence est extr�mement complexe. Bomberman concurrence, par exemple, dans la course, diff�rents styles d'agent des �quipes, une bonne attaque, une bonne garde. Sur la base de l'id�e � effet de poisson-chat � (d�fini par l'introduction de la forte, faible pour fort effet d'excitation), Kai Yuan plate-forme de renseignement d�cisionnel fond� sur des r�gles pour l'introduction de concurrents d'ordre sup�rieur dans les premiers stades de la formation, afin de stimuler un agent faible au d�but et forte le duel apprendre toutes les comp�tences de base pour �lever deviennent forts, avec l'approfondissement de la phase de formation, la plate-forme de renseignement Kai yuans de d�cision alors que la formation multi-agent, de sorte que l'auto-perfection dans la confrontation acharn�e entre eux.

Troisi�mement, le soutien � grande �chelle, la simulation et de la formation tr�s simultan�e bas�e sur cluster cloud priv� � grande �chelle. d�cision Genesis pluralit� Intelligent Platform de modules qui le composent, et emball� dans un r�cipient (figure). La gestion par les centaines de mode automatis� nuage des ressources CPU et GPU et pour obtenir un arrangement de conteneurs, ce qui r�duit le co�t de l'envoi des dizaines de missions de formation Bomberman. � grande �chelle, simulation tr�s simultan�e et � grande �chelle la formation en m�me temps dans un cluster de cloud priv�. De plus, la plate-forme de renseignement de d�cision Kai Yuan fournit une solution de stockage distribu� et configur� pour partager la piscine de mod�le pour fournir un soutien � la persistance et la part des groupes de mod�le d'agent Bomberman.

2018 Nous avons essay� de mettre un peu commercialiser la technologie, est �galement obtenu de bons revenus. 2019, des plans pour lib�rer la premi�re �dition du monde Kai Yuan Kai Yuan prise de d�cision produits � base de plates-formes intelligentes, comme plus de clients industriels, l'exp�rience de l'utilisateur final pour apporter un service de haute.

Retour � venir � la prise de d�cision intelligente, il est une technologie relativement commune, la capacit� de prise de d�cision de l'aide peut �tre g�n�ralis� � de nombreuses industries, et m�me l'intelligence r�seau - En fait, chaque nud du r�seau sont �galement un organe de prise de d�cision intelligente, la prise de d�cision intelligente il y a beaucoup de place. Nous allons �galement mettre l'accent sur l'avenir possible pour les t�l�communications, l'�nergie �lectrique, r�seau de renseignement des industries connexes.

AI Technology Review: d�cisions intelligentes dans des applications r�elles doivent prendre en compte la d�cision de l'intelligibilit�, la prise de d�cision �quitable, de fournir des opportunit�s excusent l'humanit� et ainsi de suite. �tes-vous pr�t pour ces questions?

Yuan Quan: L'intelligibilit�, l'�quit�, ceux-ci sont tr�s importants. Il est non seulement de donner l'occasion de fournir une excuse de l'humanit�, Amnesty International a �galement besoin d'expliquer leur processus de prise de d�cision, montrant confiance, avec l'interpr�tabilit� de prise de d�cision, aide � la d�cision et des r�sultats � la population. Une telle fa�on est que vous pouvez mettre � la prise de d�cisions de visualisation Les r�sultats ont montr�, nous avons fait dans le secteur de l'�lectricit� dans le syst�me de recommandation, lorsque les r�sultats de la recommandation de production peut donner plusieurs raisons de la interpr�tabilit� recommandation en m�me temps. � l'heure actuelle, nous sommes sur le plan technique, y compris interpr�tabilit� apprentissage en profondeur des technologies li�es � faire plus l'accumulation de la technologie.

AI Technology Review: Pour l'intelligence artificielle prise de d�cision, il y a un probl�me de vision est souvent parl� que si une voiture de vitesse devant le pilote automatique tout � coup d'un pi�ton, le ralentissement peut blesser les gens pour �viter la voiture, il ne sera pas d�c�l�ration d'�vitement des risques aux pi�tons. d�cision intelligente si la solution parfaite � ce probl�me est semblable � elle?

Yuan Quan: Autopilote cette sc�ne que nous voyons est pas beaucoup, que bri�vement sur ma compr�hension de cette question.

Tout d'abord, si cela est une voiture intelligente, il y a eu de tels cas, que le temps est venu d'avoir � prendre cette d�cision, et cette d�cision est en fait un tr�s tard le moment. En fait, la situation id�ale est d'�viter de telles d�cisions de dilemme. Lorsque nous apprenons � conduire, le principe le plus important est la conduite d�fensive, la conduite d�fensive. Donc, si c'est un syst�me de prise de d�cision vraiment intelligente, qui devrait �tre estim� � un accident avant qui pourrait survenir, comme sortant du pi�ton ou d'un chien, il y a une pr�paration aux situations d'urgence, alors essayez d'�viter la date tardive de la situation de prise de d�cision. les d�cisions de timing est tr�s important, il ne faut pas manquer le meilleur moment de la d�cision.

En second lieu, si bien l� quand cela se produit le processus de d�placement, ce principe est certainement le plus grand protecteur: la protection de la vie humaine, je pense que cela devrait �tre le premier principe. Il me fait penser aux trois principes de robots d'Asimov, les v�hicules autonomes est en fait un robot, il ne devrait pas blesser � tout moment que le premier principe de la vie humaine. S'il est un petit dommage � la vie des pi�tons et des passagers, choix haut de s�curit� pour faire quelque chose, je crois qu'il devrait �tre possible de se conformer � ces principes.

la concurrence NeurIPS Bomberman, Bomberman apprendre bo�te de bombardement pr�cis, et de trouver son chemin � travers le plus court chemin pour manger la drogue am�lioration

AI Technology Review: Une utilisation intelligente de la prise de d�cision dans NeurIPS concurrence Bomberman de Kai algorithme d'apprentissage par renforcement de d�cision Yuan en cours d'ex�cution sur la plate-forme intelligente. Pour le jeu avec paradigme d'apprentissage par renforcement de l'apprentissage est un choix naturel, puis la prise de d�cision intelligente dans d'autres domaines �galement faire l'apprentissage de renforcement? (Par rapport � l'apprentissage plus directement supervis�)

Yuan Quan: Notre �quipe a fait au cours de la derni�re d�cennie recommande la publicit� sur Internet, des images, et de nuages, beaucoup de donn�es de marquage, cette fois-ci sur l'utilisation de l'apprentissage supervis� pour apprendre les grandes donn�es. Mais le co�t des donn�es d'annotation est tr�s �lev�, donc nous avons soulign� que En fait, l'apprentissage de renforcement est plus proche de l'homme, particuli�rement proche de processus d'apprentissage naturel de l'enfant. Le renforcement en train d'apprendre non seulement peut �tre appliqu� dans le jeu, vous pouvez �galement utiliser le pilote automatique. Par exemple, dans l'apprentissage du monde r�el, M�me si elle a accumul� des millions de kilom�tres de donn�es, vous pouvez �tre tr�s difficile d'obtenir des �chantillons n�gatifs d'information (sc�ne de l'accident du trafic) . Mais vous �tes dans un environnement virtuel, avec l'apprentissage par renforcement � apprendre, ce qui est tr�s facile d'obtenir des �chantillons n�gatifs.

Ainsi, l'apprentissage par renforcement ce paradigme, il peut aller beaucoup d'autres industries en dehors du jeu, pilote automatique, apr�s AlphaGo, peut �galement �tre utilis� pour faire des recommandations, Google doit faire avec les centres de donn�es �conomes en �nergie, comprend �galement je l'ai mentionn� au r�seau intelligent, peut �tre utilis� pour renforcer la fa�on d'apprendre � apprendre.

AI Technology Review: Ainsi, l'apprentissage de renforcement ont la possibilit� de remplacer compl�tement l'apprentissage supervis� il?

Yuan Quan: Il est impossible. L'apprentissage supervis� noyau est sa r�troaction positive et n�gative, des �chantillons d'�tiquettes positives et n�gatives du processus d'apprentissage est en fait un signal tr�s claire et sans ambigu�t�, ce qui guidera le syst�me d'apprentissage de la machine. Mais dans l'apprentissage de renforcement � label �, qui est, r�compense, en fait, est un signal faible, il est soit donn� par l'environnement, que ce soit les d�veloppeurs AI sp�cifier. Il peut aussi penser qu'il est en fait une sorte d'approximation de signal fort d'apprentissage supervis�.

Dans certains cas, par exemple, nous avons l'apprentissage supervis� de grands volumes de donn�es, et cette t�che tr�s critique, la tol�rance aux pannes est faible, alors le signal positif et n�gatif au moyen d'apprentissage supervis�, il peut apprendre encore plus clair, plus de points � apprendre le sexe. Apprentissage par renforcement apprentissage supervis� relatif, apr�s tout, il est un domaine �mergent. L'apprentissage supervis� des d�cennies pass�es du d�veloppement, de la th�orie � la maturit� de l'application de l'industrie est relativement �lev�e.

Mai 2017, Wuzhen Ke Jie a perdu � AlphaGo Master en trois Fanqi

AI Technology Review : Apprentissage par renforcement hotspot recherche en intelligence artificielle au cours des derni�res ann�es, mais il y a beaucoup de difficult�s dans le processus d'apprentissage lui-m�me, comme vous le dites, � reproductible, r�utilisabilit� et de robustesse qui demeurent des d�fis � dans l'introduction. Ensuite, vous s�lectionnez l'apprentissage par renforcement comme technologie de base direction R & D, nous pouvons parler des raisons de confiance en elle? Quelles sont les r�alisations technologiques originales actuellement?

Yuan Quan: Notre �quipe fondatrice a fait un grand dix derni�res ann�es de donn�es, apprentissage supervis� apr�s, Voir ces domaines technologiques �mergents se sentent tr�s int�ress�s par toute l'�quipe fondatrice dans ce domaine est tr�s passion, quelle que soit la technologie elle-m�me, ou jouer � des jeux sur elle. Un grand nombre de nos membres de l'�quipe de fondateurs vraiment aim� les jeux de jeu, en particulier certains des plus en profondeur, jeu cr�atif. Mon co-fondateur et Haitao, plus d'une d�cennie de StarCraft beaucoup.

Il y a des raisons de se sentir en confiance, alors que dans l'analyse finale provient de la croyance en l'�quipe et de renforcer l'apprentissage. Ainsi qu'un papiers AlphaGo programmeur ma�tre, DeepMind scientifique David Silver il y a sp�cifiquement all� � la glace et la neige du Royaume-Uni dix ans a ouvert avec ce domaine tout l'apprentissage de l'apprentissage par renforcement Richard Sutton. Avant cette David Silver et un autre fondateur DeepMind de Demis Hassabis d�j� commenc� une soci�t� de jeux vid�o, plus d'une d�cennie � explorer le type � noir et blanc � de jeu bas� sur l'IA. Ceci est la preuve de leur �tude intensive de la foi.

� l'heure actuelle notre technologie accumul�e au cours des deux derni�res ann�es, a produit de nombreuses r�alisations technologiques de l'originalit�, surtout ce jeu et des sc�nes de jeu ensemble. Au cours des derni�res ann�es, trois jeux sont si populaires type de jeu de jeu (MOBA). Nous avons maintenant plus de dix brevets et droits d'auteur de logiciels comme une expression de nos r�alisations technologiques dans ce domaine, ainsi que la plate-forme technologique - la plate-forme de renseignement de d�cision Kai Yuan.

En fait, quand beaucoup de gens parlent encore de d�courager l'apprentissage par renforcement du texte, parler de l'instabilit� de l'apprentissage de renforcement de la formation, nous avons constamment rectification sur cette plate-forme, ce qui permet � l'agent de stabilisation de l'apprentissage et la formation en m�me temps. Y compris le concours de bombardier, nous chaque �tape du processus de formation ne participe pas � la pr�paration de la r�gle a priori humaine, est l'agent de leur propre apprentissage, la courbe d'apprentissage est tr�s beau, mais aussi deux corps de fa�on constante vers intelligents l'effet de levage.

Apr�s cette p�riode, nous avons gagn� la course de championnat, il a �t� le r�sultat du concours d'�crire un essai (arxiv.org/abs/1812.07297), nous avons r�cemment pr�sent� un document, Sur la fa�on de renforcer l'apprentissage et, ensemble, l'�volution de la th�orie des jeux. Apr�s l'avenir, nous organiserons l'innovation plus syst�matique d'entre eux, ajouter plus de r�sultats � partager avec le monde universitaire et l'industrie.

AI Technology Review: A ce stade, vous devez faire face (visage aussi) Quels sont les d�fis techniques? L'id�e g�n�rale de la fa�on de r�soudre?

Yuan Quan: Les d�fis techniques doivent exister encore, la profondeur de l'apprentissage de renforcement est aussi une nouvelle direction, juste tirer vers le haut.

La profondeur de l'apprentissage de renforcement dans ce sens, de notre point de vue de l'exp�rience et des sc�narios d'affaires, La formation est un grand agent de seuil de grandes sc�nes et complexes. Voil� pourquoi nous essayons de la plate-forme de renseignement de d�cision Kai Yuan dans le but de r�soudre. Juste au-dessus NIPS 2018, le Canada est l'autorit� du professeur, laur�at du prix Turing Judea Pearl parlait encore de cet apprentissage peut �tre am�lior� les probl�mes de reproductibilit�. Nous actuellement sur la plate-forme a accumul� beaucoup de technologie, dans une certaine mesure de r�soudre ces probl�mes, mais avec cet agent � grande �chelle, comme agent de milliers, m�me dans un environnement plus complexe, plus ouvert � former, comment notre direction est de stabiliser la convergence dans l'exploration.

Un autre probl�me est que Comment le jeu dans un environnement d'information non complet. AlphaGo �checs est un jeu avec des informations incompl�tes (les deux parties peuvent voir l'emplacement de toutes les pi�ces sur l'�chiquier), mais essentiellement toute la sc�ne de jeux, ainsi que la r�alit� de la sc�ne de prise de d�cision, sont des informations incompl�tes. En fait, toute personne prise de d�cisions sont susceptibles de prendre des d�cisions sur des informations incompl�tes. Certains des documents que nous avons soumis est d'essayer de renforcer la th�orie de l'apprentissage et jeu ensemble, pour �tudier ensemble, cela est une nouvelle direction.

Du point de vue de la prise de d�cision, l'intelligence de prise de d�cision est toujours un probl�me de classe mondiale, le processus de prise de d�cision du cerveau humain sont les fonctions les plus complexes. De notre plus il y a dix ans � l'Institut Watson d'IBM pour la compr�hension de la pratique d'Ali plate-forme de commerce �lectronique, ainsi que des d�cennies d'histoire du d�veloppement de la grippe aviaire dans l'�tude de laboratoire du point de vue de l'informatique cognitive, principalement les aspects suivants: Premi�rement, processus de prise de d�cision est subjectif et l'objectif, l'int�gration de Sense and Sensibility, l'ordinateur actuel est bon � traiter avec la partie rationnelle peut �tre calcul�e, et ont donc besoin de mieux trajectoire d'approche de mod�lisation, en deuxi�me lieu, les facteurs qui influencent la d�cision de tant de personnes environnement dense informations multi-sources de prise de d�cision, la n�cessit� d'un d�pistage efficace et extraire des informations utiles, alors que l'information est le raisonnement et les hypoth�ses inconnues. Troisi�mement, les diff�rentes industries utilisant des sc�nes de prise de d�cision intelligente exige souvent prise de d�cisions en temps r�el, et m�me des d�cisions forte concurrence, comme l'Internet en g�n�ral besoin de retourner un r�sultat de recommandation � l'utilisateur en millisecondes, de sorte que l'architecture du syst�me est aussi un grand d�fi.

Notre avantage est bas� sur le fondateur de l'�quipe fondatrice au cours des dix derni�res ann�es dans les institutions de recherche de classe mondiale, l'exp�rience des soci�t�s Internet, un aper�u en profondeur et de l'exp�rience pratique pour l'ensemble du domaine du monde, une limite de plan de d�veloppement clair et de la technologie, et Berkeley, CMU, de nombreux experts et chercheurs bien connus � l'Universit� de New York ont mis en place des m�canismes de coop�ration en profondeur, afin de mieux la recherche technologique de renseignement de prise de d�cision et la recherche de pointe � la fois unifient sc�ne d'atterrissage commerciaux.

AI Technology Review: Derni�re question, vous devez travailler pendant de longues p�riodes � Ali, alors vous laisser ce disque d'entreprise Ali et la vision?

Yuan Quan: � partir de 2006, je recommandations personnalis�es, principalement dans la recherche et articles publi�s dans IBM ont domin� les cinq ou six premi�res ann�es. Ali a ensuite rejoint en 2012, � gauche en 2017, merci Ali plate-forme, permettez-moi de mettre l'algorithme pass�, les syst�mes de recommandation exp�rience pour compl�ter l'application sur la plate-forme. Produits du t�l�phone Taobao, Lynx, puis double 11 projets ont utilis� avec succ�s vers le haut. De moi personnellement, je vous remercie beaucoup la plate-forme Ali, une �tape pour r�aliser leurs propres objectifs et de la mission.

D�cid� � partir, parce que je pense que dans une direction, apr�s plus d'une d�cennie � faire, vous pouvez venir temporairement � une fin. Et nous voyons AlphaGo repr�sent� par la nouvelle technologie, ainsi que derri�re le r�ve des entreprises comme DeepMind. Je pense donc que notre �quipe peut aussi essayer de nouvelles techniques et des choses nobles. est appel� Kai Yuan monde, les Anglais le nom de notre soci�t� appel�e Inspir.AI, dans l'espoir d'inspirer plus de gens � utiliser AI. Par exemple, dans des sc�nes virtuelles dans ce jeu, vous pouvez aider les gens � faire un meilleur soutien � la d�cision, et donne la fourniture cr�ative et pr�cieux, m�me inspirer les gens � faire.

nous esp�rons l'esprit de d�butant, construire Intelligence, cr�er de prise de d�cision intelligente, mondes Incuber, pour construire un monde parall�le, tels que divers jeux virtuels, des sc�nes virtuelles, et m�me VR combine des mondes parall�les, inspirer les gens, la prise de d�cision intelligente en aidant les gens pour stimuler la cr�ativit� des gens.

Le mois dernier, le p�re de l'apprentissage Richard Sutton renforcer notre entreprise pour l'inscription � Pour inspir.ai, Laissez-nous tous �tre inspir�s! � est le meilleur encouragement pour nous!

Route de la soie

Apprenez � conna�tre la Chine

Inspir� par la profondeur de l'apprentissage de renforcement + intelligente D�CISIONNEL humaine, il y a une interview accord�e � la vision des entreprises chinoises, � Kai Yuan monde. �

Cliquez sur Lire l'original Pour voir la premi�re partie de l'agent AI auto-apprentissage: processus de d�cision de Markov