Apr�s avoir �t� acquis par Microsoft, Maluuba a commenc� � �tudier l'apprentissage de renforcement machine multi-boot

Maluuba � Montr�al (Canada ville portuaire sud-est), est une soci�t� de d�marrage de l'intelligence artificielle du Canada, a �t� acquise par Microsoft au d�but de cette ann�e. Lei Feng r�seau a appris que les entreprises de d�marrage et son �quipe de recherche pour d�velopper un outil de renseignement de la machine plus sup�rieure pour analyser le texte non structur�, ce qui rend l'interaction informatique plus naturelle. L'�quipe a r�cemment termin� leurs d�buts � Apprentissage par renforcement multi-conseiller �, qui est au centre de l'�quipe il y a quelque temps.

Son article a soulign� le � apprentissage par renforcement machine multi-boot (apprentissage de renforcement multi-conseiller) � th�orie, le probl�me encore plus bas simple et facile � calculer. En outre, la soci�t� Maluuba m�ne une tentative active pour usiner un certain nombre de comp�tences en leadership de l'�glise. Afin de r�soudre le difficile probl�me du pass�.

Quels sont les probl�mes � r�soudre?

Rigide, l'interface homme-machine est toujours incapable de surmonter le probl�me, et cette interaction est sujette � diverses questions. Lei Feng r�seau a appris que bien que le leader de l'industrie Siri, Alexa et Cortana a largement d�pass� le syst�me de dialogue pr�c�dent, mais ils pr�sentent intelligents et encore loin de l'intelligence humaine ordinaire.

Si nous commen�ons � partir d'un ordinateur, pensant que la capacit� maximale du syst�me peut avoir, nous pouvons comprendre: dans la mesure du possible pour accueillir m�me un mod�le du syst�me complet, ne suffit pas de remplacer les ing�nieurs de cr�er des outils intelligents besoins sp�cifiques, mais seulement d'avoir une bonne performance dans certains limit�e. C'est la raison pour laquelle vous pouvez commander Siri pour vous aider � appeler, mais ne peut pas l'obliger � organiser un grand d�ner.

Apprentissage par renforcement (apprentissage de renforcement, branche d'apprentissage de la machine) depuis �t� propos�, une grande attention des chercheurs intelligents. Comme d�crit pr�c�demment, le renforcement apprendre de nouvelles id�es du concept pratique des �conomistes, et de continuer � tenter de quantifier et d'�valuer et de d�cisions rendues � plusieurs reprises. Un � jeu � des m�canismes pour faire face au probl�me, et d�finir graphiquement des syst�mes intelligents peut �tre optimis� � noeud �, ce syst�me intelligent peut �tre am�lior�e, plut�t que directement avec toutes les r�gles d�finies pour la voiture automatique. Lorsque le conducteur d�passe les doubles lignes jaunes, le syst�me peut jeter dynamiquement certains des noeuds, lorsque le syst�me est maintenu dans une vitesse d�finie, le syst�me peut avoir conserv� certains des noeuds ajout�s. Cette id�e peut fournir des syst�mes plus d'adaptation, mais cela reste une question tr�s complexe, une grande quantit� de calcul n�cessaire. Ainsi, la machine d'apprentissage par renforcement viendra multiboot r�soudre habilement ces probl�mes.

R�solution de probl�mes

Pour l'apprentissage par renforcement, Maluuba essayer de r�soudre ces questions complexes. Leur approche consiste � utiliser le concept de multiples � guide � ( � conseillers �) pour briser le probl�me, et la r�duction modulaire. L'algorithme d'apprentissage de renforcement traditionnel en utilisant une m�thode d'apprentissage de renforcement seul agent (agent) (renforcement unique agent), mais les derniers algorithmes multi-agents ont beaucoup plus commun.

Dans une interview Maluuba, l'�quipe pr�sente un cas sur assistant de planification intelligente. Pourraient un jour, des algorithmes intelligents attribuera diff�rents niveaux de rencontrer un agent diff�rent, plut�t que l'algorithme d'apprentissage unique agent pour organiser le meilleur de chaque agenda de la r�union.

La difficult� est de savoir comment mobiliser tous les organes de renseignement coop�rent entre eux.

M�thodes Maluuba premi�re pens�e est d'obtenir ces smart comme un probl�me de d�composition du corps humain. Et que les gens de ce travail collaboratif est efficace pas un petit projet, m�me si l'id�e de diviser pour r�gner peut parfois d�passer les d�cisions d'une seule main. Par cons�quent, la solution est de permettre agr�gateurs (aggr�gateur) assis au-dessus de tout le � leader � dans la prise de d�cisions. En papier Maluuba, un guide pour tous les probl�mes majeurs � r�soudre aura des priorit�s diff�rentes. Si le guide qui d�tiennent diff�rents points de vue, l'aggr�gateur d�fendra l'arbitrage.

Maluuba Mme Pac-Man avec une version simplifi�e de la conception du programme Pac-Boy, plusieurs tests pour diff�rents guide d'apprentissage renforc� la th�orie de la structure polym�re. L'�quipe est d�sireux d'apprendre comment le probl�me efficace de d�composition humaine. En outre, comment organiser et g�rer de nombreux meilleurs aggr�gateur, il y a aussi quelques m�thodes communes dans le cas id�al. Voil� pourquoi l'�quipe est enthousiaste � ce sujet. Ils ont donc d�cid� de laisser la machine d'apprentissage � 101 menant droit (direction 101) �.

Multi renforcer les avantages de l'apprentissage quoi?

Machine d'apprentissage multi-renforcement peut consid�rablement am�liorer l'efficacit� de calcul de la CPU et le GPU. Une telle rupture est calcul�e en m�me temps rend �galement goulot d'�tranglement multi-serveur informatique parall�le devient plus facile � mettre en uvre. R�duire la complexit� de calcul est les scientifiques du monde entier �tudient � renforcer une cl� lors de l'apprentissage. L'�quipe de recherche a d�clar� que les probl�mes associ�s au d�veloppement de Microsoft jusqu'� pr�sent. Microsoft ouvre la plate-forme cloud Azure, construire un canal pour l'�change de l'�quipe d'apprentissage de la machine. Lorsque le fonctionnement, Maluuba jouera un r�le important Azure dans le domaine de l'analyse de texte linguistique.

Bien que pas un nouveau concept pour renforcer l'apprentissage lui-m�me, Maluuba en elle a consacr� beaucoup de ressources. les membres de l'�quipe sans aucun doute, l'�quipe a connu un grand renforcement du potentiel d'apprentissage d�montr� dans le d�veloppement AlphaGo DeepMind des projets de recherche communs futurs conduira � d'am�liorer l'apprentissage plus efficace et plus souple. Peut-�tre que cela apportera davantage d'utilisateurs aux produits orient�s session-Microsoft.

via Techcrunch, Lei Feng r�seau

Route de la soie

Apprenez � conna�tre la Chine

Apr�s avoir �t� acquis par Microsoft, Maluuba a commenc� � �tudier l'apprentissage de renforcement machine multi-boot

Quels sont les probl�mes � r�soudre?

R�solution de probl�mes

Multi renforcer les avantages de l'apprentissage quoi?