Après avoir été acquis par Microsoft, Maluuba a commencé à étudier l'apprentissage de renforcement machine multi-boot

Maluuba à Montréal (Canada ville portuaire sud-est), est une société de démarrage de l'intelligence artificielle du Canada, a été acquise par Microsoft au début de cette année. Lei Feng réseau a appris que les entreprises de démarrage et son équipe de recherche pour développer un outil de renseignement de la machine plus supérieure pour analyser le texte non structuré, ce qui rend l'interaction informatique plus naturelle. L'équipe a récemment terminé leurs débuts « Apprentissage par renforcement multi-conseiller », qui est au centre de l'équipe il y a quelque temps.

Son article a souligné le « apprentissage par renforcement machine multi-boot (apprentissage de renforcement multi-conseiller) » théorie, le problème encore plus bas simple et facile à calculer. En outre, la société Maluuba mène une tentative active pour usiner un certain nombre de compétences en leadership de l'église. Afin de résoudre le difficile problème du passé.

Quels sont les problèmes à résoudre?

Rigide, l'interface homme-machine est toujours incapable de surmonter le problème, et cette interaction est sujette à diverses questions. Lei Feng réseau a appris que bien que le leader de l'industrie Siri, Alexa et Cortana a largement dépassé le système de dialogue précédent, mais ils présentent intelligents et encore loin de l'intelligence humaine ordinaire.

Si nous commençons à partir d'un ordinateur, pensant que la capacité maximale du système peut avoir, nous pouvons comprendre: dans la mesure du possible pour accueillir même un modèle du système complet, ne suffit pas de remplacer les ingénieurs de créer des outils intelligents besoins spécifiques, mais seulement d'avoir une bonne performance dans certains limitée. C'est la raison pour laquelle vous pouvez commander Siri pour vous aider à appeler, mais ne peut pas l'obliger à organiser un grand dîner.

Apprentissage par renforcement (apprentissage de renforcement, branche d'apprentissage de la machine) depuis été proposé, une grande attention des chercheurs intelligents. Comme décrit précédemment, le renforcement apprendre de nouvelles idées du concept pratique des économistes, et de continuer à tenter de quantifier et d'évaluer et de décisions rendues à plusieurs reprises. Un « jeu » des mécanismes pour faire face au problème, et définir graphiquement des systèmes intelligents peut être optimisé « noeud », ce système intelligent peut être améliorée, plutôt que directement avec toutes les règles définies pour la voiture automatique. Lorsque le conducteur dépasse les doubles lignes jaunes, le système peut jeter dynamiquement certains des noeuds, lorsque le système est maintenu dans une vitesse définie, le système peut avoir conservé certains des noeuds ajoutés. Cette idée peut fournir des systèmes plus d'adaptation, mais cela reste une question très complexe, une grande quantité de calcul nécessaire. Ainsi, la machine d'apprentissage par renforcement viendra multiboot résoudre habilement ces problèmes.

Résolution de problèmes

Pour l'apprentissage par renforcement, Maluuba essayer de résoudre ces questions complexes. Leur approche consiste à utiliser le concept de multiples « guide » ( « conseillers ») pour briser le problème, et la réduction modulaire. L'algorithme d'apprentissage de renforcement traditionnel en utilisant une méthode d'apprentissage de renforcement seul agent (agent) (renforcement unique agent), mais les derniers algorithmes multi-agents ont beaucoup plus commun.

Dans une interview Maluuba, l'équipe présente un cas sur assistant de planification intelligente. Pourraient un jour, des algorithmes intelligents attribuera différents niveaux de rencontrer un agent différent, plutôt que l'algorithme d'apprentissage unique agent pour organiser le meilleur de chaque agenda de la réunion.

La difficulté est de savoir comment mobiliser tous les organes de renseignement coopèrent entre eux.

Méthodes Maluuba première pensée est d'obtenir ces smart comme un problème de décomposition du corps humain. Et que les gens de ce travail collaboratif est efficace pas un petit projet, même si l'idée de diviser pour régner peut parfois dépasser les décisions d'une seule main. Par conséquent, la solution est de permettre agrégateurs (aggrégateur) assis au-dessus de tout le « leader » dans la prise de décisions. En papier Maluuba, un guide pour tous les problèmes majeurs à résoudre aura des priorités différentes. Si le guide qui détiennent différents points de vue, l'aggrégateur défendra l'arbitrage.

Maluuba Mme Pac-Man avec une version simplifiée de la conception du programme Pac-Boy, plusieurs tests pour différents guide d'apprentissage renforcé la théorie de la structure polymère. L'équipe est désireux d'apprendre comment le problème efficace de décomposition humaine. En outre, comment organiser et gérer de nombreux meilleurs aggrégateur, il y a aussi quelques méthodes communes dans le cas idéal. Voilà pourquoi l'équipe est enthousiaste à ce sujet. Ils ont donc décidé de laisser la machine d'apprentissage « 101 menant droit (direction 101) ».

Multi renforcer les avantages de l'apprentissage quoi?

Machine d'apprentissage multi-renforcement peut considérablement améliorer l'efficacité de calcul de la CPU et le GPU. Une telle rupture est calculée en même temps rend également goulot d'étranglement multi-serveur informatique parallèle devient plus facile à mettre en uvre. Réduire la complexité de calcul est les scientifiques du monde entier étudient à renforcer une clé lors de l'apprentissage. L'équipe de recherche a déclaré que les problèmes associés au développement de Microsoft jusqu'à présent. Microsoft ouvre la plate-forme cloud Azure, construire un canal pour l'échange de l'équipe d'apprentissage de la machine. Lorsque le fonctionnement, Maluuba jouera un rôle important Azure dans le domaine de l'analyse de texte linguistique.

Bien que pas un nouveau concept pour renforcer l'apprentissage lui-même, Maluuba en elle a consacré beaucoup de ressources. les membres de l'équipe sans aucun doute, l'équipe a connu un grand renforcement du potentiel d'apprentissage démontré dans le développement AlphaGo DeepMind des projets de recherche communs futurs conduira à d'améliorer l'apprentissage plus efficace et plus souple. Peut-être que cela apportera davantage d'utilisateurs aux produits orientés session-Microsoft.

via Techcrunch, Lei Feng réseau

En attendant la suite? « Honte » roman graphique vous ramène à Dayton Waugh
Précédent
Sophie Marceau: femme dans le monde, il lui est plus belle et téméraire!
Prochain
Mars « économie spectacle » feu West St. jeune mise à niveau de la force de tours de poudre
Distressed Di! « Pirates des Caraïbes 5 » vol des ressources, les pirates extorquer une énorme rançon à Disney
Google a publié des bourses de doctorat, dont sept étudiants chinois élus à cet honneur?
Meng peut être insignifiante, boue beau cheval, ne pouvait pas arrêter ah
M. Yu aux autorités de la Fédération des femmes de Chine a présenté ses excuses aux compatriotes féminines: profondément troublé et le remords
BMW ReachNow expansion des entreprises, la mise en place du réseau haut de gamme sur le service de voiture à Chengdu | ligne de voiture Nouvelles
2019 Nintendo fera face à leur premier résumé complet: Le nouveau « Legend of Zelda » est venu, ainsi que 20 nouveaux débuts de jeux
Hideki Kamiya vous dire 15 pression spéciale, pourquoi « 3 Bayonetta » est le commutateur exclusif
« Lutte maintenant! Papa « au box-office casser 400 millions, coupé 20 minutes afin qu'il y ait des secrets cachés
Burst! Chengdu soupçonné type de Lovesick mis en ligne en direct sur le toit
Sous l'éducation « Cet écran » Quelle imagination?
Est devenu populaire en raison de cheveux épais, cette jeune fille japonaise âgée de 1 an par les cheveux pour gagner à la ligne de départ de la vie ......