Evénements | Association chinoise de l'automatisation, « la profondeur et la largeur de l'apprentissage par renforcement » Symposium frontière

Comment donner à la machine la capacité d'auto-apprentissage a été un sujet brûlant dans le domaine de l'intelligence artificielle. Dans un nombre croissant de tâches complexes dans des scénarios de la vie réelle, il nécessite l'utilisation de l'apprentissage en profondeur, la largeur de l'étude à grande échelle la caractérisation abstraite des données d'entrée pour apprendre et utiliser automatiquement la caractérisation auto-motivation basée sur l'apprentissage par renforcement, la stratégie d'optimisation pour résoudre le problème. La profondeur et la largeur de la technologie d'apprentissage de renforcement dans le jeu, le contrôle du robot, l'optimisation des paramètres, des applications réussies de vision de la machine en ce qu'il est considéré comme un moyen important vers l'intelligence artificielle de universelle.

Chine Automatisation Société sera le 31 mai,, 2018-1 Juin, les ateliers de frontière tenus dans l'automatisation n ° 5 à l'Institut d'automatisation intelligente thème « la profondeur et la largeur de l'apprentissage de renforcement », l'atelier par l'automatisation chinoise société, vice-président, professeur de l'Université de Macao et professeur de l'Université de Tsinghua chanson Shiji Chen Junlong servent de co-directeur académique.

invité spécial

Chen Junlong

Professeur de l'Université de Macao, vice-président de l'Association chinoise de l'automatisation

État 1000 chercheurs, Fellow de l'IEEE, AAAS Fellow, IAPR Compagnons

Titre: L'apprentissage de la profondeur à la largeur de l'apprentissage de renforcement de renforcement: structures, algorithmes, opportunités et défis

Résumé: Ce groupe de discussion pour renforcer la structure et l'étude théorique, y compris le processus de décision de Markov, renforcer l'apprentissage des expressions mathématiques, des stratégies de construction, des estimations et des projections des rendements futurs. Nous allons discuter de la façon de stabiliser le processus d'apprentissage et l'apprentissage extraction de caractéristiques, apprendre à utiliser la largeur de la structure avec l'apprentissage combiné avec le renforcement de la profondeur du réseau de neurones. Enfin, nous allons discuter de la profondeur, la largeur de renforcer les possibilités d'apprentissage et défis posés.

chanson Shiji

Université de Tsinghua Professeur, Ph.D.

État CIMS Centre de recherche en génie

Titre: robot de recherche intelligente en haute mer et méthode de commande de mouvement basé sur l'apprentissage par renforcement

Résumé: Dans cet article, renforcer l'algorithme d'apprentissage et son application dans robot de recherche intelligente mer profonde pour le contrôle de mouvement, la recherche intelligente de panaches hydrothermaux et le mouvement robot de haute mer contrôle deux aspects de ses travaux. En termes de panache hydrothermal recherche intelligente, algorithme Cheminement d'étude basé sur l'apprentissage et de renforcement des panaches de réseau récursives. L'utilisation du champ d'écoulement hydrothermale et de l'information signal recueilli par le capteur, le robot va traiter la recherche de sources hydrothermales modélisé comme un comportement dans le domaine de l'état continu processus de décision de Markov, le titre de la stratégie de contrôle optimale du robot par un renforcement algorithme d'apprentissage. Dans la commande de mouvement de robot-mer profonde, basée sur la recherche trajectographie et des algorithmes d'apprentissage par renforcement optimaux de contrôle de profondeur. Dans le modèle du système de robot est inconnu, le problème de contrôle modélisé comme un espace d'action de l'État continue de processus de décision de Markov et les réseaux d'évaluation de la construction et des stratégies de réseau, la politique de contrôle optimal par l'incertitude politique et l'apprentissage des réseaux de neurones.

Hou Zhongsheng

Pékin Jiaotong professeur de l'Université, Ph.D.

Université Jiaotong de Beijing, Département du contrôle automatique

Titre: Les données d'apprentissage adaptatif de contrôle de conduite

Résumé: Ce rapport est divisé en quatre parties: Partie 1 décrit l'arbre de commande d'apprentissage itératif Partie 2 décrit l'étude sur le contrôle de l'axe temporel, ni contrôle adaptatif modèle, Partie 3 décrit le contrôle d'apprentissage cadre unifié, la partie 4 conclut.

Zhaodong Bin

Institut de l'automatisation, Académie chinoise des sciences, Ph.D.

Professeurs de l'Université de l'Académie chinoise des sciences

Titre: profondeur des algorithmes d'apprentissage de renforcement et applications

Résumé: mise en place d'un apprentissage par renforcement la capacité « de prise de décision » (RL: apprentissage par renforcement) et un apprentissage en profondeur (DL: apprentissage en profondeur) capacités « au courant » se combinent pour former la profondeur de l'apprentissage de renforcement (DRL: Deep RL) méthode, être artificielle l'une des méthodes principales: intelligente (intelligence artificielle AI). En 2013, l'équipe Google DeepMind est venu avec une méthode DRL de classe, l'effet sur l'approche du jeu vidéo ou dépassent les joueurs humains, publié en 2015 « Nature ». 2016, ont été publiés sur la base DRL Go algorithme développé AlphaGo à 5: 0 victoire sur les champions d'Europe Go Go et les joueurs super-classe Shishi, le niveau Go AI a atteint une hauteur sans précédent. Au début de 2017, AlphaGo programme de mise à niveau Master, avec 60 joueurs haut de l'homme Go obtiennent jeu sans défaite. Octobre 2017, l'équipe a fait DeepMind AlphaGo Zero, complètement sans jeux Go humains et gagner le plus haut niveau de AlphaGo, encore une fois pour rafraîchir la compréhension des gens. Alpha algorithme zéro et autre forme une commune, plus que la plupart d'échecs en haut et au Japon Shogi AI. applications DRL dans les jeux vidéo, jeux de société, pilote automatique, médical et autres augmente. Ce rapport décrit l'apprentissage de renforcement, l'apprentissage en profondeur et la profondeur de l'algorithme d'apprentissage de renforcement, ainsi que des applications typiques dans divers domaines.

Chen Dong Pa

professeur de l'Université Xi'an Jiaotong, Ph.D.

Professeur de la province du Shaanxi « Cent Talents »

Titre: filtre adaptatif nucléaire largeur d'apprentissage

Résumé: filtre adaptatif nucléaire (Filtres noyau adaptatif) est un filtre adaptatif non linéaire mis en uvre dans un espace de Hilbert renouvelable nucléaire (RKHS seront) à la hausse au cours des dernières années où la topologie d'une seule croissance linéaire la couche cachée du réseau neuronal. L'idée de base est la suivante: En premier lieu, le signal d'entrée est mis en correspondance dans un espace de noyau dimensionnelle élevée, et la dérivation d'un algorithme de filtrage linéaire dans l'espace du noyau, et enfin, l'utilisation de techniques nucléaires (Trick Kernel) pour obtenir un signal original dans un algorithme de filtrage spatial non linéaire. Par rapport à un filtre linéaire classique, le noyau de filtre adaptatif présente les avantages suivants: (a) si le noyau sélectionné Mercer strictement définie positive, ayant une capacité d'approximation universelle; (b) une surface incurvée ayant des propriétés de convexité dans l'espace du noyau dimensionnelle élevée, ainsi théoriquement extrema non local; (c) généré par le conducteur de données des noeuds cachés, ce qui réduit l'intervention manuelle; (d) ayant l'auto-régularité (auto-régularisation), peut prévenir efficacement surajustement. Par conséquent, après le concept de filtrage adaptatif nucléaire proposé a suscité un grand intérêt des chercheurs nationaux et étrangers, de plus en plus des algorithmes pertinents ont été proposées et appliquées dans de nombreux domaines. largeur de filtre adaptatif nucléaire et l'augmentation récente de l'apprentissage (apprentissage Broad) près, la largeur peut être considéré comme un procédé d'apprentissage de base de l'algorithme. Ce rapport plus exposé systématique de l'idée de base de filtrage adaptatif nucléaire, l'algorithme principal, analyse des performances, des applications typiques, et la façon d'apprendre et de la largeur dans un cadre unifié.

Liu Yong

Zhejiang University Professeur, Ph.D.

Université du Zhejiang est à la recherche de jeunes chercheurs

Titre: l'apprentissage en profondeur et son application dans la perception de l'environnement du robot de régularisation

Résumé: Au cours des dernières années, avec le développement rapide de l'intelligence artificielle de la technologie de réseau de neurones en profondeur et difficile problème de l'analyse de l'image, la reconnaissance vocale, la compréhension du langage naturel, etc., ont fait une application très importante des résultats. Cependant, l'application de la technologie dans le domaine de la perception du robot est encore relativement immature, principalement en raison de l'apprentissage en profondeur nécessite souvent beaucoup d'échantillons de formation pour éviter surajustement, d'améliorer la capacité de généralisation, ce qui réduit l'erreur de généralisation sur l'échantillon d'essai, la connaissance de la situation du robot et des tâches environnementales impliquées avec des caractéristiques différentes, et est fortement dépendante des plates-formes matérielles du robot, ce qui rend difficile pour chaque tâche de perception du robot de fournir un grand nombre indiqué dans le catalogue, deuxièmement, la solution est non seulement problème mal posé, même fournir beaucoup de formation données, il est difficile de fournir une méthode d'apprentissage en profondeur sur les données de test sur l'estimation, la distance de la tâche robot de conscience impliqué la reconstruction du modèle d'estimation est un problème typique tels que problème mal posé, qui ne contient pas suffisamment d'informations est entrée à une sortie unique correspondant à . En réponse à ces problèmes, le rapport afin d'améliorer la profondeur de l'apprentissage capacité de généralisation comme objectif, pour intégrer la méthode de régularisation connaissances préalables comme un moyen pour l'introduction élargi robot de fond application sensible au contexte.

Xu Xin

professeur de l'Université nationale de la Défense, Ph.D.

Défense Science et technologie remarquables jeunes talents

Titre: optimisation auto-évaluation fonction de contrôle d'apprentissage représentation et roulant

Yang Ying

voiture chinoise en chef expert, ingénieur principal

La Zhuzhou Electric Locomotive Co., Ltd, ingénieur en chef adjoint

Titre: Application des véhicules ferroviaires Pronostics et gestion de la santé (PHM)

saison ensoleillée

Université de Tsinghua Professeur, Ph.D.

Fonds national des sciences de la jeunesse exceptionnelle gagnant

Titre: Apprentissage par renforcement et le contrôle intelligent et décision

Direction amis Visite

Tsinghua University Professeur agrégé, Ph.D.

Jeunesse excellente nationale, des milliers nationaux de la jeunesse

Titre: algorithmes d'optimisation distribuée et de l'apprentissage

inscription

  • Le premier atelier a rapporté 200 personnes, a rapporté premier servi;

  • A partir de maintenant jusqu'au 29 mai 2018 (inclus) code de balayage micro-canal pour ajouter du personnel ou appeler l'application consultatif.

contact

Chou / professeur Xin

Téléphone: 010-62522472

Téléphone: 18811748370

E-mail: caa_assia@163.com

Balayer le micro-canal, ajouter du personnel

Oui, nous recrutons des gens, pour savoir?

algorithme principal BAT ingénieur un cours de développement exclusif

Les plus proche de la vie et le travail de fonctionnement pratique ludique du projet

Gestion de la classe assistant étudiant avec le Q & A professionnel

Appliquer leurs connaissances pour prendre l'offre, à savoir l'achèvement recommande l'emploi

Cliquez pour lire le code ou le texte d'analyse pour savoir!

(^ 0 ^) partage de bienvenue, à demain!

« Wolf 2 » et jours d'échange « action pour la mer Rouge », le box-office sera pire que celui-ci? Ne sous-estimez pas Wu Jing
Précédent
Ultra Boost 3.0 l'intention de commencer à vous ici, la version quatre générations présentes vente immédiatement marqué le début!
Prochain
Mercedes super-course la plus forte! Tir réel AMG projet ONE
Samsung Galaxy A8s sorti: écran Creuser + 710 + Xiaolong après trois photo à domicile
Pariez sur commande électrique et des composants clés automatiques, la deuxième génération de rappel de renseignement intérieur Bosch iBooster
Xia a gagné des dizaines de millions d'investissements, faire industrie cinématographique « Lanxiang + New Oriental » Shu Interview
Huawei 20 maté et les prix sont rendus exposés, le minimum devrait être de 5.500 yuans!
Apple étaient la transformation la plus importante, répondre à un réseau et des pièces sur les conducteurs de camions ont été tués, trois principaux transporteurs nationaux pour l'attitude d'investis
Le riz rouge Note 5 configuration, le prix du mil de 8! Nokia 7.1 officiellement publié
top box-office actrice de film de Chine, Fan Bingbing a battu Li Yuchun, le troisième film Gods
Glory a publié trois nouvelles technologies: hors communication, écran, champ de la caméra de nouvelle révolution
Une technologie intelligente balayant un million de voitures électriques: la logique derrière l'interprétation des dimensions techniques et commerciales
Vous voulez commencer INVINCIBLE x VOISINAGE S'il vous plaît noter! Détails de l'offre voir ici!
Dynamic | AI de 10 à la liste Watch a été publié, South Yu Yang, Tencent AI Lab, NTU Bo et d'autres chercheurs chinois élus