Ev�nements | Association chinoise de l'automatisation, � la profondeur et la largeur de l'apprentissage par renforcement � Symposium fronti�re

Comment donner � la machine la capacit� d'auto-apprentissage a �t� un sujet br�lant dans le domaine de l'intelligence artificielle. Dans un nombre croissant de t�ches complexes dans des sc�narios de la vie r�elle, il n�cessite l'utilisation de l'apprentissage en profondeur, la largeur de l'�tude � grande �chelle la caract�risation abstraite des donn�es d'entr�e pour apprendre et utiliser automatiquement la caract�risation auto-motivation bas�e sur l'apprentissage par renforcement, la strat�gie d'optimisation pour r�soudre le probl�me. La profondeur et la largeur de la technologie d'apprentissage de renforcement dans le jeu, le contr�le du robot, l'optimisation des param�tres, des applications r�ussies de vision de la machine en ce qu'il est consid�r� comme un moyen important vers l'intelligence artificielle de universelle.

Chine Automatisation Soci�t� sera le 31 mai,, 2018-1 Juin, les ateliers de fronti�re tenus dans l'automatisation n � 5 � l'Institut d'automatisation intelligente th�me � la profondeur et la largeur de l'apprentissage de renforcement �, l'atelier par l'automatisation chinoise soci�t�, vice-pr�sident, professeur de l'Universit� de Macao et professeur de l'Universit� de Tsinghua chanson Shiji Chen Junlong servent de co-directeur acad�mique.

invit� sp�cial

Chen Junlong

Professeur de l'Universit� de Macao, vice-pr�sident de l'Association chinoise de l'automatisation

�tat 1000 chercheurs, Fellow de l'IEEE, AAAS Fellow, IAPR Compagnons

Titre: L'apprentissage de la profondeur � la largeur de l'apprentissage de renforcement de renforcement: structures, algorithmes, opportunit�s et d�fis

R�sum�: Ce groupe de discussion pour renforcer la structure et l'�tude th�orique, y compris le processus de d�cision de Markov, renforcer l'apprentissage des expressions math�matiques, des strat�gies de construction, des estimations et des projections des rendements futurs. Nous allons discuter de la fa�on de stabiliser le processus d'apprentissage et l'apprentissage extraction de caract�ristiques, apprendre � utiliser la largeur de la structure avec l'apprentissage combin� avec le renforcement de la profondeur du r�seau de neurones. Enfin, nous allons discuter de la profondeur, la largeur de renforcer les possibilit�s d'apprentissage et d�fis pos�s.

chanson Shiji

Universit� de Tsinghua Professeur, Ph.D.

�tat CIMS Centre de recherche en g�nie

Titre: robot de recherche intelligente en haute mer et m�thode de commande de mouvement bas� sur l'apprentissage par renforcement

R�sum�: Dans cet article, renforcer l'algorithme d'apprentissage et son application dans robot de recherche intelligente mer profonde pour le contr�le de mouvement, la recherche intelligente de panaches hydrothermaux et le mouvement robot de haute mer contr�le deux aspects de ses travaux. En termes de panache hydrothermal recherche intelligente, algorithme Cheminement d'�tude bas� sur l'apprentissage et de renforcement des panaches de r�seau r�cursives. L'utilisation du champ d'�coulement hydrothermale et de l'information signal recueilli par le capteur, le robot va traiter la recherche de sources hydrothermales mod�lis� comme un comportement dans le domaine de l'�tat continu processus de d�cision de Markov, le titre de la strat�gie de contr�le optimale du robot par un renforcement algorithme d'apprentissage. Dans la commande de mouvement de robot-mer profonde, bas�e sur la recherche trajectographie et des algorithmes d'apprentissage par renforcement optimaux de contr�le de profondeur. Dans le mod�le du syst�me de robot est inconnu, le probl�me de contr�le mod�lis� comme un espace d'action de l'�tat continue de processus de d�cision de Markov et les r�seaux d'�valuation de la construction et des strat�gies de r�seau, la politique de contr�le optimal par l'incertitude politique et l'apprentissage des r�seaux de neurones.

Hou Zhongsheng

P�kin Jiaotong professeur de l'Universit�, Ph.D.

Universit� Jiaotong de Beijing, D�partement du contr�le automatique

Titre: Les donn�es d'apprentissage adaptatif de contr�le de conduite

R�sum�: Ce rapport est divis� en quatre parties: Partie 1 d�crit l'arbre de commande d'apprentissage it�ratif Partie 2 d�crit l'�tude sur le contr�le de l'axe temporel, ni contr�le adaptatif mod�le, Partie 3 d�crit le contr�le d'apprentissage cadre unifi�, la partie 4 conclut.

Zhaodong Bin

Institut de l'automatisation, Acad�mie chinoise des sciences, Ph.D.

Professeurs de l'Universit� de l'Acad�mie chinoise des sciences

Titre: profondeur des algorithmes d'apprentissage de renforcement et applications

R�sum�: mise en place d'un apprentissage par renforcement la capacit� � de prise de d�cision � (RL: apprentissage par renforcement) et un apprentissage en profondeur (DL: apprentissage en profondeur) capacit�s � au courant � se combinent pour former la profondeur de l'apprentissage de renforcement (DRL: Deep RL) m�thode, �tre artificielle l'une des m�thodes principales: intelligente (intelligence artificielle AI). En 2013, l'�quipe Google DeepMind est venu avec une m�thode DRL de classe, l'effet sur l'approche du jeu vid�o ou d�passent les joueurs humains, publi� en 2015 � Nature �. 2016, ont �t� publi�s sur la base DRL Go algorithme d�velopp� AlphaGo � 5: 0 victoire sur les champions d'Europe Go Go et les joueurs super-classe Shishi, le niveau Go AI a atteint une hauteur sans pr�c�dent. Au d�but de 2017, AlphaGo programme de mise � niveau Master, avec 60 joueurs haut de l'homme Go obtiennent jeu sans d�faite. Octobre 2017, l'�quipe a fait DeepMind AlphaGo Zero, compl�tement sans jeux Go humains et gagner le plus haut niveau de AlphaGo, encore une fois pour rafra�chir la compr�hension des gens. Alpha algorithme z�ro et autre forme une commune, plus que la plupart d'�checs en haut et au Japon Shogi AI. applications DRL dans les jeux vid�o, jeux de soci�t�, pilote automatique, m�dical et autres augmente. Ce rapport d�crit l'apprentissage de renforcement, l'apprentissage en profondeur et la profondeur de l'algorithme d'apprentissage de renforcement, ainsi que des applications typiques dans divers domaines.

Chen Dong Pa

professeur de l'Universit� Xi'an Jiaotong, Ph.D.

Professeur de la province du Shaanxi � Cent Talents �

Titre: filtre adaptatif nucl�aire largeur d'apprentissage

R�sum�: filtre adaptatif nucl�aire (Filtres noyau adaptatif) est un filtre adaptatif non lin�aire mis en uvre dans un espace de Hilbert renouvelable nucl�aire (RKHS seront) � la hausse au cours des derni�res ann�es o� la topologie d'une seule croissance lin�aire la couche cach�e du r�seau neuronal. L'id�e de base est la suivante: En premier lieu, le signal d'entr�e est mis en correspondance dans un espace de noyau dimensionnelle �lev�e, et la d�rivation d'un algorithme de filtrage lin�aire dans l'espace du noyau, et enfin, l'utilisation de techniques nucl�aires (Trick Kernel) pour obtenir un signal original dans un algorithme de filtrage spatial non lin�aire. Par rapport � un filtre lin�aire classique, le noyau de filtre adaptatif pr�sente les avantages suivants: (a) si le noyau s�lectionn� Mercer strictement d�finie positive, ayant une capacit� d'approximation universelle; (b) une surface incurv�e ayant des propri�t�s de convexit� dans l'espace du noyau dimensionnelle �lev�e, ainsi th�oriquement extrema non local; (c) g�n�r� par le conducteur de donn�es des noeuds cach�s, ce qui r�duit l'intervention manuelle; (d) ayant l'auto-r�gularit� (auto-r�gularisation), peut pr�venir efficacement surajustement. Par cons�quent, apr�s le concept de filtrage adaptatif nucl�aire propos� a suscit� un grand int�r�t des chercheurs nationaux et �trangers, de plus en plus des algorithmes pertinents ont �t� propos�es et appliqu�es dans de nombreux domaines. largeur de filtre adaptatif nucl�aire et l'augmentation r�cente de l'apprentissage (apprentissage Broad) pr�s, la largeur peut �tre consid�r� comme un proc�d� d'apprentissage de base de l'algorithme. Ce rapport plus expos� syst�matique de l'id�e de base de filtrage adaptatif nucl�aire, l'algorithme principal, analyse des performances, des applications typiques, et la fa�on d'apprendre et de la largeur dans un cadre unifi�.

Liu Yong

Zhejiang University Professeur, Ph.D.

Universit� du Zhejiang est � la recherche de jeunes chercheurs

Titre: l'apprentissage en profondeur et son application dans la perception de l'environnement du robot de r�gularisation

R�sum�: Au cours des derni�res ann�es, avec le d�veloppement rapide de l'intelligence artificielle de la technologie de r�seau de neurones en profondeur et difficile probl�me de l'analyse de l'image, la reconnaissance vocale, la compr�hension du langage naturel, etc., ont fait une application tr�s importante des r�sultats. Cependant, l'application de la technologie dans le domaine de la perception du robot est encore relativement immature, principalement en raison de l'apprentissage en profondeur n�cessite souvent beaucoup d'�chantillons de formation pour �viter surajustement, d'am�liorer la capacit� de g�n�ralisation, ce qui r�duit l'erreur de g�n�ralisation sur l'�chantillon d'essai, la connaissance de la situation du robot et des t�ches environnementales impliqu�es avec des caract�ristiques diff�rentes, et est fortement d�pendante des plates-formes mat�rielles du robot, ce qui rend difficile pour chaque t�che de perception du robot de fournir un grand nombre indiqu� dans le catalogue, deuxi�mement, la solution est non seulement probl�me mal pos�, m�me fournir beaucoup de formation donn�es, il est difficile de fournir une m�thode d'apprentissage en profondeur sur les donn�es de test sur l'estimation, la distance de la t�che robot de conscience impliqu� la reconstruction du mod�le d'estimation est un probl�me typique tels que probl�me mal pos�, qui ne contient pas suffisamment d'informations est entr�e � une sortie unique correspondant � . En r�ponse � ces probl�mes, le rapport afin d'am�liorer la profondeur de l'apprentissage capacit� de g�n�ralisation comme objectif, pour int�grer la m�thode de r�gularisation connaissances pr�alables comme un moyen pour l'introduction �largi robot de fond application sensible au contexte.

Xu Xin

professeur de l'Universit� nationale de la D�fense, Ph.D.

D�fense Science et technologie remarquables jeunes talents

Titre: optimisation auto-�valuation fonction de contr�le d'apprentissage repr�sentation et roulant

Yang Ying

voiture chinoise en chef expert, ing�nieur principal

La Zhuzhou Electric Locomotive Co., Ltd, ing�nieur en chef adjoint

Titre: Application des v�hicules ferroviaires Pronostics et gestion de la sant� (PHM)

saison ensoleill�e

Universit� de Tsinghua Professeur, Ph.D.

Fonds national des sciences de la jeunesse exceptionnelle gagnant

Titre: Apprentissage par renforcement et le contr�le intelligent et d�cision

Direction amis Visite

Tsinghua University Professeur agr�g�, Ph.D.

Jeunesse excellente nationale, des milliers nationaux de la jeunesse

Titre: algorithmes d'optimisation distribu�e et de l'apprentissage

inscription

Le premier atelier a rapport� 200 personnes, a rapport� premier servi;
A partir de maintenant jusqu'au 29 mai 2018 (inclus) code de balayage micro-canal pour ajouter du personnel ou appeler l'application consultatif.

contact

Chou / professeur Xin

T�l�phone: 010-62522472

T�l�phone: 18811748370

E-mail: caa_assia@163.com

Balayer le micro-canal, ajouter du personnel

Oui, nous recrutons des gens, pour savoir?

algorithme principal BAT ing�nieur un cours de d�veloppement exclusif

Les plus proche de la vie et le travail de fonctionnement pratique ludique du projet

Gestion de la classe assistant �tudiant avec le Q & A professionnel

Appliquer leurs connaissances pour prendre l'offre, � savoir l'ach�vement recommande l'emploi

Cliquez pour lire le code ou le texte d'analyse pour savoir!

(^ 0 ^) partage de bienvenue, � demain!

Route de la soie

Apprenez � conna�tre la Chine

Ev�nements | Association chinoise de l'automatisation, � la profondeur et la largeur de l'apprentissage par renforcement � Symposium fronti�re

invit� sp�cial

inscription

contact