Voir | gouttes AI Labs qui enseigne Yejie Ping: la recherche et la pratique en profondeur et des morceaux de l'apprentissage par renforcement

Technologie AI Revue de presse : 29 Juillet YOCSEF TDS � th�orie, algorithmes et applications profondeur de l'apprentissage par renforcement � rapport sp�cial explorera le succ�s du CAS Institute of Automation, Cet article pr�sente la premi�re conf�rence, haut-parleurs vice-pr�sident et pi�ces, AI Labs est responsable professeur qui Yejie Ping, un discours intitul� � l'apprentissage de renforcement en profondeur des gouttes d'exploration et de la pratique �, la technologie, Amnesty International des discours ont �t� ax�s sur la finition.

Selon les rapports, le courant chute plate-forme de demande de planification d'itin�raire quotidien de plus de 400 millions de fois par jour 100 add + TB de pistes de donn�es brutes, la quantit� quotidienne de traitement des donn�es pour le 4875 + TB. Massives pi�ces de grandes quantit�s de donn�es permettent �galement plus activement la recherche et la mise en page AI.

Selon le professeur Yejie Ping a pr�sent�, la strat�gie AI et la mise en page des pi�ces tournent autour de trois niveaux, le niveau le plus bas est la base d'algorithmes AI, tels que l'apprentissage de renforcement, des algorithmes d'apprentissage en profondeur, la couche interm�diaire est au cur m�me des pi�ces ont AI la technologie, telles que la voix, le traitement du langage naturel, l'image et ainsi de suite, et la couche sup�rieure est l'application de l'appui technologique AI - notamment en am�liorant le voyage de la plate-forme d'exp�rience utilisateur � l'innovation technologique, l'intelligence artificielle, grande technologie de donn�es de construction aide r�seau urbain de transport intelligent, la mise en page entra�nement intelligent et de nouveaux v�hicules de l'�nergie et d'autres domaines.

Professeur Ping Yejie a �galement introduit peu � peu le centre de prise de d�cision intelligente du cerveau. Tout d'abord, le service de cartographie du moteur de transaction est un des services essentiels de base, il y a deux services importants, est une planification de chemin, un autre est ETA (heure d'arriv�e). la planification de la trajectoire id�ale n�cessaire pour atteindre trois objectifs, on est de minimiser le co�t, la seconde est de maximiser la productivit� des conducteurs, le troisi�me est d'optimiser l'efficacit� du syst�me de transport. � l'heure actuelle, algorithme de Dijkstra et de l'algorithme Une �toile est le plus algorithme de planification de chemin commun. Afin de fournir un service plus efficace, un meilleur algorithme bas� sur Dijkstra est actuellement Contraction Hi�rarchies les solutions de l'industrie grand public. Service ETA peut �tre appliqu� � un certain nombre de t�ches, telles que le temps d'arriv�e pr�vue, le temps de Voyage estim� � l'avenir, fournit des services de base carte / navigation num�rique. D�connecte de l'ETA 2015 les solutions d'apprentissage machine auto-d�velopp�e, gr�ce � une it�ration constamment mis � jour, en utilisant principalement approche r�seau de neurones en profondeur, et con�u la profondeur cibl�e du r�seau de neurones - large et cycle d'apprentissage profond (Wide-Deep- apprentissage r�current), afin d'am�liorer encore la pr�cision pr�visions. algorithme de corr�lation pratique est aussi �crit � Apprendre � estimer le temps Voyage � papiers, l'exploration de donn�es est la conf�rence internationale haut KDD 2018 inclus.

Le professeur Didi Yejie Ping d�crit �galement la profondeur de la technologie d'apprentissage de renforcement utilis� intelligent pour envoyer un seul bit. Depuis la d�cision d'envoyer un seul pilote aura une incidence sur l'avenir de la distribution, et d'envoyer un seul n�cessaire de consid�rer le revenu des conducteurs, mais aussi pour prot�ger l'exp�rience utilisateur, compte tenu de ces deux exigences, le professeur Yejie Ping d�crit deux fa�ons de r�soudre les probl�mes d'envoyer une seule, une approche est MDP (processus de d�cision de Markov), l'autre est la profondeur de l'apprentissage par renforcement.

La premi�re est l'application du MDP, MDP en faction unique dans le divis� en deux parties, l'une est la ligne de processus de planification, le deuxi�me est le processus d'apprentissage off-line, qui combine les deux processus d'apprentissage et de renforcement optimisation combinatoire. En tenant compte de chaque match est influent dans l'avenir, de sorte que vous pouvez pr�dire le jour en fonction de l'offre et de la demande, le comportement de Voyage, d'examiner l'efficacit� globale du conducteur en un jour.

Hors ligne Apprentissage - �valuation des politiques

Programme en ligne - Fonction Avantages

Les r�sultats finaux montrent que bas� sur l'apprentissage de renforcement et de l'algorithme d'optimisation combinatoire peut envoyer une seule exp�rience de Voyage de passagers tout en assurant consid�rablement am�lior� le revenu des conducteurs. documents de pratique mod�les connexes seront �galement appuyer sur la partie sup�rieure KDD 2018 conf�rence dans les donn�es internationales publi�es sous forme orale.

La seconde consiste � introduire des m�thodes d'enseignement Yejie profondeur Ping de l'apprentissage par renforcement, la profondeur de l'apprentissage de renforcement pr�sente plusieurs avantages dans l'application, on a une bonne capacit� d'adaptation � transformer l'offre et la demande en temps r�el, le second est d'�tudier les donn�es et les p�riodes de temps dans diff�rentes villes, les trois il est d� � une entr�e (sur l'emplacement du train, le temps, la destination, le contenu) part de poids, toute forte capacit� de g�n�ralisation. La profondeur du mod�le apprentissage par renforcement de l'utilisation sp�cifique est DQN mod�le (Deep Q-r�seau) � la recherche d'action. processus de formation comme indiqu� sur la figure.

Enfin, le professeur Ping Yejie comparer les m�thodes DQN et l'�valuation des politiques, obtenir deux conclusions, un DQN est optimis� pour le service, et le second, plus la ville, le plus simple la mise en page de la ville, cette optimisation deviendra plus �vidente.

C'est tous les professeurs Yejie Ping Lei Feng r�seau de terminer le discours.

Vous voulez en savoir plus sur le traitement du langage naturel?

Bienvenue � cliquer sur � texte lu �

Ou Lieu communautaire AI Yanxishe ~

Route de la soie

Apprenez � conna�tre la Chine

Voir | gouttes AI Labs qui enseigne Yejie Ping: la recherche et la pratique en profondeur et des morceaux de l'apprentissage par renforcement