Cercles | KDD 2018: modèle WDR proposé par peu d'améliorer considérablement la précision de la prévision de l'ETA

Technologie AI Revue de presse : Top conférence internationale dans le domaine des données minières KDD 2018 tenue à Londres cette année, KDD a attiré un total de 1480 documents de livraison dans le monde entier, inclus un total de 293, moins que le taux d'acceptation de 20%. Ce qui laisse tomber un total de quatre articles sélectionnés pour KDD 2018, pour couvrir l'ETA prévue (heure d'arrivée estimée, heure d'arrivée), de nombreux domaines de recherche intelligente envoyer un seul, la gestion du trafic à grande échelle.

  • Efficace à grande échelle de gestion de flotte via Multi-Agent profond Apprentissage par renforcement

Kaixiang Lin (Michigan State University), Renyu Zhao (AI Labs, Didi Chuxing), Xu Zhe (AI Labs, Didi Chuxing); Jiayu Zhou (Michigan State University)

  • Multi-tâches d'apprentissage pour la représentation Voyage dans le temps Estimation

Yaguang Li (Université de Californie du Sud), Kun Fu (DiDi AI Labs), Zheng Wang (DiDi AI Labs), Cyrus Shahabi (Université de Californie du Sud), Jieping Ye (DiDi AI Labs), Yan Liu (Université de Californie du Sud)

  • À grande échelle ordre Dispatch On-Demand Plates-formes Ride-Partage: Une approche d'apprentissage et de planification

Zhe Xu (AI Labs, Didi Chuxing); Zhixin Li (AI Labs, Didi Chuxing) Qingwen Guan (AI Labs, Didi Chuxing); Dingshui Zhang (AI Labs, Didi Chuxing), Qiang Li (AI Labs, Didi Chuxing); Junxiao Nan (AI Labs, Didi Chuxing); Liu Chunyang (AI Labs, Didi Chuxing); Wei Bian (AI Labs, Didi Chuxing); Jieping Ye (AI Labs, Didi Chuxing)

  • Apprendre à estimer le temps Voyage

Zheng Wang (Didi Chuxing), Kun Fu (Didi Chuxing) Jieping Ye (Didi Chuxing)

Cet article est une interprétation détaillée des pièces KDD 2018 Papier poster « Apprendre à estimer le temps Voyage », et dans cet article, et des morceaux de l'équipe technique a conçu un programme pour prédire l'heure estimée d'arrivée (ETA) en utilisant une profondeur de réseau de neurones par l'ETA est modélisé comme un problème de régression de l'espace, construire une riche fonctionnalité système efficace et plus proposé modèle large-deep-récurrents (WDR), peut prédire avec plus de précision dans le cas d'un temps de départ et la route donnés. L'incident dans le projet de base de données académique Lei Feng réseau canal AI Technology Review "Facteur d'impact AI." Les points correspondants.

Des règles pour modéliser le programme d'apprentissage automatique complet

ETA est des services d'information de trafic et de localisation intelligente (service de géolocalisation, LBS) dans les problèmes critiques et très complexes et difficiles. Il doit non seulement tenir compte des caractéristiques spatiales du système de transport, tels que le nombre de façons de feux de circulation, les limites de vitesse de la route, si vous pouvez prendre la longue route pour aller vite, les caractéristiques de temps du système de transport doivent également être pris en compte, comme les accidents de la congestion et le trafic de pointe du matin et soir régularité causés par parfois la congestion et ainsi de suite. En même temps, parce que les besoins du système de transport à courir et la voiture en tant que sujet à participer, en fin de compte, l'impact des facteurs externes, le temps des problèmes de modélisation devrait encore besoin d'introduire des fonctionnalités personnalisées et fonctionnalités externes, comme un habitudes de conduite conducteur, le brouillard de pluie interférence vitesse de conduite et analogues.

Dans la plate-forme de bits, l'ETA est un des services de base essentiels. Que ce soit avant l'heure de Voyage estimé l'affichage des prix estimé Jiejia, ou la décision d'envoyer un seul système, la planification, le covoiturage, etc., aussi, ou un AVC dans le temps estimé pour atteindre la fin du calcul, etc., ne peut pas faire sans l'aide de l'ETA de haute précision. demande ETA baisse d'environ 70 milliards de fois par jour, à environ 400 par seconde au pic million de fois.

ETA est calculée en utilisant le modèle de règles est pratique courante après l'une des carte de l'industrie. -À-dire calculer un temps de Voyage de chaque segment de chemin d'accès, puis tous ensemble pour faire une correction de décalage temporel en fonction des feux de circulation. Utilisez les mathématiques pour décrire, le temps estimé

Il peut être exprimé en

Parmi eux,

Est estimé la section i-ème du temps de Voyage,

J est le premier feu de circulation du temps d'attente estimé. La figure suivante illustre ce calcul plus intuitive:

Ce modèle est construit entièrement de la structure physique, mais la plupart du temps critique que l'acquisition de chaque segment et chaque fois un feu de circulation. Compte tenu de l'état qui prévaut de la route tous les changements dynamiques de temps, une approche plus pratique est l'utilisation des dernières données historiques (par exemple, juste au cours des cinq dernières minutes) pour estimer le passage des sections de temps en temps réel, et le passage du temps que la moyenne historique la valeur par défaut est de remplir la section de l'information manquante (sinon un peu dans la dernière partie de la situation de la circulation passant du véhicule à ce moment on ne sait pas). Vous pouvez utiliser un éclairage d'approche similaire de l'historique des données pour exploiter le temps moyen d'attente pour chaque feu de signalisation, comme.

modèle de règle, si petit calcul de services en ligne, facile à mettre en uvre, mais utiliser beaucoup basé sur des règles d'expérience et l'intuition, non seulement l'absence de méthodes d'exploration scientifique fait de l'homme, des limites et une plus grande expansion est faible, mais aussi facile à manquer beaucoup d'informations importantes, telles que des fonctionnalités personnalisées, etc. ; en outre, le montant ne suffit pas à l'analyse statistique simple des modèles de trafic complexes, les indicateurs de base sont souvent vulnérables aux goulots d'étranglement et ne peuvent plus être optimisés en ajoutant une nouvelle règle.

Afin de mieux jouer au potentiel des données de voyage massives, les premières gouttes d'un ensemble de système d'apprentissage de la machine en 2015 pour résoudre le problème de l'ETA. Le type de vue, l'ETA est un problème de régression typique: étant donné une fonction d'entrée, le modèle génère une valeur réelle représentant le temps de Voyage prévu. Didi explorer et construire une fonction de carte du champ d'un système de collecte et d'expression, y compris l'information spatiale, les informations temporelles, informations sur le trafic, des informations personnalisées, telles que des informations sur plusieurs aspects de l'élargissement, de tenir pleinement à tous le début et la fin du chemin de communication, sections concernées, intersection des POI et des feux de circulation, ainsi que par une certaine zone, le temps de Voyage attributs correspondants, le trafic en temps réel, la météo et le comportement au volant des conducteurs, le contrôle du trafic et ainsi de suite.

Compte tenu de la sensibilité de l'utilisateur à des erreurs et plus sur la valeur relative, laisse tomber le MAPE (moyenne d'erreur de pourcentage absolu) que la fonction objective est sélectionnée, le problème d'optimisation correspondant est MAPE:

Parmi eux,

Il est le temps réel d'arrivée (heure réelle d'arrivée, ATA), et

Est-ce le temps estimé,

Il représente un modèle de régression. Pour éviter surajustement, le terme de régularisation peut également ajouter

Dans le modèle de régression, Didi a examiné deux types de modèles dans l'industrie, le modèle à base d'arbres et factorisation machine. Parmi eux, le résultat final est un arbre modèle multi-tree résultats intégrés peuvent être écrits comme:

Le nombre de modèle d'arbre. Chaque arbre est déterminée en fonction de la caractéristique d'entrée détermine les données d'entrée est classé dans le noeud feuille, alors le noeud feuille correspondant à une seule sortie d'arbre un indice, à savoir

Représentent la fraction du vecteur d'arbre t composé de tous les noeuds de feuille,

Il est une fonction de mappage (à travers une série de conditions de détermination), déterminée

numéro de noeud feuille doit appartenir. Pour le modèle, par lequel la complexité de la structure et la taille de l'arbre pour contrôler, à savoir, en utilisant le terme de régularisation suivante

Intuitivement, le premier nombre de paires de noeuds de feuille

Il a été contrôlé, et le second pour commander la sortie de la partition par le noeud feuille norme L2. ETA pour faire la tâche avec le modèle d'arbre final fonction objectif peut être écrit

L'idée de base est de modéliser l'interaction de fonction FM décomposition droite de la matrice de poids, exprimé sous la forme d'un vecteur produit intérieur, afin de réduire le nombre de paramètres. Calcul du second ordre FM

Où d est la dimension caractéristique, souvent niveau encore plus élevé de dizaines de milliers. Le vecteur de paramètres

M dimensions relativement petites, peuvent généralement obtenir une meilleure précision de la prédiction de l'ordre de plusieurs dizaines. FM peut aussi être une régression modélisation de l'ETA, ainsi que quelques éléments réguliers, il a été optimisé cible

parmi

V représente la norme de Frobenius de la matrice de la configuration de vecteur.

Large-profonde récurrente d'améliorer encore la précision du modèle

Bien que cette machine une solution complète d'apprentissage pour apporter des gouttes d'améliorer de manière significative la précision de l'ETA, mais parce que la plupart des modèles de régression tels que XGBoost, capable de recevoir le vecteur d'entrée doit être de longueur fixe, et une période correspondant à la section de course ( ci-après dénommé lien) un grand nombre de changements de périmètre, donc en utilisation réelle, les caractéristiques de l'arrondissement au niveau de la liaison, au lieu d'utiliser les statistiques globales. Par conséquent, le niveau de détails, cette solution il y a place pour l'optimisation.

Afin de maximiser les informations sans perte, en conservant la capacité d'information de séquence de modélisation de liaison, la profondeur diminue applications d'apprentissage novatrices de l'ETA. Ce modèle est l'idée de base du modèle global ETA + modèle récurrent. Où l'effet est similaire au modèle global de génération de modèle, l'information globale pour l'apprentissage de la course, le modèle récurrent se concentre sur l'étude des détails des séquences de liaison locales et similaires.

Dans les pièces mondiales de pièces de modèle modèle Large & Deep tient compte de la récente attention dans le domaine des systèmes de recommandation pour assurer que tous les modules peuvent être réalisés fin à la formation finale. Large FM et ses branches sont en fait la source d'une impulsion du second ordre des caractéristiques de croisement, les données historiques a une fonction de mémoire. Et sa branche profonde est la structure traditionnelle de MLP, a une bonne capacité de généralisation. En combinant les deux branches ensemble, nous pouvons prendre directeur mutuel.

Modèle WD structure générale ci-dessous:

modèle récurrent de choix est riche, ne se limite pas à RNN (y compris les variétés GRU, LSTM, SRU, etc.), peut également être une convolution unidimensionnelle CNN, ou purement modèle de l'attention. Le plus populaire LSTM, par exemple, que par l'introduction de mémoire additif et la grille pour faciliter le gradient disparaissent simplement problème RNN:

Et après modèle de combinaison WD, nous obtenons le modèle Wide-profond récurrente (WDR). La structure représentée ci-dessous:

Vous pouvez le voir, ce modèle dispose d'un total de trois catégories:

  • Dense caractéristique: nombre réel au niveau de la course, par exemple à partir de la fin de la distance sphérique à partir du point d'extrémité coordonnées GPS.

  • fonction clairsemés: le niveau de déclenchement caractéristiques discrètes, telles que le numéro de tranche de temps, jour de la semaine, les types de temps.

  • fonction séquentielle: caractéristiques au niveau de la liaison, la fonction réelle est entrée directement au modèle, puis en intégrant les fonctions discrètes font modèle d'entrée en premier. Notez que ce n'est pas un vecteur caractéristique pour chaque course, la course, mais a un vecteur caractéristique pour chaque liaison. Par exemple, la longueur de la liaison, le nombre de voies, la classe fonctionnelle, la vitesse de circulation en temps réel.

Dans laquelle les modules larges et profonds de la modélisation globale de l'information d'accident vasculaire cérébral et récurrente trajectoire du module de course modélisation minutieuse permet de capturer chaque lien, les informations de chaque intersection. Lorsque la synthèse finale, le module large par la transformation affine à la sortie des dimensions appropriées, le module profond directement à l'état caché de haut en sortie, et le dernier module de LSTM récurrente en tant que sortie un état caché. vecteur de sortie trois modules sont épissés ensemble dans le régresseur finale signifie la valeur obtenue ETA. Tous les paramètres sont basés sur la perte MAPE faire descente de gradient train.

L'architecture du système, comme indiqué sur la figure. Le niveau le plus bas pour la source de données, à savoir les informations cartographiques, GPS pistes, dossiers et autres ordonnances nécessaires des informations supplémentaires. Ensuite, les données d'origine grâce à un format de modèle de processus particulier est disponible pour le modèle de formation. Notez qu'il ya une petite branche, mais représentent aussi un individu a petit groupe de données à jour après la fin de finetune de formation, rend le modèle plus enclin aux dernières données recueillies. Bon modèle de formation en ligne, et enfin poussé au système en ligne, les services externes.

Expérience, le bit de données par la plate-forme de bits Pékin mai 2017 réalisé sous la ligne de filtre approprié, a conclu que le pick-up (le conducteur à prendre des passagers) ou un voyage (le conducteur à prendre les passagers à leur destination), le modèle WDR a son une mise à jour plus importante.

Didi a également effectué une semaine d'évaluation en ligne peut être vu à partir du graphique, le système actuel dans sa ligne de modèle a également des performances de pointe.

équipe Didi a fait remarquer que bien que le modèle de WDR peut être une prévision plus précise, mais il y a encore beaucoup de questions à être explorées plus avant, par exemple, comment introduire une structure de topologie du réseau routier, comment l'intégration de la planification des itinéraires, des algorithmes de trafic et comment co-ETA bout à bout pour apprendre à période de prévision plutôt qu'une seule fois, la façon d'améliorer la performance des services des systèmes en ligne et ainsi de suite, alors que les besoins d'autres études.

(Adresses de thèse: Apprendre à estimer le temps Voyage

ou cliquez sur Lire l'original AI Yanxishe lieu communautaire télécharger quatre documents.

Reine phare de Huawei à courir sous-cuit au four, le premier pour combien de temps?
Précédent
Interprétation maigre, SAIC 1.0T / moteur 1,3T
Prochain
Chaque tournage d'un film, Eddie va débloquer une compétence, à « l'emporte sur le mal » a comme transformation Zhen
Les 20 premiers millions de cas de « split »! Netbig ne souffle pas dans la brise du printemps peut faire germer le drame réseau partagé
Non seulement le téléphone, le riz rouge redmi appareils PREMIEREgrande, automatique 8 kg Machine à laver officiellement publié
Cercles | KDD 2018: modèle WDR proposé par peu d'améliorer considérablement la précision de la prévision de l'ETA
Chongqing a plus d'une centaine de personnaliser ce que la division Voyage? Vous ne savez pas ce qui est personnalisé Voyage? !
Cette paire de l'âme noire Nike Air Plus Uptempo comment la lumière initie la combustion? ! Vous ne savez pas comment voir!
Redmi nouveau téléphone mobile a publié officiellement, en plus de téléphones mobiles ainsi que les biens de l'écosystème redmi
Dynamic | Tsinghua TSAIL jeu commun Tencent victoire FPS AI AI Lab concours VizDoom
Legendary Pictures à abandonner l'acquisition de TVB: reconnaître « menteur » conseil, farce comme fin « absurde »
Plus de 70 écoles à l'étranger admissions officiers semblaient Chongqing dire ce que vous aimez le plus étudier à l'étranger?
UCloud manger « premier crabe » carte de la Direction générale
Le plus jeune plus confiant l'essai routier allemand Chery Tiggo 5x