KDD 2019 | Tencent algorithme publicitaire en �quipe sur les stocks de papier estimation a �t� embauch� KDD 2019

Responsable: Tencent �quipe algorithme publicitaire sur les stocks de papier estimation de � grande �chelle Visites utilisateur Comprendre et de pr�vision profonde spatio-temporel Tensor cadre factorisation � est CCF A conf�rences de classe KDD2019 embauch�e. pr�sente en papier algorithme d'apprentissage en profondeur pour les estimations de l'inventaire publicitaire � grande �chelle, les caract�ristiques de la mod�lisation croix et la fonction du temps, l'inventaire publicitaire ainsi des estimations pr�cises.

introduction

Tencent �quipe algorithme publicitaire sur les stocks de papier estimation de � grande �chelle Visites utilisateur Comprendre et de pr�vision profonde spatio-temporel Tensor cadre factorisation � est CCF A conf�rences de classe KDD2019 embauch�e. pr�sente en papier algorithme d'apprentissage en profondeur pour les estimations de l'inventaire publicitaire � grande �chelle, les caract�ristiques de la mod�lisation croix et la fonction du temps, l'inventaire publicitaire ainsi des estimations pr�cises.

1. Contexte

� l'heure actuelle le principal mod�le d'affaires du centre de service Internet est toujours le besoin de la publicit� c�t� service pour pr�voir � l'avance le montant de l'acc�s des utilisateurs pour assurer la vente de la publicit�, ce qui n�cessite l'inventaire publicitaire compr�hension et la pr�vision. Un des mod�les de pr�vision largement utilis�s peuvent �tre grossi�rement divis�es en deux cat�gories: 1) l'utilisation du mod�le de pr�vision du temps traditionnel (ARIMA, GARCH, TBATS, etc.), ces mod�les sur un mod�le de s�rie chronologique de traitement � grande �chelle devient tr�s inefficace; 2) �tude approfondie du mod�le pr�dictif (ST-RESNET, TRMF, etc.) sur la base, peut �tre tr�s bon travail de pr�vision des s�ries chronologiques de grande dimension, mais la plupart de ces mod�les se concentrer uniquement sur les caract�ristiques du temps et ignorer la combinaison d'attributs et d'autres caract�ristiques. Afin de mieux remplir les pr�visions des stocks de temps de publicit�, nous devons r�pondre aux questions suivantes:

Un grand nombre de portefeuille immobilier et peut changer � tout moment. Nous utilisons habituellement pour d�crire l'acc�s d'un utilisateur � plusieurs combinaisons de fonctionnalit�s, telles que la g�ographie, la plate-forme, l'�ge et le sexe. Avec l'augmentation des caract�ristiques, ces caract�ristiques la croissance combin�e du nombre de niveaux d'index, donc nous avons besoin d'un mod�le efficace et �volutive.
Association entre les combinaisons d'attributs, diff�rentes combinaisons de propri�t�s ne sont pas toujours un traitement �quivalent. Tels que l'�ge et les plates-formes fortement corr�l�es, mais la corr�lation entre l'�ge et le contenu est relativement faible.
L'inventaire d'annonces tout en ayant un long cycle et leurs caract�ristiques � cycle court, comme la longue p�riode annuelle de la F�te du Printemps, les vacances d'�t�, etc., sont beaucoup plus courts m�trages au niveau de la semaine p�riode, les algorithmes n�cessitent la prise en compte des caract�ristiques des deux.

Figure 1: Vue d'ensemble du probl�me

2. Mod�le Pr�sentation

Pour r�soudre les probl�mes ci-dessus, nous avons propos� une DEEP spatiotemporel FACTORISATION CADRE, alors que des combinaisons de caract�ristiques et attributs des fonctions de mod�lisation de temps, et peuvent tirer parti des donn�es de longue p�riode. Les id�es de conception de base d�riv�s tenseur d�composition, peut �tre vu de la figure 1, on peut repr�senter les donn�es qui est une vue d'un tenseur (Ann�e, attribut, temps), nous devons estimer la partie marqu�e en rouge. la figure ch�ssis g�n�ralement repr�sent�s comme suit:

Figure 2: tenseur d'ordre 3 d�composition

parmi

Exprimons notre fichier d'inventaire,

Le nombre total de propri�t�s en combinaison,

Il repr�sente un laps de temps,

Il repr�sente des ann�es de donn�es historiques. Bas� sur le mod�le PVD (population Valeur de d�composition), on peut se d�composer en un tenseur U

Et un tenseur de base

Attribut repr�sentent la combinaison de caract�ristiques, la longue p�riode de temps et la s�quence de fonctions. nous utilisons

Il repr�sente un �l�ment de U, alors nous pouvons

Calcul�. Par cons�quent, pour l'inconnu (la partie rouge du dessin), nous avons besoin d'optimiser la fonction de perte � r�soudre comme suit:

qui repr�sente tous les �l�ments connus de l'ensemble, et la matrice factorisation connus (tels que TRMF) bas�e sur la comparaison, nous avons rejoint dans cette dimension, en tenant compte des lois de l'histoire d'influer sur l'estimation de l'ann�e en cours, ce qui rend non seulement le mod�le cadre plus g�n�ral, et il peut �tre une bonne combinaison de donn�es historiques pour pr�dire une longue p�riode.

Figure 3: Deep tenseur spatio-temporelle factorisation forecastingframework

Nous allons mourir comme ci-dessus la d�composition du tenseur notre cadre de corps, nous avons con�u notre mod�le montre la figure 3, qui comprend trois parties principales:

Mod�le spatial: Cette combinaison de caract�ristiques pour extraire certaines des propri�t�s. Pour la combinaison des attributs d'entr�e, nous utilisons d'abord l'attention extraite Int�gration des relations entre les diff�rentes valeurs du m�me attribut de la cat�gorie, la pr�sence du m�canisme peut �tre telle que nous accordons plus d'attention � la partie d'entr�e cl�. Apr�s avoir obtenu tous les attributs de codage, et nous rejoint en tant qu'entr�e r�seau DeepCross, pour extraire les relations entre les diff�rents types de propri�t�s. Pour le r�seau DeepCross, g�n�ralement appel�e entr�e d'initialisation

, G-�me couche peut �tre exprim�e sous la forme r�cursive

qui

Il est un r�seau de neurones de param�tres.

Mod�lisation de fonction temporelle: inspir�e par CLDNN, nous CNN, les fonctions de synchronisation RNN se combinent pour extraire des donn�es historiques. Tout d'abord CNN peu profonde pour l'extraction de caract�ristiques, en tant que caract�ristique RNN puis entr�e, obtenir des caract�ristiques de synchronisation. parmi

M repr�sente tous les ans jour connues de donn�es historiques, dans lequel la partie d'extraction d'une caract�ristique de synchronisation et de cycle,

Elle repr�sente la partie des donn�es historiques sur la m�me p�riode, la longue p�riode � des fonctions d'extraction.

Multi-t�che: la figure 3, nous avons deux t�ches: 1) l'utilisation des donn�es historiques de la reconstruction du codeur; 2) l'utilisation du tenseur d�composition de l'inventaire publicitaire future estim�e. Nous r�duisons au minimum la perte de fonction � la fois par l'�quation suivante:

Son droit de peser � nouveau les deux t�ches. En g�n�ral, nous avons mis < �0,5, parce que notre t�che principale est utilis�e pour faire des pr�dictions. Multi-t�che pr�sente les avantages suivants: 1) r�duire au minimum la perte d'informations (du codeur); 2) le partage CNN, autre couche r�seau RNN, ce qui r�duit la complexit� du mod�le, 3) pour am�liorer la pr�cision des estimations.

3. Les r�sultats exp�rimentaux

3.1 Param�tres et temps

Les mod�les de s�ries chronologiques traditionnelles telles que la n�cessit� d'un mod�le TBATS ou ARIMA s�par�s pour chaque pr�diction de s�ries temporelles, il faut beaucoup de temps, nous sommes ici pour faire la comparaison. En raison des param�tres de conception des r�sultats de partage multi-t�ches en nombre r�duit de param�tres, en particulier les donn�es comme indiqu� ci-dessous:

Tableau 1: Le nombre de param�tres et le temps de formation

3.2 R�sultats exp�rimentaux

Nous avons fait la v�rification exp�rience (avant et Tencent patch vid�o PEMS-SF) dans les deux ensembles de donn�es r�elles, les crit�res d'�valuation que nous choisissons �cart Normalis�e (ND) et une racine normalis�e erreur quadratique moyenne (NRMSE), d�fini comme suit:

Les r�sultats pr�sent�s ci-dessous:

Figure 4: 28 jours et 28 jours en moyenne ND NRMSE moyenne

Comme on peut le voir, le mod�le ST-TF ND et NRMSE dans les meilleures performances ont �t� obtenues, respectivement, 0,179 et 1,093. patch vid�o Tencent sur le front, ST-TF par rapport � la CNN a obtenu hausse de 8,7%, par rapport � TRMF gagn� augmentation de 5,8%. Et sur PEMS-SF nous obtenons �galement les meilleures performances, par rapport � CNN et d'am�liorer TRMF 9,8% et 7,6%, respectivement. Ces attributs am�liorent principalement d'une meilleure conception et la combinaison d'extraction de caract�ristiques et d'autres multi-t�ches.

4. R�sum�

Le papier de Tencent �quipe algorithme de publicit� � � grande �chelle Visites d'utilisateurs et de pr�vision Comprendre en profondeur spatio-temporel Tensor cadre factorisation � introduit tenseur �tude approfondie combin�e de la d�composition de la conception, nous avons obtenu de bons r�sultats pr�vus. Dans les travaux futurs, nous continuerons � am�liorer la compr�hension de l'entreprise, d'explorer un mod�le plus pr�cis et efficace pour soutenir le d�veloppement des entreprises. Merci Tencent algorithmes publicit� de marque Computer Science, l'�quipe USTC et la prochaine g�n�ration de l'informatique mobile avec des donn�es suggestions et contributions Innovation Lab.

2019 Sommet mondial sur l'intelligence artificielle et robotique

Organis� par la F�d�ration chinoise informatique, Lei Feng r�seau et l'Universit� chinoise (Shenzhen) Hong Kong co-h�te du Sommet mondial 2019 sur l'intelligence artificielle et robotique (CCF-GAIR 2019), sera 2019 Nian 12 Juillet � 14 Tenue � Shenzhen.

D'ici l�, le laur�at du prix Nobel JamesJ. Heckman, acad�micien �tranger, pr�sident du haut du monde, bien connu Fellow, un certain nombre d'invit�s poids lourds seront personnellement Zuozhen , Pour discuter de l'intelligence artificielle et sur le terrain complexe de situation de survie de la robotique, la production, l'investissement et ainsi de suite.

Cliquez pour lire le texte original, en ajoutant des �quipes de haut de KDD �changer et apprendre de leurs pairs, l'�change