�quipe getMax: KDD CUP 2018 deux id�es couronne un probl�me de r�solution de sous-groupe

KDD CUP cette ann�e a mis en place trois prix, � savoir piste g�n�rale, Derni�re pr�vision de dix jours et deuxi�me piste de pr�vision de 24 heures piste, de diff�rentes dimensions r�compense l'�quipe exceptionnelle de performance. Par Luo Zhipeng, Hu, Huang compos� forte �quipe getMax, a remport� trois prix dans ces finaliste, les deux r�sultats de championnat, est la seule �quipe a balay� trois prix. L'ann�e derni�re, l'�quipe dirig�e l'�quipe a balay� Convolution �galement le champion KDD CUP 2017.

La photo montre la conf�rence internationale tenue r�cemment top accorder �quipe SIGKDD getMax trois m�dailles de r�compenses

Lei Feng r�seau de l'ann�e derni�re, l'�quipe a �galement men� un partage du rapport technique.

KDD Cup est d�couverte par l'exploration de donn�es et de connaissances comit� sp�cial de l'ACM (SIGKDD) a accueilli des donn�es de recherche mini�re dans le domaine des grandes comp�titions internationales, organis�es chaque ann�e depuis 1997. Chaque nombreux acteurs de l'industrie attir�s ainsi que la communaut� universitaire, il y a l'exploration de donn�es � Jeux olympiques �, a d�clar�.

KDD Cup 2018 intitul� pr�dire la qualit� de l'air, fournir des donn�es m�t�orologiques � Beijing, en Chine et � Londres par les organisateurs, les joueurs ont besoin afin de pr�dire les concentrations de PM2,5 / PM10 / O3 dans les prochaines 48 heures. Le titre du tournoi lui-m�me des environnements difficiles, am�liorer l'�tre humain est d'une grande importance, et le probl�me lui-m�me a faible r�gularit� des donn�es, mutable, mod�lisation des s�ries temporelles et le d�fi des relations topologiques spatiale.

R�cemment, sur Lei Feng r�seau AI Yanxishe classe ouverte, l'�quipe getMax a partag� la KDD CUP 2018 deux id�es couronne un probl�me de r�solution de sous-groupe, cette part est principalement ax�e sur les questions de qualit� de l'air, les difficult�s et les caract�ristiques de conception �tude approfondie cibl�e mod�le d'optimisation. Ouvrir l'URL de lecture vid�o de classe: http: //www.mooc.ai/open/course/530

personne Partager

Luo Zhipeng: ing�nieur algorithme Microsoft Bing recherche publicitaire, Master of Software Engineering, l'Universit� de P�kin, ax� sur la recherche et l'application de la technologie en PNL d'apprentissage profond, match de la pertinence des annonces, le CTR et d'autres estimations.

Huang forte: l'Universit� de P�kin Master of Software Engineering en lecture, de bonnes caract�ristiques techniques, le traitement du langage naturel, l'apprentissage en profondeur.

Hu: Ali Mama algorithme de recherche des �quipes de train d'experts, est dipl�m� de l'Universit� chinoise de Hong Kong direction d'apprentissage de la machine, la direction technique pour les algorithmes d'apprentissage de la profondeur de travail et de la publicit�.

L'�quipe a une grande exp�rience dans les applications d'apprentissage de la machine dans l'industrie et de la concurrence. CIKM 2018 �quipe a remport� le championnat, KDD CUP champion 2017, Kaggle Outbrain Cliquez champion de pr�vision, la chaleur microblogging pr�disent champion, applications BOT grandes donn�es Shanghai championnat et ainsi de suite.

Partager Sujet: KDD CUP 2018 deux id�es couronne une r�solution de probl�mes sous-groupe

grandes lignes de l'action:

la conception et la mod�lisation de probl�mes compr�hension de qualit� de l'air

Projet Feature

l'optimisation du mod�le d'apprentissage en profondeur

int�gration du mod�le

Lei Feng r�seau AI Yanxishe au contenu des actions se r�sument comme suit:

Aujourd'hui, nous partageons avec tout le monde dans l'�quipe est des solutions Cup KDD 2018. Tout d'abord vous pr�senter notre �quipe getMax, capitaine de l'�quipe Luo Zhipeng, est ing�nieur de l'algorithme ad recherche Bing de Microsoft, Master of Software Engineering, l'Universit� de P�kin. Je suis un jaune fort, le ma�tre actuel de g�nie logiciel � l'Universit� de P�kin � lire. Mais ma m�re recherche de train Hu algorithmes �quipe d'experts, est dipl�m� de la direction de la machine d'apprentissage de l'Universit� chinoise de Hong Kong.

Notre �quipe poss�de une vaste industrie et de l'application de l'exp�rience d'apprentissage de la machine en comp�tition, d�j� en Coupe CIKM 2018, KDD Cup 2017, Kaggle Outbrain Cliquez Pr�diction autres jeux sont gagn�s.

KDD 2018 est fix� cette ann�e un total de trois prix, nous avons gagn� deux titres, un r�sultat runner-up, est le seul en prenant trois prix de l'�quipe.

Notre �quipe viendra partager cette exp�rience de comp�tition KDD les quatre aspects suivants.

La premi�re �tape de la comp�tition est de faire la question de recherche appropri�e - pour comprendre les enjeux et les donn�es sp�cifiques est la base pour la mod�lisation Donc, nous allons �tre la compr�hension et l'analyse du probl�me de cette comp�tition KDD.

Tout d'abord, une certaine exp�rience de la Coupe KDD 2018. Dans cette comp�tition, les organisateurs offrent une qualit� de l'air, des donn�es m�t�orologiques historiques et les pr�visions m�t�o pour les deux prochains jours de donn�es. Nous devons pr�voir P�kin et Londres 48 sites pr�s 48 heures de PM2,5 / PM10 / O3 concentrations. La fonction d'�valuation du concours est utilis� SMAPE:

La fonction d'�valuation est bas�e sur la fonction d'�valuation sur la norme MAE-1, divis� par la valeur moyenne pr�dite et la valeur r�elle. La fonction d'�valuation peut �tre utilis�e pr�venir efficacement les probl�mes de qualit� de l'air propres � la note globale valeur anormale, par exemple, lorsque la mutation de masse d'air � une grande valeur, l'affaiblissement relatif du d�nominateur peut �tre affect�e.

Ensuite, parler de donn�es. Les indicateurs de qualit� de l'air, y compris les PM2,5, PM 10,03. les donn�es m�t�orologiques sur le terrain comprennent la temp�rature, la pression, l'humidit�, la vitesse et direction du vent. Le m�me domaine dans lequel les donn�es de pr�visions m�t�orologiques et sur le terrain des donn�es m�t�o, mais la diff�rence est que le temps pr�vu le mois dernier offre une formation ensemble de donn�es.

Ces donn�es m�t�orologiques sont donn�es sous la forme d'une grille que les cartes divis�e par une grille de latitude et de longitude, P�kin offre un total de plus de 600 points de grille, Londres peut fournir plus de 800 points de la grille, les dimensions de l'espace est tr�s potentiel du robinet grande. Il est entendu que l'industrie existante et les milieux universitaires principalement gr�ce � la mod�lisation statistique, les s�ries chronologiques, etc., bas�e sur l'apprentissage de la machine, en particulier l'apprentissage � explorer la profondeur de la mod�lisation � un stade relativement pr�coce.

la difficult�s concours Dans les domaines suivants:

Tout d'abord, les donn�es de bruit et de l'instabilit�, la qualit� de l'air r�gularit� faible concentration changent souvent rapidement.

En second lieu, les s�ries chronologiques de mod�lisation difficult� assez �lev�: les besoins de chaque heure pour les prochaines 48 heures � pr�voir. Pendant longtemps, la mod�lisation et la mod�lisation des d�pendances entre l'�tat des s�quences grand d�fi.

Troisi�mement, le mod�le topologique: la n�cessit� pour les deux villes un total de centaines de sites de faire des pr�dictions. La concentration entre les diff�rents sites est tout � fait diff�rente, la tendance est pas coh�rente et avoir une certaine pertinence.

Apr�s analyse des donn�es, nous avons constat� que les changements dans la qualit� de l'air dans la concentration de P�kin PM2.5 est tout � fait dramatique, qui est de P�kin valeur de concentration olympique de F�vrier � Mai, sa valeur la plus basse pour aller � 10, la valeur la plus �lev�e peut �tre jusqu'� 350, et souvent il peut faire une �norme diff�rence en quelques heures, la mod�lisation difficile.

Alors, comment les s�ries chronologiques modelant? Nous utilisons pour illustrer PPT, PPT repr�sentant l'ensemble des donn�es de s�ries chronologiques, nous pouvons maintenant acquis environ 17 ans 1 � 18 Janvier � Avril, puis d�limitation du cercle. Ici, nous supposons que N est �gal � 3, les donn�es de temps qui reste est �quivalent � 17 de Janvier Janvier 1 au 17 mars, le c�t� droit est de 4 � 5 Total 48 heures. �tant donn� que seul un mod�le de pr�vision utilis�, nous avons besoin de 48 � 48 heures de glissement �chantillons fractionn�s, la masse d'air par heure, ce qui est une �tiquette �chantillon, identifi� par un drapeau dans lequel le premier num�ro de s�quence. De cette fa�on, nous pouvons mettre probl�me de pr�vision des s�ries chronologiques dans une r�gression unique objectif traditionnel.

Nous voulons extraire les donn�es dans les jours pr�c�dents N pour construire les fonctions d'ensemble de la formation, il peut produire le tour 48 �chantillons de glissement, peut produire un total de 860.000 �chantillons. Ensuite, nous pouvons prendre les 15 derniers jours ou faire l'ensemble de validation, en raison des donn�es de s�ries chronologiques ne r�pond pas aux ind�pendants et identiquement distribu�s, ne convient pas � faire plus la validation crois�e. Et parce que ce titre du tournoi dans diff�rentes villes de facteurs d'impact sur la qualit� de l'air varient, r�parties tout � fait diff�rent, donc nous devons PM2.5 � P�kin, PM 10,03 et PM2,5 London, PM 10 La construction de ces cinq indicateurs mod�le � cinq.

Ensuite, nous pr�sentons les uvres de fonction. Caract�ristiques d�terminent souvent la limite sup�rieure du mod�le aux travaux de fonction, nous devons d'abord construire un mod�le de r�f�rence, sur cette base, afin de v�rifier les caract�ristiques de validit�.

mod�le GBDT parce que ses avantages �vidents de la stabilit� au bruit et similaires, pour la v�rification appropri�e des uvres de fonction. Nous utilisons des caract�ristiques de qualit� de l'air dans le pass� 72 heures chaque site pour construire le mod�le � partir des caract�ristiques de base de la station m�t�orologique la plus proche des points de grille dans les 72 derni�res heures.

Cet effet est un mod�le pr�dictif de la figure de base, peut �tre vu de la figure, seule l'utilisation de ces fonctions, et ne peut pas refl�ter la valeur r�elle de la tendance.

Sur la base du mod�le de base, nous avons analys� la corr�lation entre la qualit� de l'air, les donn�es m�t�o, nous avons constat� que le changement de changement 73,7% de la qualit� de l'air et la vitesse du vent, direction du vent associ�. Nous consid�rons donc l'introduction de fonctions sur la base des pr�visions m�t�orologiques mod�le GBDT, mais la fonction de pr�vision m�t�o seulement n � 10 Avril 2018 a commenc� � offrir l'absence de plus d'un an de donn�es - comment remplir les donn�es de pr�vision m�t�o manquante est un point cl�.

En r�gle g�n�rale, la m�thode consiste � remplir les valeurs manquantes en utilisant les valeurs moyennes et par d�faut, mais ces m�thodes ne produisent pas de bons r�sultats. Par cons�quent, nous utilisons temps r�el pour remplir les pr�visions m�t�o des valeurs manquantes, cependant, ce qui cr�e un nouveau probl�me - il est plus incompatible avec la distribution r�elle des pr�visions m�t�orologiques m�t�o, facilement conduire � trop adapter la formation, donc nous Envisager d'essayer l'utilisation de l'apprentissage de transfert pour r�soudre ce probl�me .

Nous prenons pr�-formation sur l'ensemble de la formation, avec temps r�el, pour se recycler la fa�on dont les pr�visions m�t�o pour l'ensemble de la formation pour construire le mod�le. Cependant, l'exp�rience a r�v�l� que seulement le mois dernier les donn�es de pr�visions m�t�o, et ne peut pas couvrir tout le temps une bonne distribution, donc ce mod�le pour pr�dire l'effet de l'instabilit� dans l'avenir.

Finalement, nous avons introduit pour surmonter le bruit gaussien, distribution gaussienne pour estimer la moyenne et la variance r�elle m�t�orologiques et les pr�visions m�t�orologiques, et pour tous les param�tres d'estimation de l'heure afin d'obtenir un bruit gaussien plus pr�cis. De plus, nous utilisons �galement binning pour faciliter encore la bonne distribution des pr�visions m�t�o inconsistance aux valeurs r�elles du probl�me.

Apr�s l'assouplissement des incoh�rences, nous pensons que renforcer davantage l'espace que l'exploitation mini�re �tendue � partir d'un seul point � multipoint de l'excavation. Du fait que les points de donn�es maill�s pour fournir des pr�visions m�t�orologiques et plus, une grande quantit� d'informations, une grande pi�ce � explorer, nous avons donc autre caract�ristique de l'exploitation des donn�es de pr�visions m�t�orologiques. Nous �tions pr�s de huit directions pour chaque station m�t�orologique la plus proche des caract�ristiques de points de grille, en particulier la qualit� de l'air, de sorte que vous pouvez faire des statistiques plus compl�te et stable. Compte tenu de l'air ont une plus grande mobilit�, une plus grande gamme d'emplacements en dehors de la ville et m�me la ville il y a une certaine influence les uns des autres dans la prochaine p�riode de temps, nous latitude et la port�e longitude plus de 12 mesh est caract�ristique de l'ensemble pr�visions m�t�o de la ville l'extraction et l'utilisation de ces fonctionnalit�s pour construire nos mod�les de pr�vision m�t�orologique ultime.

� titre de comparaison, nous constatons que la pr�vision Karte Station Olympic Sports Center de P�kin le 28 mai et le 29 montre cette figure une temp�te de sable au petit matin de ce jour-l�, ce qui conduit � une augmentation de la concentration des PM2,5, plus tard chang� pour le meilleur temps a continu� � 4 en quelques heures, les valeurs de PM2,5 de 160 jusqu'� 30, puis a chut� � 10, la qualit� de l'air mutation tr�s s�v�re. Notre mod�le pr�dit que cette ligne orange de base, la pr�vision du mod�le final est que cette ligne verte, par rapport � la ligne orange plus proche de la valeur r�elle (ligne bleue). Ainsi, le mod�le final refl�te plus pr�cis�ment la valeur r�elle de la tendance de l'air.

Nous avons utilis� six lots de fonctionnalit�s, y compris certaines caract�ristiques de base telles que l'avenir de quelques heures, dont certaines caract�ristiques du site ou de temps, les caract�ristiques de qualit� de l'air, les statistiques m�t�orologiques historiques, mais la chose la plus importante est la qualit� du temps, les caract�ristiques topologiques. En m�me temps, nous devons changer certaines caract�ristiques de l'histoire de l'extraction, telles que les statistiques de l'intervalle maximal PM2,5 et les valeurs minimales.

Enfin, le mod�le que nous devons construire des autres caract�ristiques s�lectionn�es, mod�le de temps d'ex�cution abr�g�. L'importance de notre choisie par le gain de fonction de s�paration fonction GBDT � fonction de s�lection, le choix final de 885 caract�ristiques de 2027 propose de construire le mod�le final. En raison de conflits entre les fonctions, donc nous utilisons la m�me approche ensachage g�n�r� au hasard, un groupe de fonctions, dans lequel chaque groupe va construire un mod�le, puis prendre la forme de la valeur de pr�diction pond�r�e de chaque mod�le de fusion pour construire la finale mod�le. Aussi est entr� dans la phase suivante du projet, il y a des goulots d'�tranglement dans la fonction - construire plusieurs mod�les.

Suivi par notre capitaine Luo Zhipeng d'introduire Mod�le d'optimisation de la profondeur . (Luo Zhipeng :) Voici nos deux principaux mod�les de r�seaux de neurones.

mod�les de r�seaux de neurones ont �galement une capacit� tr�s forte interactif non-lin�aire, parce que nous avons commenc� plus t�t, quand il est utilis� le mod�le GBDT, mod�le DNN est en fait le mod�le GBDT a une tr�s grande diff�rence. utiliser plus tard mod�le DNN pour faire l'int�gration, vous pouvez toujours obtenir l'ascenseur maximum.

Comp�tences mod�le GBDT dans le temps et le niveau de l'espace ne suffit pas. Niveau dans le temps, les caract�ristiques de chaque �chantillon sont sensiblement similaires, de sorte que l'on ajoute � ces caract�ristiques un drapeau pour les prochaines 48 heures, avec 0-47 pour l'identification. En m�me temps, �tant donn� que les principales caract�ristiques des informations historiques telles que l'histoire de la qualit� de l'air, le temps a repr�sent� une proportion relativement importante des caract�ristiques, le r�sultat des diff�rences dans certaines des caract�ristiques des pr�visions m�t�orologiques li�es � la fois que nous rapetissent, et la diff�rence avec la valeur r�elle est relativement importante. De plus, nous avons �galement constat� que l'importance de cette p�riode de fonction 0-47 est particuli�rement �lev�.

Dans l'espace, il y a 13 sites � Londres, P�kin dispose de 35 sites, �galement son codage num�rique, mais les comp�tences limit�es.

Ensuite, nous pr�senter notre mod�le DNN.

gauche est Dense cette fonction que nous GBDT les fonctions utilis�es. Lorsque vous soulevez fonction � noter est que nous devons d'abord �tre normalis�, de mani�re standardis�e � moyenne et l'�cart type statistique classique sur l'ensemble d'apprentissage. Nous avons constat� que la distribution de cet ensemble de donn�es ne sont pas les m�mes que manque le point - remplir la partie manquante des points de distribution diff�rent grandement, nous avons donc une op�ration sp�ciale dans la normalisation du temps � faire: Tout d'abord, les statistiques moyennes et �cart-type, ignorer null; done normalisation op�ration, puis de remplir les valeurs nulles, et apr�s un traitement suppl�mentaire de la valeur anormale, une plus grande valeur sup�rieure � 0,3 et inf�rieure � 0,3 pour le d�montage, r�duite � la plage comprise entre 3 et -3. Pour les valeurs manquantes, �galement exprim� bit de marquage sp�cial, et nous l'avons mis concat et obtenir les fonctionnalit�s standard d'ensemble.

Si laiss� seul pr�sentation caract�ristique Dense, les r�sultats que nous obtenons seront tr�s similaires, il est 0-47 heures le r�sultat fluctuera entre une valeur, mais la diff�rence entre eux est pas grande. Lorsque nous optimisons le mod�le dans le dos, a rejoint l'optimisation conjointe du temps et la mod�lisation de l'information spatiale.

Le regard de d�posons sur la partie droite du mod�le. Premi�re heure (h) 0 � 47 savoir, pour l'enrobage, ce qui entra�ne dans le temps de l'expression, une partie station du m�me P�kin 35, 13 pour incorporer Londres, ne transformation non lin�aire, cette partie repr�sente y � couche d'�l�ment de cercle, le temps et l'information de l'espace int�greront dans l'information espace-temps, puis � travers le enti�rement connect�, par [sigma], pour donner cette partie Seuil espace-temps (Gate) Ce temps d'int�gration de l'information et de l'espace. Ce seuil est utilis� pour contr�ler le c�t� gauche du corps principal de l'information de structure de mod�le, les r�sultats pr�dits diff�rences seront relativement grande. la mod�lisation conjointe afin d'optimiser le temps et l'espace non seulement d'am�liorer la pr�cision et le mod�le d'arbre a une grande diff�rence.

Nous fonctionnons d'activation utilis� ici est le B-Swish. La fonction d'activation est propos� par Google � venir, nous pouvons regarder le tableau de la fonction, il est en fait un non satur�, lisse, non-monotones, la fonction de la limite inf�rieure sans bornes. fonction tanh et la fonction associ�e sigmo�de, leurs extr�mit�s de motif relativement plates, facilement tend vers 0 extremum, aura une incidence sur les r�sultats. En outre, la fonction Relu a de nombreuses variantes, ces variantes dans l'exp�rience pour obtenir de meilleurs r�sultats, mais comparativement parlant, la fonction B-Swish, peu importe la fa�on dont le ton peut obtenir des r�sultats plus excellents, c'est aussi beaucoup d'exp�riences ont �t� confirm�es , vous pouvez essayer.

Ici pour parler de mod�le RNN, qui est pr�dictive d'une s�quence, un mod�le de s�quence. GBDT et DNN ne sont pas la s�rie mod�le, ils pr�disent les prochaines 48 heures pour un site, vous devez pr�voir 48 fois, la s�quence est de 48 �chantillons, la quantit� est relativement importante, la diff�rence refl�te principalement dans les pr�visions m�t�orologiques li�es � temps.

Le mod�le RNN va pr�dire les r�sultats d'une seule fois 48 heures de ces donn�es de formation seront beaucoup plus petits, mais une heure plus tard, il pr�dit les r�sultats avec les r�sultats pr�c�dents ont une certaine pertinence, il convient de r�soudre les s�ries chronologiques RNN probl�me.

Ensuite, je parle de cette structure du mod�le.

tout, en fait d'abord, en face du codeur Encoder avec le mod�le ordinaire tout comme son utilisation principale est GRU, la vitesse sera plus rapide. entr�e codeur principale des pr�visions m�t�orologiques historiques, des informations de qualit� de l'air.

Diff�rence d�codeur d�codeur mod�le mod�le classique grand, les pr�visions m�t�orologiques sont entr�es, l'heure et la station Embedding, sera en m�me temps ajout� � un r�sultat de pr�diction pour chaque section temporelle de l'entr�e. Par exemple, lorsque la sortie sortie Y1 volont� est reli�e � la partie de temps suivante, une premi�re partie de temps T1, pour une valeur d'entr�e de la dynamique de croissance, et l'indice de qualit� de l'air en cours, la partie arri�re du temps il n'y a pas de valeur ajout�e, il est de prendre les pr�visions � la suite de l'entr�e � l'unit� de temps suivante.

Nous avons constat� que le mod�le de s�rie chronologique est parfois pas tr�s stable. Nous avons rejoint la r�gularisation entre les s�quences. Nous pouvons regarder cette formule:

h (t) est la situation actuelle, h (t-1) est un �tat pr�c�dent quand un �tat, la diff�rence entre ces deux valeurs on a fait deux vues de c�t�, pour obtenir une op�ration de r�gularisation, il y a le plus � gauche formule b�ta], qui est utilis� pour �quilibrer les r�gles de la pr�diction deviendra plus stable.

Nous utilisons optimiseur Cocob, il n'a pas le rythme d'apprentissage, donc on n'a pas besoin d'ajuster le taux d'affichage. De plus, nous avons �galement des tests sur cette t�che, l'optimiseur fait mieux que l'autre optimiseur. Bien s�r, dans certains papier ont aussi travaill� sur cette optimiseur exp�rience, qui a fait une comparaison avec commun et optimiseur, montre �galement qu'il est en effet tr�s bien.

Enfin, Juan peut parler de mod�le d'int�gration et de la section de synth�se.

Lorsque plusieurs mod�le unique sont adapt�s � un �tat relativement bon, nous devons commencer � r�fl�chir � la fa�on de mettre un peu de mod�le unique d'int�gration. Apr�s la fusion des m�thodes g�n�rales mendient, le renforcement, le jalonnement, les comp�tences et le mod�le compte tenu du mod�le a une certaine �volutivit� (peut �tre l'�quivalent d'ajouter le mod�le de base plus), nous avons adopt� une structure jalonnement en deux �tapes.

La premi�re �tape du mod�le est GBDT vient d'�tre d�crit et DNN, RNN mod�les de r�seaux de neurones, et notre mod�le jalonnement, divis� en deux niveaux.

Dans une premi�re �tape, devant les donn�es de formation seront form�s environ un an, les deux derniers jours et un temps de pr�diction, de sorte que le nombre pr�vu de jours et de garder la ligne pour rendre la ligne. Et cela est aussi un probl�me, parce que le test mis en deux jours seulement, la quantit� de donn�es sera relativement faible. Par cons�quent, nous utilisons la fen�tre coulissante pour augmenter le nombre d'ensembles de test: deux jours pour glisser vers l'avant comme une unit�, le premier ensemble est �quivalent aux deux derniers jours que son jeu de test, et le second est le troisi�me plus bas quatre jours comme un ensemble de test, un ensemble d'une pluralit� de coulissement de m�me, on peut utiliser celui-ci les valeurs pr�vues, respectivement, par exemple, il y a une pr�diction de valeur GBDT, cette valeur en tant que 1, DNN caract�ristique a une valeur pr�dite, cette valeur comme dans lequel deux, puis de faire une collection de plusieurs �pissage, dans lequel une seconde �tape de formation en tant que valeurs de fusion. Cette fonction est un mod�le de premi�re �tape valeur pr�dictive, les donn�es sur l'�tiquette est son propre label.

S�lection du mod�le dans la deuxi�me �tape, nous avons commenc� � utiliser un mod�le GBDT, nous avons trouv� une forte instabilit� des donn�es de qualit� de l'air, et ce mod�le non lin�aire GBDT sujettes � surapprentissage. Ainsi, apr�s nous avons utilis� un mod�le lin�aire --linear de r�gression, nous avons de premi�re classe des mod�les pr�dictifs comme caract�ristiques, pour mener � bien la deuxi�me �tape du mod�le de formation.

Afin d'am�liorer les comp�tences du mod�le lin�aire, nous avons �galement adopt� deux m�thodes d'optimisation:

La premi�re optimisation est bas�e sur un mod�le de contraintes lin�aire, Hypoth�se derri�re la pr�diction du mod�le de la premi�re couche correspondre � la v�ritable valeur de la moyenne, la deuxi�me couche et n'affecte donc pas leur moyenne de mod�le de pr�diction.

La deuxi�me optimisation fait un mod�le lin�aire bas� sur l'introduction d'a priori , D'apr�s les r�sultats pr�vus en plusieurs dimensions du temps et de l'espace. Nous avons trouv� diff�rentes formes de mod�le � diff�rents moments ne sont pas les m�mes, par exemple, certains mod�les sont mieux � pr�dire dans un temps relativement court, et certains mod�les sont mieux au bout de 40 heures, donc afin d'am�liorer la mod�lisation � des p�riodes diff�rentes, respectivement, expression du mod�le. � 48 heures Correspond, 48 ont �t� form�s mod�le lin�aire � base de contraintes. Nous prenons en compte l'�quilibre de plus ajust� et moins en forme, le mod�le lin�aire bas� sur l'introduction artificielle a priori de non-lin�aire.

Dans la premi�re �tape de ce cadre de mod�le construction de fusion, qui construisent une vari�t� de fa�ons. Nous construisons � partir du mod�le de fonction deux angles: mod�les, topologie fait r�f�rence � la relation entre le temps et l'espace lors de l'utilisation DNN, RNN ces deux approches de mod�lisation. Caract�ris� en ce niveau, certaines caract�ristiques d'instabilit� tels que les rapports m�t�orologiques, les pr�visions m�t�o nous supprimons les caract�ristiques du mod�le, et pour les topologies, DNN �galement une certaine quantit� d'excision, plac� depuis longtemps et sont caract�ris�s par diff�rents mod�les , court m�trage, de sorte que vous pouvez produire le mod�le de diff�rence relativement forte.

La pr�cision du mod�le est S2S (RNN) > GBDT > DNN, afin d'am�liorer l'int�gration des parties sur par mille sept, ce qui est relativement importante. Principalement en raison du mod�le d'arbre de mod�le de r�seau de neurones a une diff�rence relativement forte, ce qui est la base du mod�le pour g�n�rer des revenus.

Ce processus, nous avons aussi certains veulent le faire mais ne pas avoir le temps de faire le travail:

Tout d'abord, la mod�lisation de la topologie pour l'emplacement g�ographique. Apr�s le fait, nous �voluons dans des donn�es g�ographiques DNN, souhaite la mod�lisation spatiale topologique avec CNN.

Le second est notre propre pour fournir une donn�e de cinq ans, mais en raison de contraintes de temps, on n'a pas eu le temps d'adopter. En fait, on peut voir � partir de cette analyse statistique, la qualit� de l'air a comme dans le temps d'�t� cyclique relativement forte, basse fr�quence de brume, relativement �lev�e en Mars et Avril. Dans ces cinq ann�es, nous pouvons effectivement attraper une base p�riodique mois, la saison, mis en place cette fonctionnalit�s de mod�lisation cycliques et cinq ann�es de donn�es, la croissance des b�n�fices devrait �galement avoir des dipl�mes.

En troisi�me lieu, les estimations d'erreur de profondeur faire un mod�le de pr�vision m�t�o. Avant bruit gaussien avec les pr�visions m�t�o, en supposant diff�rentes heures, il n'est pas la m�me erreur, mais l'erreur n'a pas �t� un facteur affectant des p�riodes diff�rentes, y compris les plus l'erreur r�cente un dans le temps, l'intervalle de temps mutation r�cente et la m�t�o conditions. Si notre approfondie, le mod�le d'estimation d'erreur peut �galement faire une pr�vision m�t�o.

Ceci est un r�sum� de notre processus it�ratif:

La premi�re �tape, la compr�hension du probl�me, et commencer fonction, les donn�es d'angle, creuser important de signal de quantit�. Nous avons constat� que plus important est le signal de donn�es de pr�visions m�t�orologiques, et donc comme un signal essentiel pour mener les caract�ristiques techniques d�taill�es.

La deuxi�me �tape, d'exprimer diff�rentes des caract�ristiques des probl�mes d'affaires gr�ce � l'ing�nierie. Nous essayons de mod�le du point de vue de l'optimisation, comme pour exprimer le temps des informations diff�rentes et l'espace, et ainsi le mod�le DNN unit�s con�ues de temps et de l'espace, ce qui en perspective plus � la mod�lisation des s�ries temporelles et des probl�mes topologiques, et avant travaux caract�ristiques de fonctionnement constituent un bon compl�ment.

La troisi�me �tape est �quivalente � r�soudre les principales caract�ristiques du mod�le et le mod�le de ces deux angles sont fusionn�s , Qui est bas� sur un mod�le lin�aire d'une contrainte de trame de fusion.

Nous pensons donc que Pour le probl�me de la compr�hension est le fondement, ainsi que des informations d�taill�es sur les �l�ments caract�ristiques du projet, ainsi que pour le probl�me d'�tudier les caract�ristiques de la mod�lisation du temps et de la profondeur de l'espace est la cl� de post-optimisation.

Ce sont les clients actuels partagent tous. Plus ouvert go vid�o de classe � Lei Feng r�seau AI Yanxishe montre communautaire. Mise au point sur le num�ro public micro-canal: AI Yanxishe (okweiwu), vous pouvez obtenir le dernier avis de temps en classe ouverte en direct.

Route de la soie

Apprenez � conna�tre la Chine

�quipe getMax: KDD CUP 2018 deux id�es couronne un probl�me de r�solution de sous-groupe | AI Yanxishe de 55 tables seront singer