équipe getMax: KDD CUP 2018 deux idées couronne un problème de résolution de sous-groupe | AI Yanxishe de 55 tables seront singer

KDD CUP cette année a mis en place trois prix, à savoir piste générale, Dernière prévision de dix jours et deuxième piste de prévision de 24 heures piste, de différentes dimensions récompense l'équipe exceptionnelle de performance. Par Luo Zhipeng, Hu, Huang composé forte équipe getMax, a remporté trois prix dans ces finaliste, les deux résultats de championnat, est la seule équipe a balayé trois prix. L'année dernière, l'équipe dirigée l'équipe a balayé Convolution également le champion KDD CUP 2017.

La photo montre la conférence internationale tenue récemment top accorder équipe SIGKDD getMax trois médailles de récompenses

Lei Feng réseau de l'année dernière, l'équipe a également mené un partage du rapport technique.

KDD Cup est découverte par l'exploration de données et de connaissances comité spécial de l'ACM (SIGKDD) a accueilli des données de recherche minière dans le domaine des grandes compétitions internationales, organisées chaque année depuis 1997. Chaque nombreux acteurs de l'industrie attirés ainsi que la communauté universitaire, il y a l'exploration de données « Jeux olympiques », a déclaré.

KDD Cup 2018 intitulé prédire la qualité de l'air, fournir des données météorologiques à Beijing, en Chine et à Londres par les organisateurs, les joueurs ont besoin afin de prédire les concentrations de PM2,5 / PM10 / O3 dans les prochaines 48 heures. Le titre du tournoi lui-même des environnements difficiles, améliorer l'être humain est d'une grande importance, et le problème lui-même a faible régularité des données, mutable, modélisation des séries temporelles et le défi des relations topologiques spatiale.

Récemment, sur Lei Feng réseau AI Yanxishe classe ouverte, l'équipe getMax a partagé la KDD CUP 2018 deux idées couronne un problème de résolution de sous-groupe, cette part est principalement axée sur les questions de qualité de l'air, les difficultés et les caractéristiques de conception étude approfondie ciblée modèle d'optimisation. Ouvrir l'URL de lecture vidéo de classe: http: //www.mooc.ai/open/course/530

personne Partager

Luo Zhipeng: ingénieur algorithme Microsoft Bing recherche publicitaire, Master of Software Engineering, l'Université de Pékin, axé sur la recherche et l'application de la technologie en PNL d'apprentissage profond, match de la pertinence des annonces, le CTR et d'autres estimations.

Huang forte: l'Université de Pékin Master of Software Engineering en lecture, de bonnes caractéristiques techniques, le traitement du langage naturel, l'apprentissage en profondeur.

Hu: Ali Mama algorithme de recherche des équipes de train d'experts, est diplômé de l'Université chinoise de Hong Kong direction d'apprentissage de la machine, la direction technique pour les algorithmes d'apprentissage de la profondeur de travail et de la publicité.

L'équipe a une grande expérience dans les applications d'apprentissage de la machine dans l'industrie et de la concurrence. CIKM 2018 équipe a remporté le championnat, KDD CUP champion 2017, Kaggle Outbrain Cliquez champion de prévision, la chaleur microblogging prédisent champion, applications BOT grandes données Shanghai championnat et ainsi de suite.

Partager Sujet: KDD CUP 2018 deux idées couronne une résolution de problèmes sous-groupe

grandes lignes de l'action:

la conception et la modélisation de problèmes compréhension de qualité de l'air

Projet Feature

l'optimisation du modèle d'apprentissage en profondeur

intégration du modèle

Lei Feng réseau AI Yanxishe au contenu des actions se résument comme suit:

Aujourd'hui, nous partageons avec tout le monde dans l'équipe est des solutions Cup KDD 2018. Tout d'abord vous présenter notre équipe getMax, capitaine de l'équipe Luo Zhipeng, est ingénieur de l'algorithme ad recherche Bing de Microsoft, Master of Software Engineering, l'Université de Pékin. Je suis un jaune fort, le maître actuel de génie logiciel à l'Université de Pékin à lire. Mais ma mère recherche de train Hu algorithmes équipe d'experts, est diplômé de la direction de la machine d'apprentissage de l'Université chinoise de Hong Kong.

Notre équipe possède une vaste industrie et de l'application de l'expérience d'apprentissage de la machine en compétition, déjà en Coupe CIKM 2018, KDD Cup 2017, Kaggle Outbrain Cliquez Prédiction autres jeux sont gagnés.

KDD 2018 est fixé cette année un total de trois prix, nous avons gagné deux titres, un résultat runner-up, est le seul en prenant trois prix de l'équipe.

Notre équipe viendra partager cette expérience de compétition KDD les quatre aspects suivants.

La première étape de la compétition est de faire la question de recherche appropriée - pour comprendre les enjeux et les données spécifiques est la base pour la modélisation Donc, nous allons être la compréhension et l'analyse du problème de cette compétition KDD.

Tout d'abord, une certaine expérience de la Coupe KDD 2018. Dans cette compétition, les organisateurs offrent une qualité de l'air, des données météorologiques historiques et les prévisions météo pour les deux prochains jours de données. Nous devons prévoir Pékin et Londres 48 sites près 48 heures de PM2,5 / PM10 / O3 concentrations. La fonction d'évaluation du concours est utilisé SMAPE:

.

La fonction d'évaluation est basée sur la fonction d'évaluation sur la norme MAE-1, divisé par la valeur moyenne prédite et la valeur réelle. La fonction d'évaluation peut être utilisée prévenir efficacement les problèmes de qualité de l'air propres à la note globale valeur anormale, par exemple, lorsque la mutation de masse d'air à une grande valeur, l'affaiblissement relatif du dénominateur peut être affectée.

Ensuite, parler de données. Les indicateurs de qualité de l'air, y compris les PM2,5, PM 10,03. les données météorologiques sur le terrain comprennent la température, la pression, l'humidité, la vitesse et direction du vent. Le même domaine dans lequel les données de prévisions météorologiques et sur le terrain des données météo, mais la différence est que le temps prévu le mois dernier offre une formation ensemble de données.

Ces données météorologiques sont données sous la forme d'une grille que les cartes divisée par une grille de latitude et de longitude, Pékin offre un total de plus de 600 points de grille, Londres peut fournir plus de 800 points de la grille, les dimensions de l'espace est très potentiel du robinet grande. Il est entendu que l'industrie existante et les milieux universitaires principalement grâce à la modélisation statistique, les séries chronologiques, etc., basée sur l'apprentissage de la machine, en particulier l'apprentissage à explorer la profondeur de la modélisation à un stade relativement précoce.

la difficultés concours Dans les domaines suivants:

Tout d'abord, les données de bruit et de l'instabilité, la qualité de l'air régularité faible concentration changent souvent rapidement.

En second lieu, les séries chronologiques de modélisation difficulté assez élevé: les besoins de chaque heure pour les prochaines 48 heures à prévoir. Pendant longtemps, la modélisation et la modélisation des dépendances entre l'état des séquences grand défi.

Troisièmement, le modèle topologique: la nécessité pour les deux villes un total de centaines de sites de faire des prédictions. La concentration entre les différents sites est tout à fait différente, la tendance est pas cohérente et avoir une certaine pertinence.

Après analyse des données, nous avons constaté que les changements dans la qualité de l'air dans la concentration de Pékin PM2.5 est tout à fait dramatique, qui est de Pékin valeur de concentration olympique de Février à Mai, sa valeur la plus basse pour aller à 10, la valeur la plus élevée peut être jusqu'à 350, et souvent il peut faire une énorme différence en quelques heures, la modélisation difficile.

Alors, comment les séries chronologiques modelant? Nous utilisons pour illustrer PPT, PPT représentant l'ensemble des données de séries chronologiques, nous pouvons maintenant acquis environ 17 ans 1 à 18 Janvier à Avril, puis délimitation du cercle. Ici, nous supposons que N est égal à 3, les données de temps qui reste est équivalent à 17 de Janvier Janvier 1 au 17 mars, le côté droit est de 4 à 5 Total 48 heures. Étant donné que seul un modèle de prévision utilisé, nous avons besoin de 48 à 48 heures de glissement échantillons fractionnés, la masse d'air par heure, ce qui est une étiquette échantillon, identifié par un drapeau dans lequel le premier numéro de séquence. De cette façon, nous pouvons mettre problème de prévision des séries chronologiques dans une régression unique objectif traditionnel.

Nous voulons extraire les données dans les jours précédents N pour construire les fonctions d'ensemble de la formation, il peut produire le tour 48 échantillons de glissement, peut produire un total de 860.000 échantillons. Ensuite, nous pouvons prendre les 15 derniers jours ou faire l'ensemble de validation, en raison des données de séries chronologiques ne répond pas aux indépendants et identiquement distribués, ne convient pas à faire plus la validation croisée. Et parce que ce titre du tournoi dans différentes villes de facteurs d'impact sur la qualité de l'air varient, réparties tout à fait différent, donc nous devons PM2.5 à Pékin, PM 10,03 et PM2,5 London, PM 10 La construction de ces cinq indicateurs modèle à cinq.

Ensuite, nous présentons les uvres de fonction. Caractéristiques déterminent souvent la limite supérieure du modèle aux travaux de fonction, nous devons d'abord construire un modèle de référence, sur cette base, afin de vérifier les caractéristiques de validité.

modèle GBDT parce que ses avantages évidents de la stabilité au bruit et similaires, pour la vérification appropriée des uvres de fonction. Nous utilisons des caractéristiques de qualité de l'air dans le passé 72 heures chaque site pour construire le modèle à partir des caractéristiques de base de la station météorologique la plus proche des points de grille dans les 72 dernières heures.

Cet effet est un modèle prédictif de la figure de base, peut être vu de la figure, seule l'utilisation de ces fonctions, et ne peut pas refléter la valeur réelle de la tendance.

Sur la base du modèle de base, nous avons analysé la corrélation entre la qualité de l'air, les données météo, nous avons constaté que le changement de changement 73,7% de la qualité de l'air et la vitesse du vent, direction du vent associé. Nous considérons donc l'introduction de fonctions sur la base des prévisions météorologiques modèle GBDT, mais la fonction de prévision météo seulement n ° 10 Avril 2018 a commencé à offrir l'absence de plus d'un an de données - comment remplir les données de prévision météo manquante est un point clé.

En règle générale, la méthode consiste à remplir les valeurs manquantes en utilisant les valeurs moyennes et par défaut, mais ces méthodes ne produisent pas de bons résultats. Par conséquent, nous utilisons temps réel pour remplir les prévisions météo des valeurs manquantes, cependant, ce qui crée un nouveau problème - il est plus incompatible avec la distribution réelle des prévisions météorologiques météo, facilement conduire à trop adapter la formation, donc nous Envisager d'essayer l'utilisation de l'apprentissage de transfert pour résoudre ce problème .

Nous prenons pré-formation sur l'ensemble de la formation, avec temps réel, pour se recycler la façon dont les prévisions météo pour l'ensemble de la formation pour construire le modèle. Cependant, l'expérience a révélé que seulement le mois dernier les données de prévisions météo, et ne peut pas couvrir tout le temps une bonne distribution, donc ce modèle pour prédire l'effet de l'instabilité dans l'avenir.

Finalement, nous avons introduit pour surmonter le bruit gaussien, distribution gaussienne pour estimer la moyenne et la variance réelle météorologiques et les prévisions météorologiques, et pour tous les paramètres d'estimation de l'heure afin d'obtenir un bruit gaussien plus précis. De plus, nous utilisons également binning pour faciliter encore la bonne distribution des prévisions météo inconsistance aux valeurs réelles du problème.

Après l'assouplissement des incohérences, nous pensons que renforcer davantage l'espace que l'exploitation minière étendue à partir d'un seul point à multipoint de l'excavation. Du fait que les points de données maillés pour fournir des prévisions météorologiques et plus, une grande quantité d'informations, une grande pièce à explorer, nous avons donc autre caractéristique de l'exploitation des données de prévisions météorologiques. Nous étions près de huit directions pour chaque station météorologique la plus proche des caractéristiques de points de grille, en particulier la qualité de l'air, de sorte que vous pouvez faire des statistiques plus complète et stable. Compte tenu de l'air ont une plus grande mobilité, une plus grande gamme d'emplacements en dehors de la ville et même la ville il y a une certaine influence les uns des autres dans la prochaine période de temps, nous latitude et la portée longitude plus de 12 mesh est caractéristique de l'ensemble prévisions météo de la ville l'extraction et l'utilisation de ces fonctionnalités pour construire nos modèles de prévision météorologique ultime.

À titre de comparaison, nous constatons que la prévision Karte Station Olympic Sports Center de Pékin le 28 mai et le 29 montre cette figure une tempête de sable au petit matin de ce jour-là, ce qui conduit à une augmentation de la concentration des PM2,5, plus tard changé pour le meilleur temps a continué à 4 en quelques heures, les valeurs de PM2,5 de 160 jusqu'à 30, puis a chuté à 10, la qualité de l'air mutation très sévère. Notre modèle prédit que cette ligne orange de base, la prévision du modèle final est que cette ligne verte, par rapport à la ligne orange plus proche de la valeur réelle (ligne bleue). Ainsi, le modèle final reflète plus précisément la valeur réelle de la tendance de l'air.

Nous avons utilisé six lots de fonctionnalités, y compris certaines caractéristiques de base telles que l'avenir de quelques heures, dont certaines caractéristiques du site ou de temps, les caractéristiques de qualité de l'air, les statistiques météorologiques historiques, mais la chose la plus importante est la qualité du temps, les caractéristiques topologiques. En même temps, nous devons changer certaines caractéristiques de l'histoire de l'extraction, telles que les statistiques de l'intervalle maximal PM2,5 et les valeurs minimales.

Enfin, le modèle que nous devons construire des autres caractéristiques sélectionnées, modèle de temps d'exécution abrégé. L'importance de notre choisie par le gain de fonction de séparation fonction GBDT à fonction de sélection, le choix final de 885 caractéristiques de 2027 propose de construire le modèle final. En raison de conflits entre les fonctions, donc nous utilisons la même approche ensachage généré au hasard, un groupe de fonctions, dans lequel chaque groupe va construire un modèle, puis prendre la forme de la valeur de prédiction pondérée de chaque modèle de fusion pour construire la finale modèle. Aussi est entré dans la phase suivante du projet, il y a des goulots d'étranglement dans la fonction - construire plusieurs modèles.

Suivi par notre capitaine Luo Zhipeng d'introduire Modèle d'optimisation de la profondeur . (Luo Zhipeng :) Voici nos deux principaux modèles de réseaux de neurones.

modèles de réseaux de neurones ont également une capacité très forte interactif non-linéaire, parce que nous avons commencé plus tôt, quand il est utilisé le modèle GBDT, modèle DNN est en fait le modèle GBDT a une très grande différence. utiliser plus tard modèle DNN pour faire l'intégration, vous pouvez toujours obtenir l'ascenseur maximum.

Compétences modèle GBDT dans le temps et le niveau de l'espace ne suffit pas. Niveau dans le temps, les caractéristiques de chaque échantillon sont sensiblement similaires, de sorte que l'on ajoute à ces caractéristiques un drapeau pour les prochaines 48 heures, avec 0-47 pour l'identification. En même temps, étant donné que les principales caractéristiques des informations historiques telles que l'histoire de la qualité de l'air, le temps a représenté une proportion relativement importante des caractéristiques, le résultat des différences dans certaines des caractéristiques des prévisions météorologiques liées à la fois que nous rapetissent, et la différence avec la valeur réelle est relativement importante. De plus, nous avons également constaté que l'importance de cette période de fonction 0-47 est particulièrement élevé.

Dans l'espace, il y a 13 sites à Londres, Pékin dispose de 35 sites, également son codage numérique, mais les compétences limitées.

Ensuite, nous présenter notre modèle DNN.

gauche est Dense cette fonction que nous GBDT les fonctions utilisées. Lorsque vous soulevez fonction à noter est que nous devons d'abord être normalisé, de manière standardisée à moyenne et l'écart type statistique classique sur l'ensemble d'apprentissage. Nous avons constaté que la distribution de cet ensemble de données ne sont pas les mêmes que manque le point - remplir la partie manquante des points de distribution diffèrent grandement, nous avons donc une opération spéciale dans la normalisation du temps à faire: Tout d'abord, les statistiques moyennes et écart-type, ignorer null; done normalisation opération, puis de remplir les valeurs nulles, et après un traitement supplémentaire de la valeur anormale, une plus grande valeur supérieure à 0,3 et inférieure à 0,3 pour le démontage, réduite à la plage comprise entre 3 et -3. Pour les valeurs manquantes, également exprimé bit de marquage spécial, et nous l'avons mis concat et obtenir les fonctionnalités standard d'ensemble.

Si laissé seul présentation caractéristique Dense, les résultats que nous obtenons seront très similaires, il est 0-47 heures le résultat fluctuera entre une valeur, mais la différence entre eux est pas grande. Lorsque nous optimisons le modèle dans le dos, a rejoint l'optimisation conjointe du temps et la modélisation de l'information spatiale.

Le regard de déposons sur la partie droite du modèle. Première heure (h) 0 à 47 savoir, pour l'enrobage, ce qui entraîne dans le temps de l'expression, une partie station du même Pékin 35, 13 pour incorporer Londres, ne transformation non linéaire, cette partie représente y × couche d'élément de cercle, le temps et l'information de l'espace intégreront dans l'information espace-temps, puis à travers le entièrement connecté, par [sigma], pour donner cette partie Seuil espace-temps (Gate) Ce temps d'intégration de l'information et de l'espace. Ce seuil est utilisé pour contrôler le côté gauche du corps principal de l'information de structure de modèle, les résultats prédits différences seront relativement grande. la modélisation conjointe afin d'optimiser le temps et l'espace non seulement d'améliorer la précision et le modèle d'arbre a une grande différence.

Nous fonctionnons d'activation utilisé ici est le B-Swish. La fonction d'activation est proposé par Google à venir, nous pouvons regarder le tableau de la fonction, il est en fait un non saturé, lisse, non-monotones, la fonction de la limite inférieure sans bornes. fonction tanh et la fonction associée sigmoïde, leurs extrémités de motif relativement plates, facilement tend vers 0 extremum, aura une incidence sur les résultats. En outre, la fonction Relu a de nombreuses variantes, ces variantes dans l'expérience pour obtenir de meilleurs résultats, mais comparativement parlant, la fonction B-Swish, peu importe la façon dont le ton peut obtenir des résultats plus excellents, c'est aussi beaucoup d'expériences ont été confirmées , vous pouvez essayer.

Ici pour parler de modèle RNN, qui est prédictive d'une séquence, un modèle de séquence. GBDT et DNN ne sont pas la série modèle, ils prédisent les prochaines 48 heures pour un site, vous devez prévoir 48 fois, la séquence est de 48 échantillons, la quantité est relativement importante, la différence reflète principalement dans les prévisions météorologiques liées à temps.

Le modèle RNN va prédire les résultats d'une seule fois 48 heures de ces données de formation seront beaucoup plus petits, mais une heure plus tard, il prédit les résultats avec les résultats précédents ont une certaine pertinence, il convient de résoudre les séries chronologiques RNN problème.

Ensuite, je parle de cette structure du modèle.

tout, en fait d'abord, en face du codeur Encoder avec le modèle ordinaire tout comme son utilisation principale est GRU, la vitesse sera plus rapide. entrée codeur principale des prévisions météorologiques historiques, des informations de qualité de l'air.

Différence décodeur décodeur modèle modèle classique grand, les prévisions météorologiques sont entrées, l'heure et la station Embedding, sera en même temps ajouté à un résultat de prédiction pour chaque section temporelle de l'entrée. Par exemple, lorsque la sortie sortie Y1 volonté est reliée à la partie de temps suivante, une première partie de temps T1, pour une valeur d'entrée de la dynamique de croissance, et l'indice de qualité de l'air en cours, la partie arrière du temps il n'y a pas de valeur ajoutée, il est de prendre les prévisions à la suite de l'entrée à l'unité de temps suivante.

Nous avons constaté que le modèle de série chronologique est parfois pas très stable. Nous avons rejoint la régularisation entre les séquences. Nous pouvons regarder cette formule:

.

h (t) est la situation actuelle, h (t-1) est un état précédent quand un état, la différence entre ces deux valeurs on a fait deux vues de côté, pour obtenir une opération de régularisation, il y a le plus à gauche formule bêta], qui est utilisé pour équilibrer les règles de la prédiction deviendra plus stable.

Nous utilisons optimiseur Cocob, il n'a pas le rythme d'apprentissage, donc on n'a pas besoin d'ajuster le taux d'affichage. De plus, nous avons également des tests sur cette tâche, l'optimiseur fait mieux que l'autre optimiseur. Bien sûr, dans certains papier ont aussi travaillé sur cette optimiseur expérience, qui a fait une comparaison avec commun et optimiseur, montre également qu'il est en effet très bien.

Enfin, Juan peut parler de modèle d'intégration et de la section de synthèse.

Lorsque plusieurs modèle unique sont adaptés à un état relativement bon, nous devons commencer à réfléchir à la façon de mettre un peu de modèle unique d'intégration. Après la fusion des méthodes générales mendient, le renforcement, le jalonnement, les compétences et le modèle compte tenu du modèle a une certaine évolutivité (peut être l'équivalent d'ajouter le modèle de base plus), nous avons adopté une structure jalonnement en deux étapes.

La première étape du modèle est GBDT vient d'être décrit et DNN, RNN modèles de réseaux de neurones, et notre modèle jalonnement, divisé en deux niveaux.

Dans une première étape, devant les données de formation seront formés environ un an, les deux derniers jours et un temps de prédiction, de sorte que le nombre prévu de jours et de garder la ligne pour rendre la ligne. Et cela est aussi un problème, parce que le test mis en deux jours seulement, la quantité de données sera relativement faible. Par conséquent, nous utilisons la fenêtre coulissante pour augmenter le nombre d'ensembles de test: deux jours pour glisser vers l'avant comme une unité, le premier ensemble est équivalent aux deux derniers jours que son jeu de test, et le second est le troisième plus bas quatre jours comme un ensemble de test, un ensemble d'une pluralité de coulissement de même, on peut utiliser celui-ci les valeurs prévues, respectivement, par exemple, il y a une prédiction de valeur GBDT, cette valeur en tant que 1, DNN caractéristique a une valeur prédite, cette valeur comme dans lequel deux, puis de faire une collection de plusieurs épissage, dans lequel une seconde étape de formation en tant que valeurs de fusion. Cette fonction est un modèle de première étape valeur prédictive, les données sur l'étiquette est son propre label.

Sélection du modèle dans la deuxième étape, nous avons commencé à utiliser un modèle GBDT, nous avons trouvé une forte instabilité des données de qualité de l'air, et ce modèle non linéaire GBDT sujettes à surapprentissage. Ainsi, après nous avons utilisé un modèle linéaire --linear de régression, nous avons de première classe des modèles prédictifs comme caractéristiques, pour mener à bien la deuxième étape du modèle de formation.

Afin d'améliorer les compétences du modèle linéaire, nous avons également adopté deux méthodes d'optimisation:

La première optimisation est basée sur un modèle de contraintes linéaire, Hypothèse derrière la prédiction du modèle de la première couche correspondre à la véritable valeur de la moyenne, la deuxième couche et n'affecte donc pas leur moyenne de modèle de prédiction.

La deuxième optimisation fait un modèle linéaire basé sur l'introduction d'a priori , D'après les résultats prévus en plusieurs dimensions du temps et de l'espace. Nous avons trouvé différentes formes de modèle à différents moments ne sont pas les mêmes, par exemple, certains modèles sont mieux à prédire dans un temps relativement court, et certains modèles sont mieux au bout de 40 heures, donc afin d'améliorer la modélisation à des périodes différentes, respectivement, expression du modèle. À 48 heures Correspond, 48 ont été formés modèle linéaire à base de contraintes. Nous prenons en compte l'équilibre de plus ajusté et moins en forme, le modèle linéaire basé sur l'introduction artificielle a priori de non-linéaire.

Dans la première étape de ce cadre de modèle construction de fusion, qui construisent une variété de façons. Nous construisons à partir du modèle de fonction deux angles: modèles, topologie fait référence à la relation entre le temps et l'espace lors de l'utilisation DNN, RNN ces deux approches de modélisation. Caractérisé en ce niveau, certaines caractéristiques d'instabilité tels que les rapports météorologiques, les prévisions météo nous supprimons les caractéristiques du modèle, et pour les topologies, DNN également une certaine quantité d'excision, placé depuis longtemps et sont caractérisés par différents modèles , court métrage, de sorte que vous pouvez produire le modèle de différence relativement forte.

La précision du modèle est S2S (RNN) > GBDT > DNN, afin d'améliorer l'intégration des parties sur par mille sept, ce qui est relativement importante. Principalement en raison du modèle d'arbre de modèle de réseau de neurones a une différence relativement forte, ce qui est la base du modèle pour générer des revenus.

Ce processus, nous avons aussi certains veulent le faire mais ne pas avoir le temps de faire le travail:

Tout d'abord, la modélisation de la topologie pour l'emplacement géographique. Après le fait, nous évoluons dans des données géographiques DNN, souhaite la modélisation spatiale topologique avec CNN.

Le second est notre propre pour fournir une donnée de cinq ans, mais en raison de contraintes de temps, on n'a pas eu le temps d'adopter. En fait, on peut voir à partir de cette analyse statistique, la qualité de l'air a comme dans le temps d'été cyclique relativement forte, basse fréquence de brume, relativement élevée en Mars et Avril. Dans ces cinq années, nous pouvons effectivement attraper une base périodique mois, la saison, mis en place cette fonctionnalités de modélisation cycliques et cinq années de données, la croissance des bénéfices devrait également avoir des diplômes.

En troisième lieu, les estimations d'erreur de profondeur faire un modèle de prévision météo. Avant bruit gaussien avec les prévisions météo, en supposant différentes heures, il n'est pas la même erreur, mais l'erreur n'a pas été un facteur affectant des périodes différentes, y compris les plus l'erreur récente un dans le temps, l'intervalle de temps mutation récente et la météo conditions. Si notre approfondie, le modèle d'estimation d'erreur peut également faire une prévision météo.

Ceci est un résumé de notre processus itératif:

La première étape, la compréhension du problème, et commencer fonction, les données d'angle, creuser important de signal de quantité. Nous avons constaté que plus important est le signal de données de prévisions météorologiques, et donc comme un signal essentiel pour mener les caractéristiques techniques détaillées.

La deuxième étape, d'exprimer différentes des caractéristiques des problèmes d'affaires grâce à l'ingénierie. Nous essayons de modèle du point de vue de l'optimisation, comme pour exprimer le temps des informations différentes et l'espace, et ainsi le modèle DNN unités conçues de temps et de l'espace, ce qui en perspective plus à la modélisation des séries temporelles et des problèmes topologiques, et avant travaux caractéristiques de fonctionnement constituent un bon complément.

La troisième étape est équivalente à résoudre les principales caractéristiques du modèle et le modèle de ces deux angles sont fusionnés , Qui est basé sur un modèle linéaire d'une contrainte de trame de fusion.

Nous pensons donc que Pour le problème de la compréhension est le fondement, ainsi que des informations détaillées sur les éléments caractéristiques du projet, ainsi que pour le problème d'étudier les caractéristiques de la modélisation du temps et de la profondeur de l'espace est la clé de post-optimisation.

Ce sont les clients actuels partagent tous. Plus ouvert go vidéo de classe à Lei Feng réseau AI Yanxishe montre communautaire. Mise au point sur le numéro public micro-canal: AI Yanxishe (okweiwu), vous pouvez obtenir le dernier avis de temps en classe ouverte en direct.

Ou encore un long chemin à tester sur le marché de nouvelles années MPV Detroit
Précédent
robot de nettoyage de pierre Expérience: continuation du style design, passer la serpillière avec un plus pratique et mieux
Prochain
« Développer un esprit de combat national » exposer « vodka Bureau » père de fragments mis en place un « Banquet », fils ivre rap jeu
Big Joe compétences flux détaillé, tourbillon dans l'eau la vapeur vous prendre par la porte
La nouvelle MINI Countryman mis en vente à partir de 286000 yuans
Tomohiro sera lourd débuts, Huawei pour construire la ville intelligente « terre noire »
Compagnons Papa fiable, la marche sur le bord de la vache magique
Obtenir un nouveau goût! Air Max 97 fille de serpent « poudre » valeurs de texture et de table de salve couleur bis
premier phare Snapdragon 855 avis au monde! Lenovo Z5 Pro GT comment se comporter?
Mais aussi parce qu'il va acheter iPhone X! expérience de reconnaissance du visage est tout simplement imbattable!
« Chambre des Secrets Escape » à la réputation de box-office gagner le public animé « regret manqué une année »!
Marco Polo a déclenché un règne de terreur avec des fusils que vous
Grande optimisation des vagues! « Millet gunfight » prend désormais en charge tous les principaux modèles en cours d'exécution en douceur
À travers la mise à niveau du conseil d'administration: la mise à niveau nouvelle Camry 2.0L puissance tnga, débuts version sport bi-moteur