Note de réseau Lei Feng: Le mois dernier (23 Février), Facebook basé sur un langage open source Python et outil de prévision des données R - "prophète". Cet article présente la pratique de l'inférence bayésienne Prophète, montrant en particulier les chercheurs ont utilisé deux séries de données sur les résultats d'exploitation du Prophète.
Aujourd'hui, le marché a beaucoup de modèle de prévision série langage de temps applicable R et Python, puis Facehook le Prophète dans ce domaine et quel avantage?
Prophète fait une prédiction, il est une probabilité de systèmes dorsaux langage de programmation Stan, qui représente prophète peut jouer un grand nombre d'avantages de l'algorithme bayésien, par exemple:
-
Alors que le modèle est simple, facile à expliquer la structure périodique;
-
les résultats prévus ne comprennent que la distribution complète postérieure dérivée intervalle de confiance, que le Prophète fournit une estimation des risques basées sur les données.
Dans l'étude suivante, les chercheurs ont laissé le prophète des deux ensembles de données pour prédire la probabilité d'utilisation dans le langage de programmation back-end, les lecteurs peuvent prendre pour voir l'utilisation de certains des détails du travail de Stan.
Prophète en utilisant un modèle de série temporelle commune, qui est applicable aux données sur Facebook, et ayant un segment de (tendances par morceaux) et élastiques jours multi-cycles (vacances flottante) trois propriétés.
Prophète des séries temporelles problèmes de prévision d'un exercice transformé en courbe d'ajustement (exercice). Dans ce graphique, la variable dépendante est la croissance globale du rendement et des périodes de vacances sont.
-
Croissance (croissance)
Cette pièce est une croissance non linéaire modèle de croissance logique variant dans le temps, donc, d'utiliser la fonction constante simple linéaire par morceaux pour simuler la croissance.
En ajustant le rapport du point de vecteur segment analogique, chaque segment correspond à un point particulier de points de temps. Distribution (distribution de Laplace) analogique ajustant le rapport du paramètre de position de la variable de Laplace (paramètre de localisation) est réglé sur 0.
-
cycle de modèle Prophète (saisonnalité périodique)
série de Fourier standard. , La périodicité Zhou (le caractère saisonnier) Valeur approximative de 20 et 6, respectivement, la composante périodique (composante saisonnière) est lissé dans un état dans des conditions normales.
-
Location (vacances)
Avec une fonction d'indicateur pour simuler.
Les utilisateurs peuvent ajuster les paramètres de diffusion (paramètre diffusion), pour simuler des variations saisonnières beaucoup historiques (variation saisonnière historique) dans l'avenir il y aura.
Utilisez le Prophète
Lorsqu'un utilisateur prophète, Stan pas besoin de connaître le code, en utilisant le langage de programmation Python seulement bien connu ou R peut.
Ensuite, les chercheurs ont laissé courir sur un ensemble de données très périodique (procédure de fonctionnement ci-dessous).
L'ensemble de données est la teneur en dioxyde de carbone atmosphérique mesurée Hawaii volcans Monaco.
Après la mise en programme, à seulement quelques secondes, le modèle représenté sur la figure donnée la prédiction:
Prophète est facile de détecter les données sur un cycle annuel, et la tendance de croissance à long terme. Ici, il faut mentionner, le Prophète est livré avec un intervalle de confiance axée sur les données, ce qui est un avantage important du système de programmation probabiliste.
De plus, fournit également une pièce simple prophète (par exemple, le jour de la semaine, ou jour de l'année) les résultats de la prévision des séries chronologiques faciles à expliquer, comme indiqué ci-dessous:
Ici, il faut noter que, sur une base hebdomadaire des données prévisionnelles sont beaucoup plus petite que les deux autres données, mais le bruit est plus. Il est très intéressant de savoir ce qui laisse penser que à l'échelle mondiale, les produits chimiques dans l'atmosphère n'est pas un changement de cycle hebdomadaire; De plus, les données montrent également l'influence de la végétation sur l'hémisphère Nord niveaux de dioxyde de carbone: réduire la teneur après l'été, l'augmentation du contenu après l'hiver.
données sur les naissances
Maintenant, les chercheurs ont Prophète sur un groupe de plus difficile ensemble de données (nombre de naissances aux États-Unis) à prévoir.
L'ensemble de données par un processus gaussien (Lei net Note: également appelé processus aléatoire normal) a été analysé et il a aussi un périodique « effet de vacances. »
Prophète détecte automatiquement le point d'inflexion en ajustant le tournant paramètres de lissage. Les chercheurs tournant paramètre de lissage point de consigne de 0,1, au lieu de la valeur par défaut de 0,05. Cela permet de prédiction résultat plus souple, moins lisse, mais aussi plus facile à un bruit d'affichage.
Prophète a pris environ 1 minute dans ces ensembles de données pour comprendre que des points noirs figure), et donne ensuite les résultats prévus (la ligne bleue dans la figure).
Prophète a prédit le taux de natalité sera augmenté chaque année en Août à Octobre.
Peut être vu de la figure, moins le nombre de naissances au cours de la nouvelle année et la Saint Valentin est élevé. Prophète par définition indique série variable (indicateur de la série variable), les données sur les quelques jours cette année tout à coup le phénomène de l'augmentation vu automatiquement « vacances », cette série de variables indicatrices peuvent expliquer (ou prédire) le point de données ne sont pas (ou ou non être) un jour férié.
résumé
Probabilité rapport ci-dessus du programme montre l'effet pratique de l'algorithme bayésien Prophète, et a constaté que:
-
Les développeurs et les membres de leurs données par le langage de programmation de probabilité (comme Stan et pymc3), plus facile à quantifier tous les résultats des valeurs de probabilité, plutôt que de choisir juste la possibilité de plus qu'un;
-
Ce faisant la prévision, il est une séquence de simulation de fonction appropriée de temps universel. Mais les fonctions analogiques, afin d'obtenir l'effet désiré utilisateur Prophète, vous pouvez sacrifier une certaine souplesse;
-
Prophète permet aux chercheurs de plus facilement et rapidement courir Stan, ce qui élimine la nécessité d'une utilisation complexe de Python et R;
-
La robustesse du Prophète ainsi que la probabilité d'un produit de programme, les utilisateurs peuvent facilement commencer.
via: fastforwardlabs
Articles connexes, voir réseau Lei Feng précédemment rapporté:
Cloudera environnement de développement des données scientifiques auto-publié un support natif pour R, Python, Scala et principal cadre open source
Google open source Python feu, lire une carte Python, R, et d'autres grandes applications de données | développeurs AI titres