Quels sont les avantages des outils de prévision des données Facebook Prophète? inférence bayésienne pour savoir

Note de réseau Lei Feng: Le mois dernier (23 Février), Facebook basé sur un langage open source Python et outil de prévision des données R - "prophète". Cet article présente la pratique de l'inférence bayésienne Prophète, montrant en particulier les chercheurs ont utilisé deux séries de données sur les résultats d'exploitation du Prophète.

Aujourd'hui, le marché a beaucoup de modèle de prévision série langage de temps applicable R et Python, puis Facehook le Prophète dans ce domaine et quel avantage?

Prophète fait une prédiction, il est une probabilité de systèmes dorsaux langage de programmation Stan, qui représente prophète peut jouer un grand nombre d'avantages de l'algorithme bayésien, par exemple:

  • Alors que le modèle est simple, facile à expliquer la structure périodique;

  • les résultats prévus ne comprennent que la distribution complète postérieure dérivée intervalle de confiance, que le Prophète fournit une estimation des risques basées sur les données.

Dans l'étude suivante, les chercheurs ont laissé le prophète des deux ensembles de données pour prédire la probabilité d'utilisation dans le langage de programmation back-end, les lecteurs peuvent prendre pour voir l'utilisation de certains des détails du travail de Stan.

Prophète en utilisant un modèle de série temporelle commune, qui est applicable aux données sur Facebook, et ayant un segment de (tendances par morceaux) et élastiques jours multi-cycles (vacances flottante) trois propriétés.

Prophète des séries temporelles problèmes de prévision d'un exercice transformé en courbe d'ajustement (exercice). Dans ce graphique, la variable dépendante est la croissance globale du rendement et des périodes de vacances sont.

  • Croissance (croissance)

    Cette pièce est une croissance non linéaire modèle de croissance logique variant dans le temps, donc, d'utiliser la fonction constante simple linéaire par morceaux pour simuler la croissance.

    En ajustant le rapport du point de vecteur segment analogique, chaque segment correspond à un point particulier de points de temps. Distribution (distribution de Laplace) analogique ajustant le rapport du paramètre de position de la variable de Laplace (paramètre de localisation) est réglé sur 0.

  • cycle de modèle Prophète (saisonnalité périodique)

    série de Fourier standard. , La périodicité Zhou (le caractère saisonnier) Valeur approximative de 20 et 6, respectivement, la composante périodique (composante saisonnière) est lissé dans un état dans des conditions normales.

  • Location (vacances)

    Avec une fonction d'indicateur pour simuler.

Les utilisateurs peuvent ajuster les paramètres de diffusion (paramètre diffusion), pour simuler des variations saisonnières beaucoup historiques (variation saisonnière historique) dans l'avenir il y aura.

Utilisez le Prophète

Lorsqu'un utilisateur prophète, Stan pas besoin de connaître le code, en utilisant le langage de programmation Python seulement bien connu ou R peut.

Ensuite, les chercheurs ont laissé courir sur un ensemble de données très périodique (procédure de fonctionnement ci-dessous).

L'ensemble de données est la teneur en dioxyde de carbone atmosphérique mesurée Hawaii volcans Monaco.

Après la mise en programme, à seulement quelques secondes, le modèle représenté sur la figure donnée la prédiction:

Prophète est facile de détecter les données sur un cycle annuel, et la tendance de croissance à long terme. Ici, il faut mentionner, le Prophète est livré avec un intervalle de confiance axée sur les données, ce qui est un avantage important du système de programmation probabiliste.

De plus, fournit également une pièce simple prophète (par exemple, le jour de la semaine, ou jour de l'année) les résultats de la prévision des séries chronologiques faciles à expliquer, comme indiqué ci-dessous:

Ici, il faut noter que, sur une base hebdomadaire des données prévisionnelles sont beaucoup plus petite que les deux autres données, mais le bruit est plus. Il est très intéressant de savoir ce qui laisse penser que à l'échelle mondiale, les produits chimiques dans l'atmosphère n'est pas un changement de cycle hebdomadaire; De plus, les données montrent également l'influence de la végétation sur l'hémisphère Nord niveaux de dioxyde de carbone: réduire la teneur après l'été, l'augmentation du contenu après l'hiver.

données sur les naissances

Maintenant, les chercheurs ont Prophète sur un groupe de plus difficile ensemble de données (nombre de naissances aux États-Unis) à prévoir.

L'ensemble de données par un processus gaussien (Lei net Note: également appelé processus aléatoire normal) a été analysé et il a aussi un périodique « effet de vacances. »

Prophète détecte automatiquement le point d'inflexion en ajustant le tournant paramètres de lissage. Les chercheurs tournant paramètre de lissage point de consigne de 0,1, au lieu de la valeur par défaut de 0,05. Cela permet de prédiction résultat plus souple, moins lisse, mais aussi plus facile à un bruit d'affichage.

Prophète a pris environ 1 minute dans ces ensembles de données pour comprendre que des points noirs figure), et donne ensuite les résultats prévus (la ligne bleue dans la figure).

Prophète a prédit le taux de natalité sera augmenté chaque année en Août à Octobre.

Peut être vu de la figure, moins le nombre de naissances au cours de la nouvelle année et la Saint Valentin est élevé. Prophète par définition indique série variable (indicateur de la série variable), les données sur les quelques jours cette année tout à coup le phénomène de l'augmentation vu automatiquement « vacances », cette série de variables indicatrices peuvent expliquer (ou prédire) le point de données ne sont pas (ou ou non être) un jour férié.

résumé

Probabilité rapport ci-dessus du programme montre l'effet pratique de l'algorithme bayésien Prophète, et a constaté que:

  • Les développeurs et les membres de leurs données par le langage de programmation de probabilité (comme Stan et pymc3), plus facile à quantifier tous les résultats des valeurs de probabilité, plutôt que de choisir juste la possibilité de plus qu'un;

  • Ce faisant la prévision, il est une séquence de simulation de fonction appropriée de temps universel. Mais les fonctions analogiques, afin d'obtenir l'effet désiré utilisateur Prophète, vous pouvez sacrifier une certaine souplesse;

  • Prophète permet aux chercheurs de plus facilement et rapidement courir Stan, ce qui élimine la nécessité d'une utilisation complexe de Python et R;

  • La robustesse du Prophète ainsi que la probabilité d'un produit de programme, les utilisateurs peuvent facilement commencer.

via: fastforwardlabs

Articles connexes, voir réseau Lei Feng précédemment rapporté:

Cloudera environnement de développement des données scientifiques auto-publié un support natif pour R, Python, Scala et principal cadre open source

Google open source Python feu, lire une carte Python, R, et d'autres grandes applications de données | développeurs AI titres

BNM "Dynasty Warriors 8" publication Limited Edition contient la carte 94 chiffres
Précédent
Elle a salué Joey Vietnam Wang », il y a d'innombrables Yan a le corps devient rose!
Prochain
arrivée US Yansheng Shi! Je dois dire que la beauté OPPO modernisation technologique à l'esprit
Spécial | Le cuisinier recommande le jeu magique, jouer mon cerveau fait mal large aveugle
Après Deng Chao Chen He Wong Cho Lam Luhan, les hommes courent loin d'eux tout de suite? Nous savons plus après la douleur cardiaque
Xbox « Monster Hunter World » apparaît problème correspondant en ligne
Les voitures de luxe, des centaines de véhicules, Voyage en jet privé, après le 90 prince exactement la richesse?
Plusieurs années plus tard Joe Chen maladies caché, et pas étonnant que Wallace a choisi de partir, personne ne se marier, âgé de 39 ans
Un téléphone à travers le monde: Sogou trésor d'évaluation de l'expérience de traduction Pro
Ajouté taille de 13 pouces, une évolutivité accrue, HP a dévoilé la deuxième génération de l'entreprise de la guerre 66 | titane Nouvelles
Google a lancé un algorithme de hachage cohérente limitée charge, la résolution de problèmes d'équilibrage de charge du serveur
inégalité Philippines: la mouche riche, pauvre ordures manger, dormir cimetière
« Le nouveau destroyer élevé » racontera l'histoire du campus et Higashiyama Nao 3V3
la consommation actuelle Civic, le rappeur Max Ma façon de se sentir le pouls de pointe « du nerf à la consommation »? | compte à rebours T-EDGE six jours