Lorsque la rencontre d'apprentissage machine r�seaux complexes: analyse algorithme cercle micro-canal d'amis Lookalike

cercle micro-canal quotidien d'amis, les utilisateurs recevront un certain nombre de pression publicitaire plus ou moins. Certains tr�s pr�cis, mais certains ne peuvent pas. L'apprentissage automatique est une branche importante de l'intelligence artificielle, mais aussi les tendances technologiques futures dans le r�le important. Ainsi, micro-canal est comment le faire?

Cet apprentissage de la machine de finition de papier de Tencent Senior Fellow Yi Ling ArchSummit parole � P�kin 2016. R�pondre mot-cl� � machines �, t�l�charger la version compl�te du PPT.

Lookalike fait

Fondamentalement, toute la soci�t� Internet a sa propre plate-forme publicitaire, c'est une page pour les annonceurs � diffuser des annonces. Les annonceurs peuvent soumettre la page de publicit� pour faire conna�tre leurs besoins publicitaires, l'arri�re-plan donnera aux annonceurs une partie des utilisateurs potentiels d�limit�s, c'est ce que nous appelons modules Lookalike.

Lookalike g�n�ral, comment voulez-vous faire? Il aura deux approches: Le premier est le ciblage dominant, les annonceurs directement cibl�s en fonction de l'�tiquette d'un utilisateur , Par exemple par �ge, le sexe, une telle zone d'�tiquette directement partie d�limit�e de l'utilisateur � la circulation. Cette fois, notre support technique est le portrait de l'exploitation mini�re de fond de l'utilisateur. Ceci est en fait l'annonceur compr�hension de leurs produits, encerclez l'utilisateur cible.

Cette d�finition artificielle, peut ne pas �tre exacte, ou peut-�tre un grand nombre d'utilisateurs d�sign�s par l'�ge et la r�gion, le besoin de faire le d�pistage pr�cis, cette p�riode de besoin sosie La deuxi�me approche, � travers un mod�le d'apprentissage de la machine, les annonceurs de cibler les utilisateurs potentiels de .

La question de savoir comment transformer en un mod�le de la machine � l'apprendre? Quels �chantillons apprennent? Quel but est l'optimisation? A cette �poque, les annonceurs pr�sentent un certain nombre de listes de clients, les utilisateurs de semences appel�s, comme des �chantillons positifs de l'apprentissage de la machine. Nous allons �chantillons n�gatifs de l'utilisateur non-graine, ou que la plate-forme accumulera une certaine histoire de la publicit� similaire � un �chantillon n�gatif, le probl�me se transforme en un mod�le dichotomique, les �chantillons positifs et n�gatifs apr�s �chantillon compos� de l'apprentissage, le mod�le de formation, en utilisant le mod�le structure des utilisateurs actifs pour noter les annonceurs obtiennent finalement les besoins de la population cible.

Regardez ce processus, les annonceurs devront fournir sa liste de clients comme utilisateurs de semences, c'est un apprentissage automatique des �chantillons positifs, et les utilisateurs actifs sera de l'int�rieur (utilisateurs non-semences) ou l'histoire, nous avons accumul� une r�troaction n�gative similaire publicit� utilisateurs, comme des �chantillons n�gatifs du mod�le, une formation de deux classes, l'utilisation des r�sultats du mod�le � la notation utilisateur tri�s annonceurs utilisateur doivent cibler les donn�es.

Pour conna�tre les caract�ristiques et les algorithmes de mod�les, diff�rentes soci�t�s ont leurs propres diff�rences: caract�ristiques qui d�pend des donn�es de l'entreprise, sur l'algorithme de mod�le, Facebook et Google ont annonc� un mod�le de pr�vision qui est de dire, Yahoo a publi� plusieurs articles d�taillant au travers algorithmes, tels que LR, lin�aire SVM, GBDT ont essay� papiers mentionn� mieux l'effet GBDT. La figure suivante montre les diff�rentes soci�t�s approchent pour votre r�f�rence.

Micro lettre est de savoir comment faire Lookalike sociale

La publicit� de la fa�on dont le cercle micro-canal d'amis �taient les utilisateurs potentiels localiser? De toute �vidence, nous pouvons le transformer en un mod�le de pr�diction � deux classes � faire. Cependant, il n'y a pas une meilleure id�e de ce? Une analyse exploratoire, nous pouvons faire en premier cercle micro-canal d'amis de la publicit� pour la question elle-m�me.

O� les annonces et les autres points de la plate-forme publicitaire de diff�rence dans le cercle micro-canal d'amis? La figure est la publicit� sous forme de cercle micro-canal d'amis, tels que l'investissement Vanke et la publicit�, nous serons son num�ro public appara�t dans le cercle d'amis de l'utilisateur.

Quand mes amis et si je re�ois cette annonce en m�me temps, il formera l'interaction entre les utilisateurs. Vous pouvez aussi rappeler un bon ami parce que nous n'avons pas la publicit� pour un coup de pouce ou commenter et attirer votre attention sur la publicit�, il? En fait, tr�s souvent.

Nous regardons les donn�es, nous pouvons voir les donn�es dans le tableau ci-dessous, l'axe horizontal est le nombre d'amis � interagir avec l'annonce, et l'axe vertical est l'attention de l'utilisateur � taux de publicit� (y compris l'affichage, pouces ou commentaires), nous trouvons cette pr�occupation le taux augmente avec le nombre d'amis augmente. Ce genou donn�es presque 3-5 amis. R�fl�chissons profond�ment sur les raisons derri�re les donn�es, pourquoi est-il si ces donn�es? Parce que j'ai les m�mes amis et passe-temps? Je craignais parce qu'un ami a comment� l'annonce?

En fait, ces deux aspects sont deux valeurs fondamentales de donn�es de la relation sociale, qui est, l'homog�n�it� sociale et de l'influence sociale. C'est la communaut� de recherche en r�seau de chercheurs de sortir de la d�finition plus rigoureuse.

Homog�n�it� dire un peu plus facile � comprendre, est que la similitude, nous avons les m�mes int�r�ts avec des amis, ou avec notre industrie, nous avons un fond de l'industrie similaire, nous formerons un ami. Prenons par exemple la publicit�, les annonceurs m'a donn� une liste de clients qui sont les utilisateurs de semences, ne sont pas mes graines des amis de l'utilisateur aimeront cette annonce?

Une autre dimension est l'impact, par exemple de l'influence que mes actions affect�es amis. Ce point a �t� mis sur le cercle de la publicit� des amis, mes amis peuvent voir des commentaires sur la publicit�, ce sera son influence.

Donc, faire Publicit� cercle d'amis, nous allons nous concentrer sur ces deux valeurs mini�res est l'homog�n�it� sociale et l'impact social .

En parlant de cela, revenir � notre question, comment les annonceurs d'exploiter les utilisateurs potentiels? Sur la base de la liste des clients donn�s annonceur, est pas un essai peut faire: trouver ces annonceurs amis comme utilisateurs potentiels, est une similitude sociale, la deuxi�me telle plate-forme de livraison dans un cercle micro-canal d'amis, avec entre les utilisateurs comportement � cause de l'influence sociale et la formation de diffusion, � savoir id�e de base sociale micro-canal de Lookalike.

Donc, une autre question. Comment l'homog�n�it� sociale, influence Quantifier? Quand les graines des amis un lot de temps de l'utilisateur, comment des amis de tri choisir? premi�re rang�e de la famille? Girlfriends rang? Ou �tudiants, coll�gues debout � l'avant? r�gles artificielles d�pendent de l'exp�rience d'affaires solide, que nous ne pouvons pas quantifier la similitude de l'utilisation sociale de la machine, il l'apprentissage?

Nous avons recueilli par annonce a �t� diffus�e pour �tudier l'histoire de l'�chantillon, par exemple, j'ai plus de 400 amis, j'ai un ami pour une partie de son histoire avec une exposition simultan�e � quelques-unes des annonces, ces amis, je peux comprendre ma ressemblance avec son annonce nombre d'annonces, cela signifie que les clics publicitaires communs divis� par le nombre d'exposition commune. Les amis restants, il n'y a pas d'histoire commune publicit� expos�e. Ensuite, nous avons les donn�es dans d'autres domaines tels que ma relation intime avec lui, parcourir ou lire le m�me article et d'autres points d'int�r�t, que ce soit par le comportement social de ces donn�es, je lui ai dit de pr�dire le degr� de pr�f�rence sur la publicit�?

En regardant en arri�re � notre r�seau de donn�es, telles que notre r�seau de relations d'ami, lisez l'article caract�ristiques techniques du r�seau avant et ainsi de suite, combien pouvons-nous faire des uvres de fonction � partir des donn�es du r�seau?

vecteur d'entr�e d'apprentissage machine ou une matrice g�n�ralement, les caract�ristiques structurelles de la FIG exprim�, il possible d'utiliser un proc�d� de r�duction de la dimensionnalit� de l'expression � l'int�rieur du noeud de la figure cach�e dans un espace vectoriel, le mot sera exprim� comme un vecteur dans le PNA, qui est 14 ans Google a publi� un Wodrd2Vec l'ensemble de l'algorithme, l'int�gration d'un mot pour un projet, cela est le r�sultat.

Figure comment structurer un vecteur de coupe? De Wodrd2Vec � la distribution node2vec, mot fr�quence des mots � l'int�rieur des mots, il est une loi de puissance, la fr�quence de certains mots est apparu mots de tr�s haute fr�quence qui apparaissent sur le bas de la queue.

En effet, aussi, et nous avons souvent un nud majeur dans le noeud d'un r�seau social, il aura beaucoup d'amis, certaines personnes ne peuvent pas atteindre tant d'amis. Donc en fait la distribution d'�nergie-droit � l'int�rieur des noeuds dans un r�seau distribu� sociale. Comment migrer vers Wodrd2Vec node2vec, cette fois-ci va g�n�rer une s�quence d'un noeud, ce qui correspond � une peine de traitement du langage naturel, montrant une configuration � l'int�rieur du noeud correspond � un mot PNL.

par cons�quent, g�n�r� sur la figure un proc�d� de recherche de r�seau conform�ment � une s�quence de noeuds, cette s�quence de noeud peut correspondre � une phrase en langage naturel, suivi par un cadre Wodrd2Vec nous en tant que vecteur enrobage du noeud. Donc, pour faire du temps l'int�gration r�seau, cette strat�gie de recherche g�n�r�e est tr�s importante une s�quence de nuds. La m�thode la plus simple, qui est, marche al�atoire, d'une part, pour g�n�rer une s�quence de noeuds de marche al�atoire, d'autre part �galement une sorte d'�chantillonnage figure r�duire la quantit� de calcul.

Nous disons que la caract�ristique la plus importante est que les donn�es sociales homog�n�it� sociale. Ainsi, lorsque nous travaillons en r�seau l'int�gration de l'homog�n�it� sociale de cette caract�ristique retenue. nature communautaire de notre r�seau combin� de marche al�atoire algorithme pour ajuster, par exemple, est all� � un nud C, puis est all� � E quand il redescendons �a va venir ici �quivaut � une autre communaut�. Il est pr�vu un noeud P et Q, P quand il est grand pour revenir en arri�re parce que les caract�ristiques du r�seau social de la formation de ces associations.

Par exemple, un de nos r�seaux sociaux, mes camarades de classe formeront une communaut�, la conception de ce P pour revenir en arri�re, je suis plus susceptible de venir � ce groupe. Lorsque le plus grand P, il peut refl�ter plus homog�ne. Q plus grand quand il est effectivement possible de refl�ter la structure de cette similitude, les diff�rents noeuds ont des effets diff�rents. Par exemple, le noeud de noeud E et F est le point de pontage connect� deux communaut�s. Lorsque Q grande, elle refl�te la similitude de la structure du r�seau. Cette fois-ci comment nous choisissons P et Q? Cela peut �tre l'apprentissage semi-supervis� en fonction de la t�che.

Et puis regarder en arri�re nous venons de dire processus Node2vec, d'abord par marche al�atoire biais�e, pour g�n�rer une s�quence de nuds, suivi par le cadre de l'algorithme word2vec est le vecteur d'expression de ce noeud. Dans lequel le r�glage du param�tre en fonction de l'homog�n�it� nous maintenons, ou par r�glage de param�tre en fonction de la t�che.

Node2vec pour tout le monde � regarder les r�sultats, pour vous donner la sortie de l'algorithme. Voici un graphique simple, les r�sultats faire apr�s l'int�gration, vecteur noeuds 1 et 2 est le m�me, il chevaucherait un vecteur 3,4,5,6 est un nud qui co�ncide, il exprime ce qui est-il ? Pourquoi 1 et 2 se chevauchent compl�tement? En fait, l'environnement r�seau 1 et 2 sont identiques, le plongement d'expression est le r�sultat d'un nud de l'environnement de r�seau social, qui est, nous disons que les caract�ristiques topologiques.

Nous ne node2vec aurons d'autres avantages? R�seau de communication comme par exemple � des amis, je 120 amis, je ne fait pas communiquer et r�seau avec tant d'amis discutent souvent, que ces donn�es sont tr�s rares, puis calculer le degr� d'intimit� dans la node2vec de sortie, en fait, je dis tous les amis de l'intimit� peuvent tous �tre calcul�s. La premi�re consiste � apporter les avantages de r�soudre le probl�me de la faible densit� de donn�es. De plus, cette stabilit� r�sulte.

Pour les r�seaux de communication, par exemple, de communiquer avec certains de mes amis pourraient �tre transactionnelles, pas l'expression de l'intimit�. Par exemple, certains clients, ou de l'interm�diaire de services, parce que je ne l'ai pas former un cercle avec lui, en faisant le plongement du temps, ce qui entra�ne un num�ro de s�quence voisin est plus petite que la co-occurrence, r�sultat l'int�gration est que ces gens sortent sur le genre d'intimit� sera � l'arri�re , relativement parlant, une vraie relation �troite tels que les parents, les petites amies, camarades de classe, coll�gues debout � l'avant serait plus stable.

Cadre d'apprentissage de similitude sociale, nous pouvons voir la figure ci-dessous. Nous avons �tabli un mod�le de r�gression. Maintenant, faites est le mod�le SVR. Entrez vos r�seaux d'amis, les r�seaux de communication, lisez le r�seau de transfert d'articles, etc., exprim� l'incorporation des vecteurs caract�ristiques obtenus par mod�le SVR, apprendre la fonction de ces caract�ristiques et similitude de la publicit�. Cette fonction calcule les amis de similarit�, vous pouvez trier vos amis.

Nous examinons l'effet de l'algorithme. Vous avez touch� un million d'utilisateurs est de savoir comment nous �valuons l'effet l'algorithme, le moyen le plus directs que j'ai plusieurs algorithmes, les annonceurs ont besoin d'un million d'utilisateurs, j'ai ces algorithmes sont donn�s 1 million d'utilisateurs, puis regarder nous avons appel� valeur Lift. D'autres algorithmes de comparer avec elle, regardez ses effets se sont pas am�lior�es. Que notre algorithme mod�le directement dichotomique a deux fois par rapport � moins trois fois l'ascenseur.

�crit dans la derni�re

Cela introduit l'analyse exploratoire Lookalike sociale, l'homog�n�it� sociale et de l'influence, et se concentrer sur la quantification de l'homog�n�it� sociale partag�e. Plus tard, nous esp�rons faire un syst�me Lookalike de dynamique, comme mes pouces pour un ami, ici je dois pousser les gens sont mes amis, je peux influencer ces amis. Cet impact social quantifi� et incorpor� dans la publicit� pour aller � l'int�rieur. S'il est dit que l'utilisateur peut prendre l'initiative de former la diffusion de la publicit�, il est donc une tr�s bonne situation, ce qui �quivaut � la propagation de l'utilisateur libre-service du mot d'annonce de la bouche.

Route de la soie

Apprenez � conna�tre la Chine

Lorsque la rencontre d'apprentissage machine r�seaux complexes: analyse algorithme cercle micro-canal d'amis Lookalike