Prenez-vous relire les documents du syst�me de recommandation d'�tude approfondie Youtube, texte peur � Dieu

Source: Colonne sait presque

Auteur: Wang Zhe

Cet article sur 5400 Word, lecture recommand�e 10+ minutes.

L'id�e que humble place, aussi cach� dans nos ing�nieurs d'exp�rience d'ing�nierie pr�cieuse.

Ceci est la note la machine Wang Zhe apprentissage, chacun � deux semaines, je tiendrai ing�nieur algorithme de calcul d'angle pour expliquer certaines des publicitaires, des syst�mes de recommandation articles connexes. S�lectionnez l'article doit satisfaire mes trois conditions:

premier Orient�e projet de;
deuxi�me Ali, facebook, google et d'autres soci�t�s Internet ont produit la premi�re ligne ;
En troisi�me lieu, Ou la fronti�re classique .

Cette semaine, nous discutons ensemble de th�se syst�me de recommandation profondeur Youtube � R�seaux profonds neurales pour Recommandations YouTube �, qui est le document 2016, selon les normes d'aujourd'hui, il n'y a rien de nouveau lieu, je l'ai lu aussi cela il y a deux ans, apr�s l'article mis bas, mais quelques jours il y a relisez cet article, a permis � de nombreux points saillants trouv� est la routine, l'exp�rience presque partout partout, ne sont pas peur au texte Dieu. Dieu m'a donn� ce document l'impression qu'il ya deux points:

Ceci est sans aucun doute Un mod�le pour le papier de l'industrie Est-mes tr�s respect�s ing�nieurs algorithme orient� ing�nierie doit lire des articles;
Je pense que humble place, aussi cach� dans nos ing�nieurs d'exp�rience d'ing�nierie pr�cieuse, la profondeur d'int�r�t dans le r�seau par rapport � l'introduction de la semaine derni�re de la norme DIN Ali, le plus r�side valeur importante dans l'attention du m�canisme, cet article vous devriez Pr�cise � la peine d'appr�cier C'est la raison pour laquelle je suis peur au texte Dieu.

Ado, ici je voudrais partager diff�rentes exp�riences et la r�colte ont deux fois lire ce document.

La premi�re passe lu le papier, je pense que tout le monde est destin� aux algorithmes d'architecture pour aller dans les syst�mes de recommandation d'apprentissage profondeur sont devenus une grande entreprise, � Op�rations de base � Aujourd'hui, l'architecture Youtube algorithmiquement ne surprend pas �, nous allons jeter un article d'architecture algorithme de coup d'oeil rapide syst�mes de recommandation d'apprentissage en profondeur.

Youtube sc�ne recommandation de l'utilisateur Inutile de dire, le plus grand site de vid�o UGC du monde, la n�cessit� d'une recommandation personnalis�e dans une vid�o m�ga-�chelle. Comme la collection vid�o candidat est trop grand, pensez syst�me en ligne les probl�mes de latence, ne convient pas pour une utilisation directe des r�seaux complexes est recommand�, prenez donc un r�seau Youtube profondeur � deux niveaux pour terminer le processus recommand�:

La premi�re couche est un Candidat G�n�ration Mod�le Compl�te le d�pistage rapide de la vid�o candidat, cette �tape est les collections vid�o candidat r�duit d'un million � l'ordre de centaines.
La seconde couche est Mod�le classement d�charge compl�te bien des centaines de vid�o candidat.

D'abord pr�sent� le mod�le de g�n�ration de candidat architecture:

Youtube candidat G�n�ration mod�le

Notre point de vue ascendante du r�seau, le plus bas niveau d'entr�e qu'une int�gration vid�o vecteur regard� l'utilisateur et l'int�gration terme de recherche de vecteur. Quant � la fa�on dont ce vecteur int�gration est g�n�r�, les mots originaux de l'auteur est la suivante:

Inspir� par le sac continu de mod�les de langage des mots, nous apprenons incorporations de grande dimension pour chaque vid�o dans un vocabulaire xes et nourrir ces incorporations dans un r�seau de neurones,

Une fois que les auteurs est d'utiliser la m�thode word2vec pour la vid�o et faire une recherche symbolique re-enrobage en entr�e, ce qui se fait int�grer le � Op�rations de base �, sans beaucoup de place, bien s�r, en plus de l'autre, nous devrions �tre plus familier avec il est en ajoutant une couche d'int�gration DNN de formation ainsi que les m�thodes ci-dessus deux est mieux, ce qui convient � l'occasion, on peut parler.

vecteur caract�ristique qui comprend �galement la localisation g�ographique de l'utilisateur de plongement, l'�ge et le sexe. Ensuite concat�ner toutes ces fonctionnalit�s ensemble, alimentant le r�seau de neurones Relu sup�rieur.

Une fois le r�seau de neurones � trois couches, on voit fonction softmax. Ici, les �l�ves Youtube � regarder cette question comme un probl�me de recommandation utilisateur suivant montre, de sorte que la sortie doit �tre selon toute probabilit�, une distribution vid�o candidat, la nature est plus d'une classification.

Eh bien, c'est un apprentissage en profondeur du bas � Fonctionnement de base �, il constitue un r�seau de g�n�ration de candidat de Youtube, anodin, mais il est encore cach� certains probl�mes, tels que:

m�thode graphique dans le coin sup�rieur gauche, pourquoi ne pas utiliser directement ce r�seau pour pr�dire en temps au service en ligne et d'utiliser la recherche du plus proche voisin de?
probl�mes multi-classification, vid�o candidate Youtube d'un million est �norme, ce qui signifie qu'il ya des millions de classification, ce qui affectera in�vitablement l'effet de la formation et de la vitesse, comment am�liorer?

Ces probl�mes de lecture de la premi�re passe quand je ne pense pas que sombre et profond � voir, mais il est li� � des probl�mes de rencontre dans la mise en uvre de l'ing�nierie, nous avons suivi la pr�sentation approfondie de la solution de papiers.

Depuis des centaines d'ensembles candidats obtenus, l'�tape suivante consiste � utiliser le tri fin des mod�les de classement, ce qui suit est un sch�ma de principe de la profondeur du r�seau d'apprentissage classement.

Youtube Mod�le Classement

� premi�re vue ce qui pr�c�de le classement mod�le semble pas diff�rent mod�le de g�n�ration de candidat, l'architecture du mod�le et la profondeur de l'apprentissage � Op�rations de base �, la seule diff�rence est les uvres de fonction, nous parlons des caract�ristiques du projet.

En effet, la description illustre aussi clairement que l'introduction d'un autre ensemble de caract�ristiques que l'objet de DNN est d'introduire le mod�le plus classement d�crit, la vid�o et la relation utilisateur entre eux, un ensemble de vid�o candidat atteindre l'objectif de tri pr�cis.

Au cours de classement, nous avons acc�s � beaucoup plus de fonctionnalit�s d�crivant la vid�o et la relation avec la vid�o de l'utilisateur, car seulement quelques centaines de vid�os sont not�es plut�t que les millions marqu�s dans la g�n�ration des candidats.

point sp�cifique, de gauche � droite caract�ristiques sont les suivantes:

impression plongement ID vid�o: Pour calculer le courant de la vid�o int�gration
ID vid�o encartage moyenne visionn�es: Les utilisateurs ont regard� la vid�o derni�re N int�grant la mise en commun moyenne
plongement de langue: �La langue de l'utilisateur et l'int�gration de la langue de l'int�gration de la vid�o en cours
temps depuis la derni�re montre: Depuis la derni�re fois le m�me canal pour voir la vid�o
impressions #previous: Le nombre de fois que la vid�o a �t� expos� � l'utilisateur

Cinq caract�ristiques ci-dessus, je voudrais me concentrer sur le quatri�me et cinqui�me. Depuis l'introduction de ces deux bonne observation du comportement des utilisateurs.

Pens�es de quatre caract�ristiques derri�re:

Nous observons que la plupart des signaux importants sont ceux qui d�crivent l'interaction pr�c�dente d'un utilisateur avec l'�l�ment lui-m�me et d'autres articles similaires.

Il y a une introduction de la moyenne d'attention, ici il est le temps depuis la derni�re montre Cette r�action est caract�ris�e par l'intervalle de temps � l'utilisateur de voir la m�me vid�o. Pensez � partir d'un point de vue de l'utilisateur, si nous venions de voir � DOTA examen classique �, la vid�o du canal, nous allons continuer � voir une forte probabilit� que ce canal de la vid�o, cette fonction capture ce bon comportement des utilisateurs .

cinqui�me caract�ristique impressions #previous L'introduction de l'exploration des id�es dans une certaine mesure, pour �viter la m�me vid�o l'exposition continue au m�me utilisateur est invalide. Essayez d'augmenter la probabilit� d'exposition de nouvel utilisateur vid�o jamais vu.

A ce moment, mon premier passage lu le papier, l'algorithme cadre de Youtube avec le concept, mais l'ambiance g�n�rale bien mieux que cela, rien de bien nouveau lieu.

Mais si vous pensez vraiment, ou trop na�f, et avec la pr�c�dente Ali profondeur d'int�r�t dans le r�seau DIN La diff�rence est, vous lisez le m�canisme DIN attention, vous pouvez saisir 70% de la valeur de leur papier, mais cet article Si vous ne lisez que l'architecture du syst�me recommand� Youtube, vous prenez seulement 30% de la valeur. Alors, o� est les 70% restants de la valeur en elle?

Lorsque relisez cet article, je suis dans la perspective d'un ing�nieur, toujours Bengzhuo � comment � cette cha�ne trouv�e avant que le projet ne vaut le papier que je largement pass� sous silence. Ci-dessous j'ai �num�r� dix papier tr�s pr�cieux a abord� la question suivante:

La transformation du papier probl�me de recommandation en un probl�me multi-classification dans la prochaine montre la sc�ne, chaque candidat sera une vid�o classifi�e, donc un total de millions de classification de g�ant, qui, lorsqu'il est utilis� la formation softmax est sans doute inefficace, question Youtube est de savoir comment r�soudre?
En servant de mod�le de g�n�ration de candidats de processus, Youtube Pourquoi ne pas simplement adopter un mod�le de formation pour pr�dire quand, au lieu d'utiliser une m�thode de recherche du plus proche voisin?
Les utilisateurs de YouTube ont une pr�f�rence pour une nouvelle vid�o, comment introduire cette fonctionnalit� dans le processus de construction de mod�le?
Dans le processus de pr�traitement de l'ensemble de la formation, Youtube n'a pas utilis� le journal d'utilisateur d'origine, mais le nombre d'utilisateurs pour chaque formation d'extraction �chantillon, ce qui est pourquoi?
Youtube Pourquoi ne pas prendre un RNN similaire de mod�le de s�quence, mais compl�tement abandonn� les caract�ristiques temporelles de l'histoire de visualisation de l'utilisateur, l'histoire r�cente de navigation assimil�e cela sans perte d'informations utiles il?
En examinant l'ensemble de test, Youtube Pourquoi ne pas laisser une m�thode al�atoire classique (holdout al�atoire), mais l'utilisateur doit prendre un comportement r�cent de visualisation comme un ensemble de test?
Pour d�terminer le temps cible optimale, Youtube Pourquoi ne pas utiliser le CTR classique, ou le taux de lecture (Play Rate), au lieu d'utiliser chaque fois de lecture pr�vu (heure de la montre par impression) l'exposition comme cible d'optimisation?
Lors de vid�o plongement, pourquoi la longue queue de vid�o directement sur un grand nombre de vecteurs au lieu de directement avec le 0?
Apr�s certaines fonctions, telles que les impressions #previous, pourquoi la prescription et de traiter carr�, comme la fonction entr�e mod�le � trois?
Pourquoi mod�le de classement ne pas utiliser la r�gression logistique classique comme la couche de sortie, au lieu d'utiliser une r�gression logistique pond�r�e?

Parce que je �galement des travaux dans le domaine de la recommandation vid�o, afin que vous puissiez dire responsable de plus de dix questions sont tr�s pr�cieuses. Mais aujourd'hui, je vous �cris dans un souffle, se sentant un peu le manque de capacit� d'air. . Si vous �tes int�ress�, vous pouvez pointer une louange, je vais analyser plus de dix r�ponses sur la question en d�tail demain.

Les r�ponses aux questions ci-dessus, il a �t� termin�, reportez-vous � mon prochain article -

Eh bien, voici la deuxi�me notes apprentissage machine � l'article Wang Zhe, niveau limit�, nous souhaitons la bienvenue Tucao, la critique, la correction.

r�f�rences: Profondes R�seaux de Neurones pour m�canisme d'attention syst�me YouTube RecommendationRecommender papier syst�me de recommandation Liste - R�seau d'int�r�t profondeur Ali (DIN) - FIN -

attention Tsinghua - donn�es Acad�mie des sciences de Qingdao plate-forme publique micro-canal officiel " donn�es d'envoi THU � Sisters et n � � Les donn�es envoy�es THU � Pour plus de conf�rences et de bien-�tre contenu de qualit�.

Route de la soie

Apprenez � conna�tre la Chine

Prenez-vous relire les documents du syst�me de recommandation d'�tude approfondie Youtube, texte peur � Dieu