1. Introduire le principe de
Essence algorithme LR (régression logistique) est une fonction de régression linéaire, l'algorithme de classification est utilisé principalement en tant que deuxième scénario, le CTR estimé par exemple, la formule arithmétique suivante:
Où x est un modèle d'entrée
- xi représente l'entrée de chaque dimension.
- w est un coefficient entrée de modèle vecteur x, w = (w1, w2, ...), wi représente la dimension de xi en poids.
2, modèle Solution
Nous résolvons notre modèle par descente de gradient. Cliquez pour les prévisions de taux, par exemple, d'abord de prélever des échantillons. Les variables sont définies comme suit:
- nums représente le nombre d'échantillons collectés.
- (Xi, Yi) représente les données de l'utilisateur d'échantillons, Xi représente les caractéristiques de l'échantillon, yi représente clics (0 pour aucun clic, clic représente 1).
- Yi représente les prédictions du modèle, la variable est d'environ w, B.
La définition de la fonction de perte d'entropie croisée:
Los Solution (w, b) correspondant à un minimum par une descente de gradient w, b sont les exigences de paramètres de modèle désirés.
3, les pratiques commerciales
algorithme LR dans le système de recommandation actuelle dans l'industrie, l'approche populaire est à l'échelle des caractéristiques discrètes (encodage d'un chaud), puis dans le modèle LR, la publicité click-through modèle de taux par exemple, les étapes suivantes:
- Etape 1: Portrait d'une configuration utilisateur
Selon une image utilisateur de configuration de classe d'entités, toutes les caractéristiques des catégories de processus discrets suivants, par exemple: la navigation éléments de l'historique enregistrement d'utilisateur, la propriété communauté des utilisateurs, à travers le modèle à l'utilisateur de balise de jeu et ainsi de suite.
Tableau: Image de l'utilisateur
- Etape 2: Portrait des articles de construction
configuration portrait d'objet, dans lequel l'article est également nécessaire de diviser la catégorie, la catégorie des éléments suivants propose un traitement discret, par exemple: Numéro d'identité, les étiquettes des produits, la chaleur et autres articles.
Tableau: Image de l'utilisateur
- Etape 3: la scène avec portrait
Dans la pratique des entreprises, souvent vous devez utiliser un modèle de plusieurs scènes, une grande différence dans le taux de clics moyen différents scénarios produits, afin de mieux répondre aux différents problèmes dans différents scénarios taux de clics moyen, ont souvent besoin d'ajouter des fonctionnalités de scènes. En général, seul ID scène scène portrait, dans certains scénarios spéciaux (par exemple: une liste de recherche) peut ajouter des informations de localisation.
Tableau: Portrait Scène
- Étape 4: Recueillir des données d'échantillon
Dimension des données cliquez sur l'historique de l'exposition de collecte de données, collectées comprennent: ID utilisateur, ID de l'élément, l'ID de la scène, que ce soit à cliquer. Ensuite, les portraits des utilisateurs associés et des portraits d'articles pour obtenir l'échantillon de formation modèle de données.
Tableau: Echantillon
- Etape 5: fonction de modèle de structure
Par exemple entrées du modèle de caractéristiques de modèle de structure de données obtenues, l'établissement du modèle de deux types, l'un est caractéristique transversale, une autre caractéristique est l'original.
CROSS où: caractéristiques de sélection de la catégorie d'utilisateur, dans lequel la sélection de l'élément de la catégorie, traversant trois dimensions ne ID de scénario, par exemple: un utilisateur a cliqué sur l'histoire de article1, article2, ID de l'article est caractérisé I1, où la scène scene1, la résultante cROSS dans lequel item1 & I1 & scene1, item2 & I1 & scene1.
Les caractéristiques originales: les moyens d'établissement d'origine directement sur le modèle caractéristique d'entrée comporte comme portrait, est la généralisation des caractéristiques générales de l'article comme une caractéristique originale pour un article dans lequel un démarrage à froid ou une scène de démarrage à froid par exemple: chaleur CTR article, l'article , les étiquettes des produits et ainsi de suite.
Tableau: entrée de modèle
- Etape 6: formation de modèle
Tout modèle de caractéristique est le codage d'un chaud, dans lequel N est le nombre de modèles suppose tout d'abord un code unique pour chacun de la fonction de modèle 1-N, le modèle est un vecteur d'entrée pour chaque valeur d'échantillon de 0/1 de dimension N vecteur, dans lequel 0 indique que l'échantillon inclut le nombre correspondant de 1 indique l'absence de tels: l'échantillon 1 sont numérotées de 1 et 3, dans lequel le nombre, le modèle est un vecteur des échantillons d'entrée (1,0,1,0 , 0, ...), puis par modèle de formation des formateurs de LR universelle, les paramètres du modèle peuvent être formés.
- Step7: utilisation du modèle
Étant donné un utilisateur u, et un certain nombre d'objets candidats, l'utilisateur comment u recommandé articles. Calculée par la méthode ci-dessus le score de modèle de u de l'utilisateur pour chaque élément de l'ensemble candidat, recommandé à l'utilisateur dans l'ordre décroissant en fonction du score du modèle.