Séance d'information de récupération | AIS pré-sécher toute la part parlera

AIS (ACL, IJCAI, SIGIR) 2018

Session 3: Recherche d'information

1 Liu Hao Université de Tsinghua

Entité-Duet Classement Neural: Comprendre le rôle du savoir dans Graphique Sémantique la recherche d'information Neural

Neural Information Retrieval (de recherche d'information nerveuse), lorsque l'utilisateur a posé une question, nous avons calculé par le réseau de neurones hors du classement de document associé, et de répondre ainsi aux besoins des utilisateurs. modèle de réseau neuronal actuelle de la recherche d'information plus ou moins divisé en deux, la première représentation modèle de récupération d'informations de réseau neuronal sur la base, le second est un modèle d'extraction d'information interactive basé sur un réseau neuronal.

Dans la recherche d'information de scène réelle, l'entrée utilisateur est question très brève, ou contenir l'entité propriétaire. Dans le processus de recherche d'information classique utilise un grand nombre de connaissances graphique (informations de carte) pour renforcer l'effet de l'information artificielle extraction de caractéristiques de récupération. Ici, nous considérons l'utilisation de la méthode de réseau de neurones pour extraire automatiquement la bibliothèque de connaissances de l'information sémantique, et utiliser les données utilisateur clique de bout en modèle de formation de fin.

Nous vous proposons un modèle de classement Neural Entité-Duet (modèle d'entité de commande binaire Neural), ce modèle EDRM, afin d'améliorer la recherche d'information basée sur des modèles d'interaction réseau de neurones. Dans ce modèle, nous avons exprimé l'entité de trois parties, une entité Embedding (entité Vector), il repose sur deux entités Description de Embedding (vecteur décrit), est basé sur la dernière entité de type Embedding (type vectoriel), et ils ont été soumis combinaisons linéaires, exprimées comme une entité de renforcement.

modèle de recherche d'information interactif Nerve, principalement la mise en place d'une interaction entre la matrice et les problèmes de documentation, nous devons établir une meilleure interaction entre la matrice et les problèmes de documentation par Neural Framework Entité -Duet (deux yuans nerf Entity Framework). Quatre établi matrice d'interaction, pour la couche plus tard Classement (ordre de la couche d'extraction de caractéristiques). Parce que KNRM et Conv-KNRM est actuellement le meilleur du modèle de recherche d'information neuronale basée sur l'interaction du réseau, dans l'expérience nous allons modèle EDRM et les deux modèles ensemble, utilisés pour vérifier l'effet de EDRM.

Nous utilisons les données de clic Sogou, la scène avec la scène de test K-gestion des ressources naturelles est le même, divisé Test SAME, Test-DIFF, Test-RAW. Test SAME est d'utiliser pour tester et processus de formation de la même étiquette, le test-DIFF est l'utilisation d'une étiquette de test plus complexe dans le test, le test-RAW est un jugement meilleur des résultats du classement en ligne avec le texte. On peut voir par le modèle expérimental, nous avons grandement amélioré, levage sur les essais-DIFF et test-RAW prouver EDRM bonne capacité de généralisation.

2 Lichen Liang Université de Wuhan

Une profonde pertinence modèle pour Zero-Shot document Filtrage

Texte de filtrage est essentiellement un grand nombre de filtres dans l'ensemble des documents sur le texte non pertinents ou inutiles, le texte pertinent ou utile, organisée classées en fonction des besoins des catégories spécifiées cibles. besoins d'information des utilisateurs est dynamique, et dans le grand fond de l'ère des données, les types de catégories de documents peuvent couvrir l'augmentation des données de formation pour renforcer toutes les catégories de cibles possibles est cher et pas très réaliste.

Par catégorie représentera l'information sémantique quelques mots que l'ensemble de la catégorie de mots pour désigner une catégorie, pour atteindre zéro exemple de texte pour le filtre.

Sur la base de la profondeur de la technologie d'apprentissage, modèle proposé filtrage zéro échantillon pour la catégorie de semences du mot. Dans ce modèle, qui, en construisant la graine pour la catégorie, sur la base d'un document mot représentation vectorielle de l'interaction, pour extraire la catégorie de documents d'information pertinents par CNN. Ensuite, affiner davantage les catégories de documents d'information connexes par l'intermédiaire du réseau de neurones multicouche. Dans ce processus, nous allons aussi introduire une partie de sa formation, c'est-à-dire, nous nous assurons que l'extraction de l'information de la catégorie de documents associés, a une bonne capacité de généralisation pour éviter les contraintes de données de formation.

En particulier, les types de construct d'expression lors de la première catégorie est représentée par la moyenne du vecteur de parole de la graine de la catégorie. Après la documentation de chaque mot pour construire deux types d'interaction par catégorie d'autres termes vecteur et la catégorie de documents mot représentation vectorielle. Ces deux types de compensation et de l'interaction est le produit scalaire vectoriel.

Basé sur le réseau Pooling K-max CNN, représentent le visage des catégories liées informations catégorie d'extraction, un mécanisme de porte de la catégorie introduite pour nous aider à déterminer quels sont les filtres et CNN dans la catégorie cible extraction de l'information liée est pertinente, améliorant ainsi la catégorie de documents associés l'extraction d'informations.

Dans le processus, les informations extraites, nous allons améliorer encore l'extraction et l'intégration des informations associées à la classe de documents multi-couche réseau connecté entièrement. Nous espérons que les catégories d'informations connexes extraites à travers la couche de connexion entière qui ne contient pas d'informations spécifiques sur la formation lorsque la classe de formation, vous pouvez assurer la capacité de généralisation du modèle. Par conséquent, les catégories d'informations sur les fonctionnalités basées sur la mise en place d'une tâche de classification, à savoir l'introduction d'un classificateur, déterminer le classement ne peut pas déterminer les documents de formation correcte à partir de laquelle des cours de formation.

le contenu de l'expérience est la face d'un filtrage de texte zéro exemple, en fonction de la catégorie des semences, pour trier les documents mots connexes. Nous avons comparé plusieurs modèle similaire, la recherche d'information approfondie de l'apprentissage ainsi que le modèle de recherche d'information traditionnelle basée sur le mot de correspondance de mots, ainsi que la performance générale de notre modèle basé sur le modèle de contrôle fondé sur la classification des textes de modèle pour vérifier. Ici, les deux ensembles de données, 20 Nouvelles groupe et une critique de film, le premier est le jeu de données standard de classification des documents, et le second est basé sur les ensembles de données d'analyse de sentiment Critiques English film, afin d'assurer que les différentes tâches de classification ci-dessous vérifier les performances du modèle. Les résultats expérimentaux montrent que notre modèle de jeu a la meilleure performance dans une sorte différente de la tâche ci-dessous.

D'autres résultats expérimentaux, nous avons constaté que deux types de modèles dans lesquels il mentionne les interactions mot vecteur, l'introduction du mécanisme de la catégorie, ainsi que la confrontation des liens basés sur la performance du modèle que nous avons joué une aide très importante.

3 Lu Wang Yu, Université Tsinghua

Entre clics et satisfaction: Étude sur les préférences de l'utilisateur multi-phase et la satisfaction de Nouvelles en ligne de lecture

le comportement de clic de l'utilisateur est largement utilisé dans la formation et l'évaluation des systèmes d'information interactifs, comme un modèle de formation positif de rétroaction implicite, ou calcul en ligne ouvre les résultats de l'évaluation. Mais après que l'utilisateur clique peut trouver qu'ils ne le font pas comme, donc cliquez et il y a une différence entre les préférences de l'utilisateur réel et la satisfaction. Pour résoudre ce problème, nous avons mené une expérience utilisateur, faire une analyse en profondeur.

Nous venons tout juste cliquer sur un utilisateur insère un nouvelles problème de contenu sommaire encore jamais vu, lui a demandé de lire avant que le degré prévu de préférence (Avant-Lire la préférence), après que l'utilisateur a fini de lire le contenu de l'article, la préférence sera demandé à nouveau après avoir lu degré (après lecture de préférence), après que l'utilisateur a la liste de navigation nouvelles terminée, il va perturber l'ordre nouveau chaque émission de nouvelles, qui rassemble les utilisateurs final est les préférences économiques (de préférence post-tâche).

11 utilisateur effectue une tâche, chaque tâche comprend 15 nouvelles, les nouvelles sont puisés des chiens de recherche, et nous trouvons qu'il est un label de qualité. Enfin, nous avons recruté un total de 32 utilisateurs, recueilli environ un millier de plus de six cents clics.

Tout d'abord, nous avons comparé le signal de clic et les préférences réelles finales, cliquez sur les nouvelles trouvées dans plus de la moitié de l'utilisateur réel et ne le font pas comme. En second lieu, nous avons comparé les différentes étapes de préférences de l'utilisateur, a constaté que différents à différents stades de préférences de l'utilisateur, et la poursuite de la lecture, les préférences de distribution plus dispersées au nom des préférences utilisateur plus explicites.

Après avoir cliqué sur de là, les préférences de l'utilisateur final entre les trois écart, le premier écart, l'utilisateur clique, et il attend la première préférence de lecture si elle est compatible, sinon, pourquoi il n'a pas aimé les nouvelles cliquez Attendez-vous? Le deuxième espace, lecture préférences utilisateur incohérences entre avant et après, et constaté qu'il est lié à la qualité des nouvelles. Le troisième intervalle après les préférences de l'utilisateur au poste de lecture finale entre en contradiction avec la tâche de préférence tentatives pour modéliser l'impact du contexte.

Sur la base de l'analyse des résultats, nous utilisons le comportement des utilisateurs, telles que la lecture de la longueur et de la vitesse de lecture, combinée à la qualité, des informations contextuelles pour prédire les préférences réelles des utilisateurs en un seul clic. Les résultats expérimentaux montrent le comportement des utilisateurs, les caractéristiques de qualité, des informations contextuelles sont utilisées pour prédire les préférences réelles et utiliser toutes les fonctionnalités de l'effet est optimal. Une fois qu'il a prédit les préférences réelles, que ce soit pour améliorer le verdict?

Sur la base de l'évaluation des clics en ligne traditionnels, CTR, etc. Par exemple, un document sera considéré comme un revenu est binaire, soit 1 clic, pas de point est 0, ou le temps de lecture est considérée comme supérieure à la valeur de seuil est 1. Nous allons remplacer un tel signal pour prédire les préférences des utilisateurs réels, nous avons trouvé plus entre elle et la satisfaction, le meilleur.

4 Mao Jia Xin Université de Tsinghua

Construction de modèles Cliquez pour Mobile Search

Cliquez sur le modèle de l'environnement de recherche mobile pour construire

Auteur: Mao Jia Xin, Luo, Zhang Min, Ma Shaoping

Cliquez sur le modèle est un moyen d'extraire efficacement les évaluations de pertinence implicite de clics, il clique sur pour tester et le comportement des utilisateurs sur les pages de résultats de la modélisation statistique pour obtenir des commentaires précis et pertinents. Et cliquez sur la validité du modèle, dans une large mesure dépend si l'utilisateur clique sur le contrôle et les hypothèses correctes.

Parce qu'il ya une grande différence entre un utilisateur clique sur le comportement de recherche mobile dans l'environnement et l'environnement de recherche de bureau, nous avons besoin de construire un modèle approprié pour les clics de recherche mobile, et la formation sur les journaux de recherche mobile. La recherche mobile et la recherche bureau est une très grande différence il y a beaucoup de résultats verticaux hétérogènes sont ajoutés à la page de résultats dans les moteurs de recherche mobile.

Afin de réduire le coût de l'interaction des utilisateurs et les moteurs de recherche mobile, généralement ces résultats verticaux seront beaucoup d'informations utiles directement affiché sur la page des résultats de recherche. Les utilisateurs ne doivent pas cliquer sur ces résultats peuvent souvent obtenir les informations nécessaires, ce qui conduira à modèle traditionnel clic sera donc penser à tort que ces résultats ne sont pas très pertinents. Notre travail se pencheront principalement sur l'impact de ces résultats sur l'utilisateur clique sur le comportement hétérogène dans l'environnement de recherche mobile.

A travers les journaux de recherche mobiles réels statistiques, nous avons encore validé: 1) les résultats verticaux dans la proportion de la recherche mobile est nettement supérieure à la proportion des résultats de recherche de bureau vertical. 2) la recherche mobile, taux de clics des résultats verticaux seront nettement inférieurs à la moyenne des résultats, il y a beaucoup de résultats de recherche mobile verticaux affichant des informations directement sur la page de résultats de recherche. Ainsi, cette fonctionnalité de recherche pour mobile, les clics de recherche mobile, nous avons construit un modèle.

Plus précisément, après que nous cliquons sur la nécessité de tests de polarisation et la satisfaction de biais de deux différents biais du modèle de clic de comportement des utilisateurs est introduit dans le bâtiment, le modèle move-click proposé (mobile Cliquez modèle, appelé MCM). En cliquant sur la nécessité d'introduire un biais, nous pouvons éliminer de pertinence de faux négatif pour ceux qui ne ont pas besoin de cliquer sur le résultat.

Mais nous avons aussi besoin des commentaires positifs liés à la qualité des résultats est venu en face de la position verticale. Par conséquent, nous introduisons un deuxième biais, la satisfaction de polarisation après appelé le test. Si vous avez pas besoin de taper un résultat, l'utilisateur peut être satisfait après les résultats des tests, puis quitter la page de résultats de recherche en cours.

clics de recherche mobile avec les journaux réels, nous avons testé cliquez sur la prévision et la prévision associée deux tâches différentes de notre modèle, et avec les trois existants ne tiennent pas compte des résultats de l'hétérogénéité du modèle traditionnel de clic (UBM, DBN et modèle DCM) et deux types d'environnement de bureau prend en compte les résultats du modèle, cliquez hétérogénéité (EB-UBM et le modèle UBM-layout) ont été comparés.

Cliquez sur les prévisions, nous utilisons la vraisemblance et le top dix du degré moyen de confusion pour évaluer notre modèle. Les résultats expérimentaux montrent que, MCM notre modèle proposé par rapport au modèle existant comme base de clics, les utilisateurs peuvent prédire avec plus de précision le comportement des clics sur la recherche mobile.

En prévision de corrélation, nous estimons à l'aide du modèle de corrélation obtenue en cliquant sur les différents résultats sont triés, puis trier les résultats de l'évaluation de la performance nDCG, pour évaluer la performance du modèle sur la tâche de prédiction de corrélation. Pour calculer nDCG, nous avons échantillonné au hasard 775 requêtes marque de corrélation. Etant donné que dans l'environnement de recherche mobile, la nécessité d'examiner le résumé des résultats de répondre directement aux besoins des informations utilisateur pour chaque requête de résultats, nous avons également procédé à un résumé de la page des étiquettes et de la pertinence de l'étiquetage. Sur la base de ces deux corrélations différentes marquées et leur moyenne, on calcule trois indicateurs nDCG. Les résultats montrent que, modèle MCM en trois indicateurs de performance de tri nDCG sont mieux que l'autre comme un modèle de clic de référence.

En conclusion, par l'utilisateur test dans un environnement de recherche mobile - analyse de l'activité de clic, nous vous proposons une nécessité après avoir cliqué sur le biais et les préjugés tester deux types de satisfaction dans un environnement mobile plus commun de polarisation de comportement des utilisateurs. Le biais par les deux clic construction de modèles, nous proposons un modèle de clic mobile (modèle MCM) adapté à l'environnement de recherche mobile. Les expériences sur les journaux de recherche mobile à grande échelle montrent, cliquez sur la prédiction et la prévision de corrélation modèle MCM à la recherche mobile en deux clics tâche par rapport au modèle existant a apporté d'importantes améliorations de performance.

En raison des contraintes de temps, cela ne peut introduire le contenu principal du document, les détails, reportez-vous à l'article original.

5 Xie Xiaohui Université Tsinghua

La construction d'une interaction modèle de comportement pour l'image Web Recherche

Nous avons établi un modèle pour la construction des interactions utilisateur dans la recherche d'images de l'environnement, tri utilisé pour renforcer l'effet de toute recherche d'image.

Recherche avec une différence commune est que ses résultats de recherche de bureau montrent une forme à deux dimensions, dans ce cas, l'utilisateur, en plus de la liste des résultats des tests de haut en bas, de gauche à droite, il y a un test sélectionnez. La seconde est la recherche d'image est pas un mécanisme de basculement évident, nous pouvons obtenir les résultats de la page suivante directement par la molette de la souris. Enfin, sur la présentation de l'image, l'image des informations sur le contenu autonome, cliquez sur l'image aura une incidence sur la recherche dans une certaine mesure, causé cliquez problème clairsemés.

Pour cette raison, nous voulons comprendre le comportement des utilisateurs à la recherche d'image ambiante, le comportement de l'utilisateur et le modèle de construction pour renforcer l'effet du type de recherche d'images.

Nous avons d'abord mené des expériences exploratoires pour comprendre comment les utilisateurs interagissent avec réelle interface de recherche d'image. Nous avons trouvé la souris sur l'image hover opérations reflètent la préférence de l'utilisateur pour un résultat dans une certaine mesure, il agit comme un supplément de cliquer, cliquez clairsemés peut résoudre le problème. En même temps, les utilisateurs entre les deux voisins interaction entre (clic ou vol stationnaire), les images de test agit dans les directions verticale et horizontale est essentiellement à sens unique, il y aura peu de comportement visite de retour. Alors que dans la voie d'essai, il y aura le comportement des utilisateurs sautée, plutôt que des photos de navigation.

Sur la base des résultats ci-dessus, nous vous proposons une recherche d'image basée sur des hypothèses de test de comportement des utilisateurs, et en utilisant les interactions utilisateur modèle graphique probabiliste pour construire un modèle (illustré ci-dessous).

Nous avons comparé le comportement des utilisateurs d'utiliser d'autres hypothèses du modèle, on trouve un modèle pour prédire le comportement de l'utilisateur une plus grande précision, mais elle reflète aussi les hypothèses de notre modèle plus proche du comportement de l'utilisateur réel. En même temps, nous utilisons la qualité de l'image et la pertinence des deux indicateurs pour vérifier que le modèle proposé peut améliorer l'effet de tri recherche d'images. Les résultats expérimentaux montrent que notre modèle peut améliorer les résultats de la commande initiale, ainsi que par rapport à l'utilisation que le modèle de référence et d'autres modèles cliquez sur l'information, notre modèle sous NDCG cet indicateur a apporté des améliorations importantes.

6   Zhang Fan, l'Université de Tsinghua

Comment bien faire hors ligne et d'évaluation en ligne Mesures Mesure la satisfaction des utilisateurs en recherche d'images Web?

Dans le domaine de la recherche d'information, système de recherche documentaire pour l'évaluation des performances, il existe principalement deux types de méthodes d'évaluation. Une technique appelée méthodes d'évaluation hors ligne, cette méthode est bien connue du système Cranfield représenté principalement pour évaluer les différents systèmes d'évaluation des indicateurs de document de requête en fonction de la pertinence marquée sont fondées sur certaines le modèle suppose qu'un utilisateur;

L'autre est la façon dont l'évaluation en ligne, cette approche est plus d'un certain nombre de moteurs de recherche commerciaux utilisés par la société, par exemple, est largement utilisé dans les tests A / B, entrelacée, etc., l'indice d'évaluation est principalement basée sur le comportement de recherche des utilisateurs, tels que CTR, le temps Dwell et d'autres informations.

Imaginez une recherche de la scène et la recherche traditionnelle sur le Web sont très différents, tels que la forme de présentation des résultats, la liste des résultats arrangement, y compris façon chiquenaude, il n'y aura pas la même place. En raison des différences formes existantes d'évaluation face à des défis.

Pour l'évaluation en ligne, il sera évalué avant que le travail derrière les indicateurs du modèle utilisateur résumés dans trois aspects: le modèle d'interaction décrit l'utilisateur du navigateur de l'utilisateur, et xie, qui travaillent sous l'image indique que le comportement de navigation de l'utilisateur sera différent recherche ; modèle d'utilité de la documentation utilisateur décrit les résultats d'une évaluation de l'efficacité et Geng, qui travail suggère que, en plus de la pertinence du sujet, il y a quelques facteurs qui ont également un impact sur l'efficacité d'un résultat d'image, le modèle d'utilité cumulatif décrit comment un utilisateur sur la liste des résultats utilité accumulée, mais pour montrer la forme d'une recherche d'image à deux dimensions est différent de l'arrangement linéaire traditionnel de la voie, ce qui rendra le modèle de conception est différent.

D'autre part, les informations d'évaluation en ligne est principalement basée sur le comportement des utilisateurs, et la recherche d'image différences de comportement et l'utilisateur de recherche sur le Web est tenu d'avoir un impact sur ce point. Par conséquent, notre principal problème est de rechercher dans la nouvelle scène dans l'image, nos indicateurs traditionnels, comment il se comporte, si nous devons avoir une nouvelle réflexion.

La satisfaction du client est une mesure objective importante de la performance de la recherche, nous espérons questions de recherche de réponses en explorant la relation entre l'évaluation et la satisfaction des utilisateurs. Par conséquent, nous avons conçu des expériences pour recueillir la satisfaction des utilisateurs de commentaires des utilisateurs avec le processus de recherche.

procédure expérimentale spécifique et les données expérimentales, y compris l'utilisateur plus tard deux parties marqueur. Dans l'expérience utilisateur, chaque utilisateur après avoir reçu des directives expérimentales et des tâches de formation doivent utiliser le moteur de recherche d'images pour compléter 12 différentes tâches de recherche d'images, des expériences, nous enregistrons des informations sur le comportement de l'utilisateur, après chaque tâche est terminée, les besoins des utilisateurs à la révision leur processus de recherche et des commentaires à faire satisfaction pour chaque requête soumise par lui.

Dans l'étape de marquage, nous avons extrait les résultats des 10 premières lignes d'un utilisateur envoie un mot de requête et les rendements des moteurs de recherche, l'utilisation de crowdsourcing images de la plate-forme pertinence des résultats a été marquée, en outre, nous prenons également en compte la composition de l'image, la clarté, filigrane et d'autres facteurs sur la qualité de l'image a été marquée. Basé sur le label de qualité d'annotation de corrélation et de l'image, nous pouvons calculer l'évaluation en ligne correspondant, et sur la base du traitement de l'information de comportement des utilisateurs, nous pouvons obtenir l'indice d'évaluation en ligne correspondant à la fin, nous avons comparé les différentes évaluation et commentaires utilisateur l'association entre satisfaction.

Nous avons d'abord comparé la qualité de l'image et de la pertinence du thème des deux étiquettes différentes. Mark est divisé en quatre, deux cartes montrant leur distribution et la distribution respective de l'articulation peut être vu, la corrélation est extrêmement inégale répartition du sujet, la grande majorité sont très pertinentes image et la qualité d'image répartition relative plus équilibrée, principalement une image en filigrane de corrélation élevé et donc il peut y avoir des problèmes de qualité. Dans l'ensemble, que nos photos avec le signe considérer que les premières lignes de dix renvoyées par le moteur de recherche si ces images sont de très bonnes performances sur la pertinence et la qualité.

Basé sur une étiquette différente, on compare le coefficient actuel de corrélation de Pearson entre le client commun et hors évaluation de la satisfaction, en plus de la qualité d'image à base thématique et la pertinence de ces deux étiquettes différentes, nous essayons aussi de combiner les deux nous croyons qu'une bonne image nécessite non seulement pertinentes, mais aussi de haute qualité, prenez donc une valeur inférieure à la fois à la suite des images marquées. Les résultats ont montré une forte association entre la prise de la qualité de l'image et de la pertinence du sujet, l'évaluation hors ligne et la satisfaction des utilisateurs.

En prenant en compte les différences de recherche d'image et recherche sur le web, nous essayons également d'introduire des séquences différentes des résultats des tests, les modifications de l'indice d'évaluation, cependant, les résultats expérimentaux montrent de petites différences entre les différentes séquences, en plus, nous essayons aussi d'imaginer la même ligne intégrée dans ensemble, à la suite d'un tout, qui deviendra une séquence de test à deux dimensions séquence linéaire traditionnelle, mais ne l'ont pas encore abouti à l'amélioration des performances. Nous notons dans lequel la performance est la meilleure façon de marquer tous les résultats sont en moyenne, des séquences de test si différentes et approche intégrée est presque aucun effet sur les résultats.

Ensuite, nous comparons les performances des différents index d'évaluation en ligne. Principalement basé sur les clics de souris et un long temps de séjour et d'autres informations, afin de comparer avec un comportement de clic, nous planera l'information de la souris est également prise en compte. Les résultats expérimentaux montrent que réalisé la meilleure évaluation de clics axée sur les résultats, et vol stationnaire dans les informations de recherche d'image, mais apportera beaucoup de bruit, en plus, par rapport à la précédente évaluation hors ligne, l'évaluation globale en ligne associée à une plus grande satisfaction des utilisateurs, d'autant plus que le comportement UCTR tels que les paramètres en fonction clic. Elle reflète également l'importance de clics dans l'image Recherche.

Enfin, nous avons comparé l'évaluation du rendement de la situation dans les différentes intentions de recherche. Reportez-vous aux travaux antérieurs pertinents, nous avons conçu les 12 tâches de recherche seront divisés en trois catégories, une classe est la tâche d'explorer la classe, le but principal est de comprendre les connaissances pertinentes, comme point de repère paysage de recherche Haikou, etc .; deuxième catégorie est le divertissement type de tâche, le but principal est de tuer le temps, se détendre et de divertissement, tels que des photos recherche aléatoires étoiles d'intérêt, le dernier est le matériau de classe de tâche, le but principal est de rassembler des informations d'image pour faciliter l'utilisation ultérieure, comme la production de la présentation de Harry Potter.

Pour l'évaluation en ligne, l'importance des sujets différents dans la qualité d'image et la pertinence des deux facteurs de différentes intentions de recherche. tâches d'exploration comme plus d'attention à la question de la pertinence, et le type de tâche plus attention matériel à la qualité de l'image, parce que le premier est surtout de comprendre les connaissances, alors que ce dernier est dans le but de matière Collect. Pour l'évaluation en ligne, le matériel sous le type de tâche, ils sont associés à plus haut degré de satisfaction des utilisateurs, principalement parce que le matériau peut avoir un type de tâche de recueillir les besoins, les utilisateurs seront plus prudents en cliquant et d'autres actes, mais aussi refléter un meilleur utilisateur les conditions de recherche.

En résumé, notre grande partie du travail explore les performances de hors-ligne et l'évaluation de l'évaluation en ligne sous la scène de recherche d'image. D'après les commentaires de la satisfaction des utilisateurs réels, les résultats expérimentaux montrent que, en tenant compte d'une plus forte corrélation entre la qualité d'image et de la pertinence du sujet, l'évaluation hors ligne et la satisfaction des utilisateurs. Sur la base de l'indice d'évaluation par rapport comportement cliquez sur l'information en ligne d'évaluation hors ligne peuvent obtenir de meilleurs résultats, il indique également que les deux cours a marqué le résultat de la mesure sont encore certaines limites, d'ailleurs, dans les différentes intentions de recherche, deux espèces performances marquée est également quelque peu différente.

Notre travail a aussi quelques inconvénients, d'une part, les expériences d'utilisateur restreint, nos données ne sont pas assez grand, nous devons tirer parti des futures données à grande échelle pour l'analyse comparative, nous devons aussi considérer le niveau de la session d'évaluation, et enfin, nous les spectacles de travail façon marquée fondés sur la pertinence sujet et la qualité de l'image il y a encore quelques limites, donc ce que nous avons besoin de marque est digne d'être étudiée.

7   enthousiasme Fan Institut d'informatique

Modélisation des tendances diverses de pertinence dans Ad hoc Retrieval

Système de récupération d'informations pour trouver les documents relatifs à nos besoins des grandes quantités de ressources d'information, y compris la question fondamentale est de savoir comment déterminer la pertinence de la collecte d'informations et d'interroger tous les documents.

Dans la modélisation liée au travail existant divisé en trois catégories, en fonction de la pertinence de la modélisation au niveau du document, la corrélation et la méthode de modélisation hybride basée sur le paragraphe. Ces trois méthodes utilisent liées à la politique fixe la prise de décision est difficile de répondre à toute la documentation relative aux besoins des différents modes.

Par conséquent, nous vous proposons un moyen d'utiliser plus de données, de sorte que les signaux pertinents de différentes tailles se font concurrence, et enfin choisir un signal approprié en rapport avec le document courant requis pour la prise de décision. Notre modèle se compose de deux niveaux, le premier niveau est une couche d'adaptation partielle, pour générer un couplage de signal local. Sélectionnez la documentation appropriée relative aux signaux de décision au deuxième niveau, la couche de prise de décision globale.

Dans la couche d'adaptation locale, le premier mot dans le document est mis en correspondance avec un mot de vecteur, le document en utilisant une fenêtre glissante pour couper différents petits fragments du document, le signal de corrélation à grain fin généré pour chaque partie de texte.

Ensuite, nous utilisons un cycle de modèle de réseau de neurones à deux dimensions, le signal de corrélation pour générer des fragments de chaque texte, mis en avant trois prises de décisions de corrélation de base. La première hypothèse, un document signal de corrélation pertinente par un paragraphe spécifique dans le document déterminé. La seconde hypothèse, le modèle de prise de décision totale que la corrélation des signaux provenant d'une pluralité de pièces continues, ou même des documents entiers signaux similaires utilisés ici est le réseau neuronal récurrent bidirectionnel, l'accumulation de signaux. Enfin, une décision mixte, combine les avantages des deux modèles, puis les morceaux différents signaux de granularité pour sélectionner.

Notre expérience se compose de deux ensembles de données, respectivement, MQ2007, MQ2008. Nous utilisons trois types de base (de base), la première est la méthode traditionnelle, y compris BM25, ainsi que MSP, approche PLM. La deuxième catégorie est la méthode d'apprentissage triés, il y a le choix des deux modèles l'état de l'art, le premier est AdaRanK, le second est LambdaMart, la troisième catégorie est seul modèle récemment proposé la récupération en profondeur.

Dans la première expérience, l'influence de différents signaux de corrélation de couche d'adaptation partielle pour le résultat final de la sorte. Comme dans le cas de notre modèle à plus signal de demande, il peut obtenir de meilleures performances.

Dans l'expérience comparative toutes les méthodes de base, une méthode classique qui est déjà un très fort modèle de calcul BM25, alors qu'une telle méthode simple paragraphe en utilisant le niveau du signal de corrélation, sa performance est bien pire que BM25. En d'autres termes, il est difficile de modéliser le mode pertinent en fonction d'une variété de méthode paragraphes spécifiques.

Dans le genre d'apprentissage qui, en plus d'utiliser les fonctions de base du genre de méthodes d'apprentissage, comportera également des paragraphes fondre en elle, nous avons trouvé en comparant les caractéristiques se fondent dans les paragraphes et peut parfois améliorer, mais instable, et finalement trouvé la méthode proposée peut mieux modéliser besoins liés à la diversité, à réaliser de meilleures performances.

Enfin, l'analyse des échantillons, l'analyse de corrélation des besoins de notre modélisation de modèle peut vraiment diversifié.

Qin L lag jet deux jours quatre heures de sommeil, exprimées comme le soleil femme en détresse
Précédent
Pourquoi ne pas Tetsuo BAN, BAN Gary ne BAN Kasha, il y a trois élections Lu Xian?
Prochain
Langue naturelle Représentation et Raisonnement pré-AIS spécial parleront toute part des marchandises sèches
2019 Fête du Printemps de chemin de fer Beijing a officiellement ouvert le rideau, rappelant des moments mémorables au cours de la Fête du Printemps
Nokia 8 Sirocco: véritable vaisseau amiral, parler de sentiments
Détail ultra Honda voiture CR-V, une voiture n'est plus regarder hésiter
TV 4K vraiment inutile? C'est vraiment une blague est pas drôle!
Drove une sensation BMW X6? Propriétaires: la vieille dame en bas disent que cette voiture de bonne mine
Iphone de la machine Andrews est l'échange quels sentiments? Critiques d'utilisateurs lumineux
Après le match de téléphone mobile "Black Shark", "Red Devils", 2499 yuans!
NBA observation de la profondeur: Lori signes, Orioles Getatumu calé
Soins profondément sur la version AT de la chance Bin Bin exposition d'essai routier de plus en plus 6AT
U disque pour briser la vitesse d'explosion du laitier? Je voulais apprendre le programme rapide une fois pour toutes il? !
AmazingJ: Jeu RNG Avril à gagner l'IG 21, RNG a une arme secrète!