Ape sommet de conseil MSMARCO: lecture machine de compréhension à un niveau humain, Baidu a battu Microsoft

Temple Yun dans le fond de la non concave

Qubit produit | Numéro public QbitAI

Cela ne peut pas être la plupart des gens attendus.

Sur la célèbre Microsoft MSMARCO (Microsoft) MAchine lecture COMPREHENSION machine à lire les classements des tests de compréhension, maintenant l'équipe numéro un, il a tranquillement transformé en singes de conseil.

Cela signifie qu'un fournisseur de l'école primaire et secondaire de conseil start-up en ligne, dans cette compréhension de la lecture de la machine dans la force de la concurrence, battre Baidu, Microsoft a deux adversaires forts.

Plus que cela, la performance de ce singe conseils système AI, mais aussi sur le niveau humain.

Tel est le cas sur apparaît d'abord de MSMARCO. équipe d'entraîneurs Ape de deux points de test: 49.72,48.02. Les humains de référence 47,46.

Ce qui est plus qu'un niveau humain?

Ape conseil a donné une explication:

ensemble de données contient MSMARCO requête de recherche Microsoft BING et recherche Résultat de la requête Top 10 correspondant.

Cela signifie que plus humain, une requête donnée et les 10 résultats de recherche, pour trouver la machine de réponse et plus précise que la personne moyenne à trouver.

 officiel MSMARCO a envoyé un message de félicitation

En fait, MARCO est basée sur la compréhension en lecture ensemble de données moteur de recherche Microsoft BING construit à grande échelle anglaise contient 100000 et 200000 question non-répétition du document.

ensemble de données MARCO tous les problèmes des journaux de recherche bing basé sur l'entrée d'utilisateur dans le moteur de recherche BING des problèmes réels simulés dans des scénarios réels, est l'une des zones les plus ensembles de données de valeur.

Avant les informations fournies par Baidu a déclaré que dans le domaine de la compréhension de la lecture de la machine, de nombreux chercheurs impliqués dans l'initiation de l'Université de Stanford SQUAD Défi. Mais par rapport SQUAD, MARCO défi plus difficile, car il a besoin de tester le modèle présenté à la compréhension des documents complexes, la capacité de répondre à des questions complexes.

En Février de cette année, Baidu équipe PNL dans le classement ce sommet, une vingtaine de 46.15,44.46. Avec le V-NET avant Baidu est un modèle unique.

Et appelé MARS (Multi-LECTEURS Attention) du modèle de consultation des singes utilisés. Ce modèle utilise cascade mécanisme d'attention, l'échantillonnage d'une pluralité de réponses de candidats régions dans un des documents de plusieurs candidats, et l'utilisation du modèle panachage sur cette base, afin d'optimiser la réponse finale.

L'équipe de coaching PNL système de singes, y compris les membres clés de Zhao Wei et al.

Je ne plaisante pas, au moment où un cerveau qubit faire la phrase suivante: « Baidu beat équipe Zhao Wei. »

Ne le prenez pas au sérieux, ne le prenez pas au sérieux. Il est entendu que Zhao Wei était un vrai homme, singe examen avant de rejoindre Microsoft avait déjà travaillé, que le général AI Whampoa Académie militaire de Microsoft.

En fait, les réalisations de coaching singe dans le domaine de la PNL, non seulement celui-ci.

Quelque temps auparavant, qubits également vu un document de consultation de singe sur arXiv. L'auteur de cet article est de singe équipe d'entraîneurs de la PNL de Wang Liang.

Les questions ont été très simples:

Yuanfudao à SemEval-2018 Tâche 11: attention à trois voies et Relational Connaissance pour la machine Commonsense Comprehension.

Il est tout simplement singe équipe coaching PNL SemEval-2018 La (évaluation sémantique internationale) d'une tâche, a remporté une deuxième place.

Cette tâche est appelée machine à l'aide Comprehension Commonsense connaissances, ce qui signifie: l'utilisation de la compréhension de la lecture de la machine de bon sens.

La tâche numéro un est de voler une audience conjointe HIT équipe de laboratoire.

Dans un autre classement de compréhension à la lecture de la machine bien connue sur SQUAD À l'heure actuelle singe PNL entraîneur résultats de l'équipe est venu en sixième.

À l'heure actuelle, il y a trois SQUAD égalité au premier, en plus du HIT IFLYTEK équipe de laboratoire commun, Microsoft Research Asia et une équipe conjointe de la Défense nationale, ainsi qu'un nouveau visage serré dans: Google cerveau et CMU équipe conjointe.

Il semble, de concourir pour le domaine de la PNL sera plus intense, plus amusant.

Enfin, le conseil de singe contacté qubit, donner une réponse formelle officielle.

Nous sommes également une liste ci-dessous, à titre de référence.

1. Pourquoi faire du counselling compréhension de la lecture de la machine de singe

De l'entreprise depuis la formation, nous avons un département de recherche appliquée, l'éducation AI comme la technologie sous-jacente pour les applications futures, nous sommes également concentrés sur l'entreprise de construire sa propre capacité dans ce domaine, y compris les grands singes tutorat des cours en ligne, y compris les divers métiers de l'entreprise, profiter également le changement apporté par la promotion et de la technologie AI.

la compréhension en lecture automatique, reconnaissance vocale, la reconnaissance de l'écriture manuscrite, la reconnaissance d'image et d'autres technologies sont utilisées dans le conseil de singe de cours de tutorat en ligne, petit problème de recherche de singe, un petit opérateur portuaire de grands singes, zèbres anglais et ainsi sur les produits, tels que la recherche de petit singe thème de recherche fonction de titre, la reconnaissance de l'écriture manuscrite dans la composition anglaise et la notation, je compte une petite caméra de singe marquage, livres d'images de zèbres en anglais les résultats en lecture, et ainsi de suite.

La lecture machine de compréhension est seule de l'équipe AI dans une direction technique, la société a essayé de faire plus au niveau technique, c'est aussi l'un des premiers à obtenir les premiers résultats

2, les membres de l'équipe R & D

Ape conseil équipe de recherche appliquée a été créée à la mi-2014, nous avons été engagés dans l'apprentissage en profondeur dans le domaine de l'éducation et de la recherche appliquée. les membres de l'équipe ont obtenu leur diplôme de l'Université de Pékin, l'Université de Tsinghua, l'Université Jiaotong de Shanghai, Académie chinoise des sciences, Université de Hong Kong Les collèges bien connus et les universités, la plupart ont des études de maîtrise ou de doctorat.

La recherche comprend une reconnaissance d'image, la reconnaissance vocale, la compréhension du langage naturel, champ d'exploration de données, la profondeur de l'apprentissage. Équipe utilisation réussie de la technologie de l'apprentissage en profondeur, à partir de zéro les utilisateurs actifs recherchent des milliards de dollars de titre de la caméra APP-- petite recherche de titre de singe, open source distribué machine à système d'apprentissage YTK apprendre et système de communication distribué YTK-mp4j.

3, soumis au modèle Microsoft est quoi? Pourquoi plus de Baidu?

MARS (LECTEURS Multi-Attention) nous avons présenté ce modèle, l'utilisation de cascade mécanisme d'attention échantillonnage une pluralité de régions dans un candidat multi-candidat répond au document, et l'utilisation du modèle panachage sur cette base afin d'optimiser la réponse finale.

Dans l'évaluation des indicateurs, les conseils de singe téléchargé MARS est le premier de plus d'un modèle humain sur ensemble de données MSMarco, et beaucoup plus que la deuxième place Baidu. Résultats de la recherche pour la requête et la requête principale correspondante 10 selon l'équipe, cet ensemble de données contient Microsoft recherche bing, ce qui signifie que plus humaine, une requête donnée et les 10 résultats de recherche, trouver la machine à réponse que la personne moyenne à la recherche de plus quasi.

[A propos de plus de données humaines, compte tenu du côté de Microsoft de l'argument est le suivant: peut-modèle lire, de comprendre et de répondre aux questions mieux que les humains Le dessous est la performance humaine en cours sur la tâche MS MARCO (que nous améliorerons dans les versions futures) Ce ?. a été constatée en ayant deux juges répondent à la même question et la mesure de nos mesures sur leurs réponses.]

En outre, notre lecture de modèle sur SemEval (évaluation sémantique internationale) la compréhension de la tâche, a remporté la deuxième place. Auparavant, sur des ensembles de données, SQUAD le troisième modèle unique.

- FIN -

recrutement sincère

Qubits recrutent éditeur / journaliste, basé à Zhongguancun de Beijing. Nous attendons de talent, des étudiants enthousiastes de nous rejoindre! Détails, s'il vous plaît interface de dialogue qubit numéro public (QbitAI), réponse mot "recrutement".

Qubit QbitAI · manchettes sur la signature de

' « suivre les nouvelles technologies AI dynamiques et de produits

Ne pas rapide au hardcore clameur SUV, la voiture vous dit ce hors route!
Précédent
L'histoire du jeu le plus difficile la survie! La vie est meilleur joueur de l'herbe, Tyran ira sur la route volé des mendiants
Prochain
Moins de 100000, la configuration comparable à un million de voitures de luxe, mais maintenant il est difficile d'acheter!
Forbes la plus précieuse de l'équipe du monde, aucune équipe chinoise, en GEN.G seule entrée de l'Asie?
« À l'approche aucun ami, » le modèle de détection cible YOLO v3 sortent, après arXiv effondré ...
Vous savez que gênant, mais beaucoup de pilotes corne encore chaotique, quel état d'esprit?
les femmes Guoping et une équipe « au sein de l'équipe grande boucle » fin, haut Wang Manyu, Meng tiers!
Sicong a ordonné à IG: ne salissent pas fait! patron C9 sur son visage: Vous êtes le rythme de G2!
J League équipe de trois collective de l'aide étrangère des ratés d'allumage Brésil, le Japon Liuyang porter l'attaquant Polti se précipita rush à la rescousse
Gouverneur de l'Arizona a envoyé une lettre: Uber a révoqué la qualification de test d'entraînement indéfiniment pilote automatique
Le SUV coréen était à la mode, et maintenant il a été forcé à des prix de ventes d'incendie de voitures domestiques!
Qui est la plus éblouissante 2016 table de recrue de tennis? - monde de ping-pong
Top entreprises de jeu à tomber rapidement pour l'argent! L'impitoyable Kojima, et Tencent a également fait équipe
Zhang Yuning leçon: premier attaquant de somnambulisme six mois de l'Asie au début des années 20 pour rejoindre Brême