Entrées: Liste face Coupe du Monde Libéré, Microsoft part d'un million de concours de reconnaissance célébrité gagnant

1 Ji-won nouveau rapport

Juin 2016, Microsoft a publié au public sur une grande échelle dans le réel jeu de données d'image face du monde de MS-Celeb-1M, contenant environ 10 millions (10M) coups de visage de célébrité 100000, encourager les chercheurs à développer la reconnaissance faciale avancée la technologie.

On a également annoncé qu'il y a un million de MS-Celeb-1M face Défi. Les participants doivent ensemble de données (mais sans s'y limiter) du Défi a fourni des données de formation, le développement du système de reconnaissance d'image, l'identification 1000000 de l'image du visage de célébrité.

Aujourd'hui, on a annoncé les résultats du concours, dont:

Un million de sous-proposition de reconnaissance célébrité,

  • cours illimités (sans utiliser des données externes), Panasonic-NUS (Université nationale de Singapour) a remporté le premier prix, l'Académie chinoise des sciences Institut de Chongqing technologies vertes intelligentes (CIGIT) et l'Académie chinoise des sciences deuxième co-équipe, troisième Northeastern University;

  • Il sont limités (seule course pour fournir des données), est la première de Beijing Orion Star Technology Co., Ltd.

  • échantillons de formation des enfants de célébrité pour identifier une seule proposition,

  • classe Unlimited (données externes peuvent être utilisées librement), est le premier NUS-Panasonic

  • Il sont limités (seuls les concours données fournies), est la première université du Nord-Est

  • L'équipe gagnante de la technologie ont adopté une méthode basée sur la profondeur de l'apprentissage, ainsi qu'un vaste réseau de données. Comme on peut le voir, le réseau est la tendance du développement des grandes données, l'intégration multi-modèle est maintenant en train de gagner chaque arme du jeu.

    identifie un million Microsoft MS-concours célébrité Celeb-1M: combler le fossé entre le monde universitaire et de l'industrie

    Il y a beaucoup de concours de reconnaissance des visages, Microsoft millions de compétition Défi de reconnaissance des célébrités avec existant Quelle est la différence?

    Selon le Dr Zhang Lei, chercheur en chef à l'Institut Microsoft technologie et la recherche (Microsoft technologie et la recherche) / directeur de la recherche: Tout d'abord, l'objectif MS-Celeb-1M est d'identifier les visages de millions de personnes, est le plus important dans la classification de la vision par ordinateur, et l'un des correspond à une entité de caractère, base de connaissances liée, la base de connaissances et fournissent chaque profession de la personne, le sexe et ainsi de suite une foule d'informations, de manière à résoudre le problème du caractère du même nom, peut être atteint de la reconnaissance cognitive. « Nous sommes confrontés au début de la communauté universitaire à faire cet ensemble de données, » Zhang Lei a déclaré au New Ji-won: « Mais beaucoup de l'industrie par les pairs a également exprimé notre ensemble de données pour leurs travaux de recherche utiles. »

    étude approfondie des progrès de l'algorithme de reconnaissance visuelle a fait de grands progrès au cours des dernières années. Cependant, la vie intelligente et innovante entre les services effectivement mis en service sur l'écart énorme académique existe encore, surtout parce que:

    (1) l'absence de grande échelle des données du monde réel recherche universitaire, entravant ainsi les algorithmes efficaces de formation et d'évaluation;

    (2) l'absence d'une évaluation ouverte juste transparente plate-forme et efficace et du résultat de reconnaissance est reproductible, d'obtenir facilement.

    À l'heure actuelle, plusieurs grands ensembles de données de reconnaissance faciale accessibles au public (figure vert ci-dessous) sont les suivants:

    • LFW est un ensemble de données de l'Université du Massachusetts, cette échelle entre tous les niveaux (13k);

    • YFD ensembles de données face Yale, vision par ordinateur et le centre de contrôle créé par l'Université de Yale, a un changement d'éclairage différentes, les expressions du visage et la posture, mais un petit nombre;

    • CelebFace contient plus de 20 millions d'images;

    • CASIA WebFace Académie chinoise des sciences Institut de l'automatisation de plusieurs ensembles de données, qui comprennent les empreintes palmaires, l'écriture, l'action humaine et six autres types de jeux de données, le besoin de suivre les instructions à appliquer, gratuitement.

    Ensuite, Facebook et Google jeux de données bien grande échelle, mais ils ne peuvent pas accessibles au public.

    Celles-ci reflètent tout un écart important existe entre le monde universitaire et l'industrie.

    Par conséquent, l'Institut technique de Microsoft et le Dr Guo Yandong talent en 2016 de référence MS-Celeb-1M proposé. MS-Celeb-1M Bien que les données face célébrité, mais avec une célébrité recueillie à partir du réseau pour recueillir toutes les images du visage possible que les données de formation. Sur la base de la base de connaissances riche en information aide à éliminer l'ambiguïté et offre une mine d'informations de caractère, d'améliorer la précision de la reconnaissance, si près d'une variété d'applications dans le monde réel, telles que des légendes d'images et l'analyse des nouvelles vidéo, l'analyse de l'opinion publique et ainsi de suite.

    En effet composé entre le milieu universitaire et de l'industrie en raison des lacunes de données causées par l'algorithme de modèle.

    Design Index du concours: fin à la reconnaissance de la fin, contribuent aux applications du monde réel de

    En ce qui concerne l'indice de la concurrence qui, MS-Celeb-1M de Microsoft a également fait pour remplir la concurrence existante.

    À l'heure actuelle, plus la concurrence de reconnaissance faciale bien connue des données accessibles au public peuvent avoir LFW et Megaface. échelle LFW entre tous ce niveau, car les données ne sont pas partagées et la formation d'autres raisons, ces dernières années ont montré une tendance qui devrait se surajustement, et les chercheurs de Microsoft trouvé, LFW meilleur algorithme est souvent difficile de reproduire complètement . De plus, la concurrence LFW est le rapport de similitude entre deux images de la pratique d'une certaine distance.

    Megaface Washington University ensembles de données publiées, des dizaines de contenus Internet sont les photos de étoiles ainsi que des données d'interférence sur un million de photos des gens ordinaires. Cependant, l'établissement d'objectifs Megaface est différent, par rapport à la « vérification du visage dans des situations bruyantes » « reconnaître » plus probable (vérification du visage) . Plus précisément, la concurrence cible Megaface est dans les millions de personnes identifient une dizaines de personnes spécifiques. Des dizaines de personnes est difficile d'évaluer le rôle de la performance de reconnaissance faciale est très complète des applications et pratiques sont encore un peu plus loin. De plus, les données test Megaface n'a pas été artificiellement marquée, contient du bruit. les données de test de bruit lors de la mesure modèle haute performance d'interférence est très grave.

    À cette fin, Microsoft a modifié l'indice d'évaluation de MS-Celeb-1M. Participez au concours est une image, la sortie est un nom très proche de la réalité, les scénarios d'application de reconnaissance faciale - pour déterminer si un visage humain est une image d'une personne spécifique.

    « Notre mission est de mettre fin à la mission, en particulier, la tâche est de l'image dans le code référentiel d'identification des célébrités. Dans ce cas, il est introduit naturellement de nombreux problèmes de recherche de valeur, telles que la façon d'obtenir efficacement les données du réseau ( nous nous permettons d'augmenter les données de formation), comment faire bon usage des données de formation étiquetée de bruit (énorme, ce qui coûte plus annotation manuelle), la façon de traiter des quantités massives de données (cible un million de personnes, des milliers de niveaux de diagramme), lorsque certaines personnes les données sont extrêmement rares, les données inégales comment faire, et ainsi de suite, ce sont CV à l'intérieur de problème intéressant. « , a déclaré Guo Yandong.

    Les équipes ont pour but est d'identifier les personnes mixtes millions de particuliers en 1000, mais spécifique 1.000 participants ne savent pas. Par conséquent, afin d'obtenir le meilleur taux possible et la précision de rappel, les modèles mis en oeuvre doivent couvrir autant de gens, même tous un million échelle. Ce modèle a présenté une très forte demande. De plus, le manuel de l'équipe de recherche de Microsoft ensemble de test très soigneusement marqué dans l'ensemble de test assure une très grande précision, de sorte que le modèle de haute performance et un modèle pour mesurer la performance du taux de précision de près de 100% (rappel @ haute précision ) est très efficace.

    Non seulement cela, MS-Celeb-IM d'un million de célébrité est également un concours pour identifier « l'apprentissage de petits échantillons » (apprentissage des lowshot) des zones où une attention particulière lorsque certaines personnes données de formation très peu de temps, comment les résultats du modèle ne montent.

    Ici, les équipes doivent identifier 1000 personnes de 21.000 personnes. Mais que 1000 personnes chaque être humain a une image d'un train. Dans de nombreux cas, comme la reconnaissance faciale de la sécurité publique, le suspect qu'une image vague ou à l'abri, à savoir que, dans la vaste mer, appartient à l'apprentissage de petits échantillons.

    Ceci est un autre dans la direction verticale préconisaient aujourd'hui dans une certaine mesure l'intelligence artificielle: apprentissage des concepts visuels à partir d'un échantillon limité.

    L'équipe gagnante technique Partager: Low-shot lien entre l'apprentissage

    Après les résultats du concours ont été annoncés, la nouvelle interview Ji-won avec Low-shot concours d'apprentissage vainqueur Université nationale de Singapour avec l'Institut de Singapour de l'équipe Panasonic, les membres Zhao Jian en tant que représentant de partager leurs méthodes d'idées et de l'expérience de la compétition.

    L'équipe gagnante: NUS-Panasonic, Membres: Zhao Jian (NUS), Cheng Yu (Panasonic), Wang Zhecan (NUS), Xu Yan (Panasonic), Karlekar Jayashree (Panasonic), Shen Shengmei (Panasonic), Feng Jia quand (NUS).

    New Ji-won: Pourquoi participer à Microsoft MS-Celeb-1M d'un million d'identification course célébrité?

    NUS-Panasonic: identifie Microsoft un million de course est une reconnaissance de la célébrité faciale reconnue « Coupe du monde. » annuel Le concours est parrainé par Microsoft Research, avec le domaine de la plate-forme de rencontre première vision par ordinateur ICCV 2017, niveau élevé, la difficulté de profil haut. Face à meilleures équipes du monde veulent tous avoir un aller dans ce jeu, une marque de. Cela inclut à la fois la course et la dernière reconnaissance faciale similaire à grande échelle course (Hard Set et Set aléatoire), mais aussi de proposer un nouveau, plus difficile Apprendre la concurrence à faible tir. Les organisateurs espèrent que les deux équipes peuvent obtenir une identification précise du visage humain à grande échelle, mais aussi être en mesure d'identifier avec précision une solution efficace au problème des échantillons de formation de visage humain rares.

    groupe NUS LV créé par le professeur Yan dans l'eau, quand dirigé par le professeur Jia Feng, est actuellement l'une des meilleures équipes dans les grandes institutions universitaires dans l'apprentissage de la profondeur et le champ de vision par ordinateur. La reconnaissance faciale est son équipe a été un groupe de LV pilier intégral, répété succès - pour la première fois pour atteindre une précision de reconnaissance de 99,7% dans l'ensemble des données de reconnaissance de visage LFW, la concurrence dans le NIST 2017 IJB-reconnaissance face à deux matchs Matsushita Institute à Singapour pour travailler ensemble pour gagner le championnat. Nous avons choisi de participer à cette année (2017) Microsoft un million de célébrités veulent être en mesure d'identifier concours pour se montrer à la plus haute reconnaissance faciale de la plate-forme, et de stimuler les progrès et le développement rapide de la technologie de reconnaissance faciale à grande échelle.

    New Ji-won: D'un point de vue technique, ce que les participants s'est la plus grande source d'inspiration?

    NUS-Panasonic: La compétition pour obtenir la plus grande source d'inspiration est Les systèmes de reconnaissance faciale précis et efficaces généralement nécessaires pour concevoir un des problèmes complexes modulaires, de la collecte de données, le nettoyage, le prétraitement, à la conception du modèle, la formation, les tests, puis à l'intégration des différents modèles, l'apprentissage de la mesure, l'évaluation des performances, chaque après le module et essayer quelques idées nouvelles et des stratégies différentes, l'effet de chaque module de débogage au mieux, l'engagement au niveau du système .

    New Chi Yuan: Pouvez-vous nous parler de vos idées, les méthodes et les raisons de la gagner?

    NUS-Panasonic: Apprendre à faible tir l'accent sur les équipes peut résoudre efficacement le problème de la rareté de l'identification précise des échantillons de formation de visage. concours d'apprentissage à faible Travelling ont été fourni deux séries de données --base Set et Set Novel. Dans laquelle Set de base contient 20k célébrité, 50-100 feuilles par Celebrity fournissent des données échantillons Novel Set contient célébrité 1k, seule une célébrité chaque donnée d'échantillon. Dans le test, le test prévu par les organisateurs se concentrera sur la célébrité mélangée avec nouvel ensemble de données de Base, et l'accent mis sur la performance de l'algorithme face à des rares échantillons de formation Set Novel.

    Pour résoudre ce problème, nous 100k célébrité reconnaissance faciale fondée sur la concurrence à grande échelle pour fournir des données de formation, les données contenues dans le nouvel ensemble célébrité 1k suppression de construire une base de données « Plus », la formation de plusieurs structures différentes modèle de réseau, le réseau a appris qu'un degré adéquat de caractéristiques distinctives, la robustesse et la performance généralisation, différents modèles de réseau ont des effets appris fonctionnalités complémentaires. Nous adoptons une fonction de recherche pour tester chaque modèle, quand un certain nombre de tests pour déterminer des stratégies efficaces au moyen de validation croisée.

    Par rapport à d'autres équipes, ainsi que les méthodes traditionnelles d'apprentissage des solutions à faible Plan, les Notre principale amélioration est l'utilisation du bâtiment conformément aux dispositions des données de jeu supplémentaires, le modèle multi-mesure de l'apprentissage, l'intégration de vote heuristique et la phase test de mise en valeur des données .

    get jeu de bons résultats dépendent aussi de l'Institut Matsushita de Singapour de matériel informatique adéquat, tels que les clusters de GPU à grande échelle et la dernière DGX. Matsushita Institut de Singapour est également une donnée équipe marquée dans cette compétition a joué un grand rôle.

    New Chi Yuan: Quelle est la plus grande difficulté est rencontrée dans le jeu? Comment le résoudre?

    NUS-Panasonic: Comment un million de difficulté célébrité reconnaissable modèle efficace pour une utilisation efficace des données existantes effet d'entraînement optimal. Afin de résoudre le problème des échantillons de formation du visage humain rares, notre 100k célébrité reconnaissance faciale basée sur la concurrence à grande échelle pour fournir des données de formation, en supprimant les données qui y sont contenues Set Novel dans la célébrité 1k, la construction d'une base de données « Plus », la formation modèle de réseau plusieurs structures différentes. Égal au nombre de neurones dans une catégorie de classification du processus de formation, et enfin une couche de réseau entièrement connecté (FC), le niveau de la formation d'un grand nombre de paramètres sont souvent difficiles à mener directement à la formation du réseau, la perte de la fonction des chocs de volatilité ne tombe pas. nous avons fait ici quelques ajustements, le processus de formation est divisé en deux phases, le premier réseau de formation à discrimine 1/10 type d'échantillon, après que le réseau a tendance à converger, la dernière couche FC remplacé, et la deuxième étape la formation et le réglage, de manière à résoudre le type grand échantillon, les problèmes de formation efficace en réseau.

    New Ji-won: l'algorithme proposé vous avez une application pratique?

    NUS-Panasonic: Notre algorithme proposé peut effectivement résoudre le problème de la rareté de l'identification précise des échantillons de formation de visage, qui ont une grande valeur et les perspectives d'affaires pour le domaine des systèmes de sécurité, systèmes ménagers intelligents, l'interaction sans pilote et humain-ordinateur. Je suis très optimiste au sujet des algorithmes d'atterrissage futurs, tels que la recherche peut être combiné avec l'algorithme de reconnaissance faciale, la technologie de compression de réseau et les technologies connexes de conception au niveau système FPGA, fournir plus de commodité à la vie et la production de personnes.

    Bien que la précision de la reconnaissance faciale est déjà élevé, mais la plupart des technologies grand public et les algorithmes requis attitude ou condition prédéterminée comme prémisse, tel que le n-face ou presque vrai visage, l'image est claire et sans obstacle, les expressions du visage, comme arrière-plan unique. vrai sens intelligent de la reconnaissance future du visage sera une bonne solution au problème ci-dessus, et continuer à réaliser de nouvelles percées à grande échelle, des conditions non limitatifs et la rareté des échantillons de formation du problème de reconnaissance des visages.

    New Ji-won: Félicitations pour obtenir de bonnes notes, et enfin partager le gain sentir.

    NUS-Panasonic: la coopération par le groupe Wholehearted NUS LV et Panasonic, et après trois mois d'efforts communs et de la lutte, nous avons finalement réussi à remporter trois concours Microsoft reconnaissance célébrité visage (Hard Set, Set aléatoire, Apprentissage bas-Shot) champion. Très heureux de devenir une équipe championne peut atteindre de tels résultats, le dévouement et inséparable de la coopération de NUS avec Panasonic deux unités ensemble chaque membre de l'équipe ne peut se passer, la lutte commune. Merci Professeur Jia mon mentor Feng, culture professeur Yan aqueuse, l'orientation et la confiance, grâce au CAS Institute of Automation - militaire allumé l'aide de l'enseignant et des conseils, grâce à l'Université nationale de la Défense et le financement du Conseil des bourses d'études en Chine, je vais continuer à travailler dur, l'espoir aux gens domaine de la reconnaissance des visages à de nouveaux sommets, propulsé le développement des technologies connexes et du progrès.

    références

  • . Y. Guo, L. Zhang, Y. Hu, X. Il et J. Gao MS-Celeb-1M :. Un ensemble de données et de référence pour une grande reconnaissance faciale à grande échelle dans Proc de Conf européenne sur l'ordinateur Vision (ECCV) .. . Springer, 2016.

  • Y. Guo et L. Zhang, One-shot de reconnaissance des visages par la promotion des classes sous-représentés, arXiv prépublication arXiv: 1707,055742017.

  • Cliquez ici pour lire l'original pour voir de nouveaux emplois Ji-won

    Utilisez vos choses existantes, se concentrer sur vos ressources existantes | 8 Liste des actions Tiao
    Précédent
    Iran pour remplacer le dollar par le yuan, après le pétrole irakien trouver de nouveaux acheteurs, il y a deux choses nouvelles tout à coup changer
    Prochain
    Vietnam dépendance économique excessive du dollar, après avoir suivi l'exemple du Canada, la première baisse ou riche, pensa tout à coup de RMB
    bleu pour faire un rêve méditerranéen turc, sourit et est tombé amoureux de ce pays romantique
    Ma Weiying, Zhu Jun, Mei Zhu Qiao, Liu Yang, Qin Tao, et d'autres le partage profond, CCRRA 2017 Vue d'ensemble
    Rural a conduit vers le fossé très visage? Utilisateur: Maintenant, tout le monde a une voiture, il n'y a pas besoin!
    Après l'annonce officielle par le règlement de l'argent du pétrole vénézuélien, les choses progressent, il y a deux grands pays à suivre
    « Étude approfondie quatre orientations technologiques majeures, » le père de Keras, la machine de démontage chercheur Google étude indépendante
    Accidentellement, ils paient des impôts ...... QI
    cur transpercé! Retour Open voiture de luxe à la campagne, pourquoi les gens autour de l'attitude de tout cela?
    En cas de suspicion de trouble, de détention! Le!
    200000 peuvent être achetés comme un SUV importateur net! Mettre l'accent sur la qualité que vous ne devez pas manquer
    L'hiver est le plus de mots d'amour toucher « Go! Go à des sources chaudes! »
    Vous devez lister les notes Man est finalement venu | vomissements finition du sang