Entr�es: Liste face Coupe du Monde Lib�r�, Microsoft part d'un million de concours de reconnaissance c�l�brit� gagnant

1 Ji-won nouveau rapport

Juin 2016, Microsoft a publi� au public sur une grande �chelle dans le r�el jeu de donn�es d'image face du monde de MS-Celeb-1M, contenant environ 10 millions (10M) coups de visage de c�l�brit� 100000, encourager les chercheurs � d�velopper la reconnaissance faciale avanc�e la technologie.

On a �galement annonc� qu'il y a un million de MS-Celeb-1M face D�fi. Les participants doivent ensemble de donn�es (mais sans s'y limiter) du D�fi a fourni des donn�es de formation, le d�veloppement du syst�me de reconnaissance d'image, l'identification 1000000 de l'image du visage de c�l�brit�.

Aujourd'hui, on a annonc� les r�sultats du concours, dont:

Un million de sous-proposition de reconnaissance c�l�brit�,

cours illimit�s (sans utiliser des donn�es externes), Panasonic-NUS (Universit� nationale de Singapour) a remport� le premier prix, l'Acad�mie chinoise des sciences Institut de Chongqing technologies vertes intelligentes (CIGIT) et l'Acad�mie chinoise des sciences deuxi�me co-�quipe, troisi�me Northeastern University;

Il sont limit�s (seule course pour fournir des donn�es), est la premi�re de Beijing Orion Star Technology Co., Ltd.

�chantillons de formation des enfants de c�l�brit� pour identifier une seule proposition,

classe Unlimited (donn�es externes peuvent �tre utilis�es librement), est le premier NUS-Panasonic

Il sont limit�s (seuls les concours donn�es fournies), est la premi�re universit� du Nord-Est

L'�quipe gagnante de la technologie ont adopt� une m�thode bas�e sur la profondeur de l'apprentissage, ainsi qu'un vaste r�seau de donn�es. Comme on peut le voir, le r�seau est la tendance du d�veloppement des grandes donn�es, l'int�gration multi-mod�le est maintenant en train de gagner chaque arme du jeu.

identifie un million Microsoft MS-concours c�l�brit� Celeb-1M: combler le foss� entre le monde universitaire et de l'industrie

Il y a beaucoup de concours de reconnaissance des visages, Microsoft millions de comp�tition D�fi de reconnaissance des c�l�brit�s avec existant Quelle est la diff�rence?

Selon le Dr Zhang Lei, chercheur en chef � l'Institut Microsoft technologie et la recherche (Microsoft technologie et la recherche) / directeur de la recherche: Tout d'abord, l'objectif MS-Celeb-1M est d'identifier les visages de millions de personnes, est le plus important dans la classification de la vision par ordinateur, et l'un des correspond � une entit� de caract�re, base de connaissances li�e, la base de connaissances et fournissent chaque profession de la personne, le sexe et ainsi de suite une foule d'informations, de mani�re � r�soudre le probl�me du caract�re du m�me nom, peut �tre atteint de la reconnaissance cognitive. � Nous sommes confront�s au d�but de la communaut� universitaire � faire cet ensemble de donn�es, � Zhang Lei a d�clar� au New Ji-won: � Mais beaucoup de l'industrie par les pairs a �galement exprim� notre ensemble de donn�es pour leurs travaux de recherche utiles. �

�tude approfondie des progr�s de l'algorithme de reconnaissance visuelle a fait de grands progr�s au cours des derni�res ann�es. Cependant, la vie intelligente et innovante entre les services effectivement mis en service sur l'�cart �norme acad�mique existe encore, surtout parce que:

(1) l'absence de grande �chelle des donn�es du monde r�el recherche universitaire, entravant ainsi les algorithmes efficaces de formation et d'�valuation;

(2) l'absence d'une �valuation ouverte juste transparente plate-forme et efficace et du r�sultat de reconnaissance est reproductible, d'obtenir facilement.

� l'heure actuelle, plusieurs grands ensembles de donn�es de reconnaissance faciale accessibles au public (figure vert ci-dessous) sont les suivants:

LFW est un ensemble de donn�es de l'Universit� du Massachusetts, cette �chelle entre tous les niveaux (13k);
YFD ensembles de donn�es face Yale, vision par ordinateur et le centre de contr�le cr�� par l'Universit� de Yale, a un changement d'�clairage diff�rentes, les expressions du visage et la posture, mais un petit nombre;
CelebFace contient plus de 20 millions d'images;
CASIA WebFace Acad�mie chinoise des sciences Institut de l'automatisation de plusieurs ensembles de donn�es, qui comprennent les empreintes palmaires, l'�criture, l'action humaine et six autres types de jeux de donn�es, le besoin de suivre les instructions � appliquer, gratuitement.

Ensuite, Facebook et Google jeux de donn�es bien grande �chelle, mais ils ne peuvent pas accessibles au public.

Celles-ci refl�tent tout un �cart important existe entre le monde universitaire et l'industrie.

Par cons�quent, l'Institut technique de Microsoft et le Dr Guo Yandong talent en 2016 de r�f�rence MS-Celeb-1M propos�. MS-Celeb-1M Bien que les donn�es face c�l�brit�, mais avec une c�l�brit� recueillie � partir du r�seau pour recueillir toutes les images du visage possible que les donn�es de formation. Sur la base de la base de connaissances riche en information aide � �liminer l'ambigu�t� et offre une mine d'informations de caract�re, d'am�liorer la pr�cision de la reconnaissance, si pr�s d'une vari�t� d'applications dans le monde r�el, telles que des l�gendes d'images et l'analyse des nouvelles vid�o, l'analyse de l'opinion publique et ainsi de suite.

En effet compos� entre le milieu universitaire et de l'industrie en raison des lacunes de donn�es caus�es par l'algorithme de mod�le.

Design Index du concours: fin � la reconnaissance de la fin, contribuent aux applications du monde r�el de

En ce qui concerne l'indice de la concurrence qui, MS-Celeb-1M de Microsoft a �galement fait pour remplir la concurrence existante.

� l'heure actuelle, plus la concurrence de reconnaissance faciale bien connue des donn�es accessibles au public peuvent avoir LFW et Megaface. �chelle LFW entre tous ce niveau, car les donn�es ne sont pas partag�es et la formation d'autres raisons, ces derni�res ann�es ont montr� une tendance qui devrait se surajustement, et les chercheurs de Microsoft trouv�, LFW meilleur algorithme est souvent difficile de reproduire compl�tement . De plus, la concurrence LFW est le rapport de similitude entre deux images de la pratique d'une certaine distance.

Megaface Washington University ensembles de donn�es publi�es, des dizaines de contenus Internet sont les photos de �toiles ainsi que des donn�es d'interf�rence sur un million de photos des gens ordinaires. Cependant, l'�tablissement d'objectifs Megaface est diff�rent, par rapport � la � v�rification du visage dans des situations bruyantes � � reconna�tre � plus probable (v�rification du visage) . Plus pr�cis�ment, la concurrence cible Megaface est dans les millions de personnes identifient une dizaines de personnes sp�cifiques. Des dizaines de personnes est difficile d'�valuer le r�le de la performance de reconnaissance faciale est tr�s compl�te des applications et pratiques sont encore un peu plus loin. De plus, les donn�es test Megaface n'a pas �t� artificiellement marqu�e, contient du bruit. les donn�es de test de bruit lors de la mesure mod�le haute performance d'interf�rence est tr�s grave.

� cette fin, Microsoft a modifi� l'indice d'�valuation de MS-Celeb-1M. Participez au concours est une image, la sortie est un nom tr�s proche de la r�alit�, les sc�narios d'application de reconnaissance faciale - pour d�terminer si un visage humain est une image d'une personne sp�cifique.

� Notre mission est de mettre fin � la mission, en particulier, la t�che est de l'image dans le code r�f�rentiel d'identification des c�l�brit�s. Dans ce cas, il est introduit naturellement de nombreux probl�mes de recherche de valeur, telles que la fa�on d'obtenir efficacement les donn�es du r�seau ( nous nous permettons d'augmenter les donn�es de formation), comment faire bon usage des donn�es de formation �tiquet�e de bruit (�norme, ce qui co�te plus annotation manuelle), la fa�on de traiter des quantit�s massives de donn�es (cible un million de personnes, des milliers de niveaux de diagramme), lorsque certaines personnes les donn�es sont extr�mement rares, les donn�es in�gales comment faire, et ainsi de suite, ce sont CV � l'int�rieur de probl�me int�ressant. � , a d�clar� Guo Yandong.

Les �quipes ont pour but est d'identifier les personnes mixtes millions de particuliers en 1000, mais sp�cifique 1.000 participants ne savent pas. Par cons�quent, afin d'obtenir le meilleur taux possible et la pr�cision de rappel, les mod�les mis en oeuvre doivent couvrir autant de gens, m�me tous un million �chelle. Ce mod�le a pr�sent� une tr�s forte demande. De plus, le manuel de l'�quipe de recherche de Microsoft ensemble de test tr�s soigneusement marqu� dans l'ensemble de test assure une tr�s grande pr�cision, de sorte que le mod�le de haute performance et un mod�le pour mesurer la performance du taux de pr�cision de pr�s de 100% (rappel @ haute pr�cision ) est tr�s efficace.

Non seulement cela, MS-Celeb-IM d'un million de c�l�brit� est �galement un concours pour identifier � l'apprentissage de petits �chantillons � (apprentissage des lowshot) des zones o� une attention particuli�re lorsque certaines personnes donn�es de formation tr�s peu de temps, comment les r�sultats du mod�le ne montent.

Ici, les �quipes doivent identifier 1000 personnes de 21.000 personnes. Mais que 1000 personnes chaque �tre humain a une image d'un train. Dans de nombreux cas, comme la reconnaissance faciale de la s�curit� publique, le suspect qu'une image vague ou � l'abri, � savoir que, dans la vaste mer, appartient � l'apprentissage de petits �chantillons.

Ceci est un autre dans la direction verticale pr�conisaient aujourd'hui dans une certaine mesure l'intelligence artificielle: apprentissage des concepts visuels � partir d'un �chantillon limit�.

L'�quipe gagnante technique Partager: Low-shot lien entre l'apprentissage

Apr�s les r�sultats du concours ont �t� annonc�s, la nouvelle interview Ji-won avec Low-shot concours d'apprentissage vainqueur Universit� nationale de Singapour avec l'Institut de Singapour de l'�quipe Panasonic, les membres Zhao Jian en tant que repr�sentant de partager leurs m�thodes d'id�es et de l'exp�rience de la comp�tition.

L'�quipe gagnante: NUS-Panasonic, Membres: Zhao Jian (NUS), Cheng Yu (Panasonic), Wang Zhecan (NUS), Xu Yan (Panasonic), Karlekar Jayashree (Panasonic), Shen Shengmei (Panasonic), Feng Jia quand (NUS).

New Ji-won: Pourquoi participer � Microsoft MS-Celeb-1M d'un million d'identification course c�l�brit�?

NUS-Panasonic: identifie Microsoft un million de course est une reconnaissance de la c�l�brit� faciale reconnue � Coupe du monde. � annuel Le concours est parrain� par Microsoft Research, avec le domaine de la plate-forme de rencontre premi�re vision par ordinateur ICCV 2017, niveau �lev�, la difficult� de profil haut. Face � meilleures �quipes du monde veulent tous avoir un aller dans ce jeu, une marque de. Cela inclut � la fois la course et la derni�re reconnaissance faciale similaire � grande �chelle course (Hard Set et Set al�atoire), mais aussi de proposer un nouveau, plus difficile Apprendre la concurrence � faible tir. Les organisateurs esp�rent que les deux �quipes peuvent obtenir une identification pr�cise du visage humain � grande �chelle, mais aussi �tre en mesure d'identifier avec pr�cision une solution efficace au probl�me des �chantillons de formation de visage humain rares.

groupe NUS LV cr�� par le professeur Yan dans l'eau, quand dirig� par le professeur Jia Feng, est actuellement l'une des meilleures �quipes dans les grandes institutions universitaires dans l'apprentissage de la profondeur et le champ de vision par ordinateur. La reconnaissance faciale est son �quipe a �t� un groupe de LV pilier int�gral, r�p�t� succ�s - pour la premi�re fois pour atteindre une pr�cision de reconnaissance de 99,7% dans l'ensemble des donn�es de reconnaissance de visage LFW, la concurrence dans le NIST 2017 IJB-reconnaissance face � deux matchs Matsushita Institute � Singapour pour travailler ensemble pour gagner le championnat. Nous avons choisi de participer � cette ann�e (2017) Microsoft un million de c�l�brit�s veulent �tre en mesure d'identifier concours pour se montrer � la plus haute reconnaissance faciale de la plate-forme, et de stimuler les progr�s et le d�veloppement rapide de la technologie de reconnaissance faciale � grande �chelle.

New Ji-won: D'un point de vue technique, ce que les participants s'est la plus grande source d'inspiration?

NUS-Panasonic: La comp�tition pour obtenir la plus grande source d'inspiration est Les syst�mes de reconnaissance faciale pr�cis et efficaces g�n�ralement n�cessaires pour concevoir un des probl�mes complexes modulaires, de la collecte de donn�es, le nettoyage, le pr�traitement, � la conception du mod�le, la formation, les tests, puis � l'int�gration des diff�rents mod�les, l'apprentissage de la mesure, l'�valuation des performances, chaque apr�s le module et essayer quelques id�es nouvelles et des strat�gies diff�rentes, l'effet de chaque module de d�bogage au mieux, l'engagement au niveau du syst�me .

New Chi Yuan: Pouvez-vous nous parler de vos id�es, les m�thodes et les raisons de la gagner?

NUS-Panasonic: Apprendre � faible tir l'accent sur les �quipes peut r�soudre efficacement le probl�me de la raret� de l'identification pr�cise des �chantillons de formation de visage. concours d'apprentissage � faible Travelling ont �t� fourni deux s�ries de donn�es --base Set et Set Novel. Dans laquelle Set de base contient 20k c�l�brit�, 50-100 feuilles par Celebrity fournissent des donn�es �chantillons Novel Set contient c�l�brit� 1k, seule une c�l�brit� chaque donn�e d'�chantillon. Dans le test, le test pr�vu par les organisateurs se concentrera sur la c�l�brit� m�lang�e avec nouvel ensemble de donn�es de Base, et l'accent mis sur la performance de l'algorithme face � des rares �chantillons de formation Set Novel.

Pour r�soudre ce probl�me, nous 100k c�l�brit� reconnaissance faciale fond�e sur la concurrence � grande �chelle pour fournir des donn�es de formation, les donn�es contenues dans le nouvel ensemble c�l�brit� 1k suppression de construire une base de donn�es � Plus �, la formation de plusieurs structures diff�rentes mod�le de r�seau, le r�seau a appris qu'un degr� ad�quat de caract�ristiques distinctives, la robustesse et la performance g�n�ralisation, diff�rents mod�les de r�seau ont des effets appris fonctionnalit�s compl�mentaires. Nous adoptons une fonction de recherche pour tester chaque mod�le, quand un certain nombre de tests pour d�terminer des strat�gies efficaces au moyen de validation crois�e.

Par rapport � d'autres �quipes, ainsi que les m�thodes traditionnelles d'apprentissage des solutions � faible Plan, les Notre principale am�lioration est l'utilisation du b�timent conform�ment aux dispositions des donn�es de jeu suppl�mentaires, le mod�le multi-mesure de l'apprentissage, l'int�gration de vote heuristique et la phase test de mise en valeur des donn�es .

get jeu de bons r�sultats d�pendent aussi de l'Institut Matsushita de Singapour de mat�riel informatique ad�quat, tels que les clusters de GPU � grande �chelle et la derni�re DGX. Matsushita Institut de Singapour est �galement une donn�e �quipe marqu�e dans cette comp�tition a jou� un grand r�le.

New Chi Yuan: Quelle est la plus grande difficult� est rencontr�e dans le jeu? Comment le r�soudre?

NUS-Panasonic: Comment un million de difficult� c�l�brit� reconnaissable mod�le efficace pour une utilisation efficace des donn�es existantes effet d'entra�nement optimal. Afin de r�soudre le probl�me des �chantillons de formation du visage humain rares, notre 100k c�l�brit� reconnaissance faciale bas�e sur la concurrence � grande �chelle pour fournir des donn�es de formation, en supprimant les donn�es qui y sont contenues Set Novel dans la c�l�brit� 1k, la construction d'une base de donn�es � Plus �, la formation mod�le de r�seau plusieurs structures diff�rentes. �gal au nombre de neurones dans une cat�gorie de classification du processus de formation, et enfin une couche de r�seau enti�rement connect� (FC), le niveau de la formation d'un grand nombre de param�tres sont souvent difficiles � mener directement � la formation du r�seau, la perte de la fonction des chocs de volatilit� ne tombe pas. nous avons fait ici quelques ajustements, le processus de formation est divis� en deux phases, le premier r�seau de formation � discrimine 1/10 type d'�chantillon, apr�s que le r�seau a tendance � converger, la derni�re couche FC remplac�, et la deuxi�me �tape la formation et le r�glage, de mani�re � r�soudre le type grand �chantillon, les probl�mes de formation efficace en r�seau.

New Ji-won: l'algorithme propos� vous avez une application pratique?

NUS-Panasonic: Notre algorithme propos� peut effectivement r�soudre le probl�me de la raret� de l'identification pr�cise des �chantillons de formation de visage, qui ont une grande valeur et les perspectives d'affaires pour le domaine des syst�mes de s�curit�, syst�mes m�nagers intelligents, l'interaction sans pilote et humain-ordinateur. Je suis tr�s optimiste au sujet des algorithmes d'atterrissage futurs, tels que la recherche peut �tre combin� avec l'algorithme de reconnaissance faciale, la technologie de compression de r�seau et les technologies connexes de conception au niveau syst�me FPGA, fournir plus de commodit� � la vie et la production de personnes.

Bien que la pr�cision de la reconnaissance faciale est d�j� �lev�, mais la plupart des technologies grand public et les algorithmes requis attitude ou condition pr�d�termin�e comme pr�misse, tel que le n-face ou presque vrai visage, l'image est claire et sans obstacle, les expressions du visage, comme arri�re-plan unique. vrai sens intelligent de la reconnaissance future du visage sera une bonne solution au probl�me ci-dessus, et continuer � r�aliser de nouvelles perc�es � grande �chelle, des conditions non limitatifs et la raret� des �chantillons de formation du probl�me de reconnaissance des visages.

New Ji-won: F�licitations pour obtenir de bonnes notes, et enfin partager le gain sentir.

NUS-Panasonic: la coop�ration par le groupe Wholehearted NUS LV et Panasonic, et apr�s trois mois d'efforts communs et de la lutte, nous avons finalement r�ussi � remporter trois concours Microsoft reconnaissance c�l�brit� visage (Hard Set, Set al�atoire, Apprentissage bas-Shot) champion. Tr�s heureux de devenir une �quipe championne peut atteindre de tels r�sultats, le d�vouement et ins�parable de la coop�ration de NUS avec Panasonic deux unit�s ensemble chaque membre de l'�quipe ne peut se passer, la lutte commune. Merci Professeur Jia mon mentor Feng, culture professeur Yan aqueuse, l'orientation et la confiance, gr�ce au CAS Institute of Automation - militaire allum� l'aide de l'enseignant et des conseils, gr�ce � l'Universit� nationale de la D�fense et le financement du Conseil des bourses d'�tudes en Chine, je vais continuer � travailler dur, l'espoir aux gens domaine de la reconnaissance des visages � de nouveaux sommets, propuls� le d�veloppement des technologies connexes et du progr�s.

r�f�rences

. Y. Guo, L. Zhang, Y. Hu, X. Il et J. Gao MS-Celeb-1M :. Un ensemble de donn�es et de r�f�rence pour une grande reconnaissance faciale � grande �chelle dans Proc de Conf europ�enne sur l'ordinateur Vision (ECCV) .. . Springer, 2016.

Y. Guo et L. Zhang, One-shot de reconnaissance des visages par la promotion des classes sous-repr�sent�s, arXiv pr�publication arXiv: 1707,055742017.

Cliquez ici pour lire l'original pour voir de nouveaux emplois Ji-won

Route de la soie

Apprenez � conna�tre la Chine

Entr�es: Liste face Coupe du Monde Lib�r�, Microsoft part d'un million de concours de reconnaissance c�l�brit� gagnant