Sun Yi-fan de l'Universit� de Tsinghua: Ce papier introduit et les pi�tons, puis identifier les derniers d�veloppements

Lei Feng r�seau par AI Technology Review : Fait r�f�rence � des �tudes en vision par ordinateur, vous pouvez d'abord penser � la reconnaissance des visages, il y a aussi une application plus pratique de la recherche - une autre reconnaissance des pi�tons. la reconnaissance des pi�tons est alors l'utilisation de la technologie de vision par ordinateur pour r�cup�rer une t�che sp�cifique dans l'image pi�tonne ou vid�o, face aux changements d'angle de vue, pi�tons complexe sportif en commun et bien d'autres difficult�s, il est une t�che difficile. Dans cet article, nous nous concentrons sur ce que vous donnez quelques connaissances de base des derniers progr�s de la recherche et la reconnaissance re pi�tons.

2017, les pi�tons � nouveau la reconnaissance des progr�s rapides. Par exemple, l'ensemble des donn�es dans l'ouverture du march�, choisis-1501 � partir d'un taux correct de ECCV 201665,9% de plus en 2017 dans ICCV 80 +%, arXiv une actualisation r�cente du papier indicateur est de 95% � . �tudiants Sun Yi-fan de l'Institut de Cognitive et Syst�mes d'information, l'Universit� de Tsinghua � ICCV 2017 dans un document de projecteur � SVDNet forPedestrian r�cup�ration �. Ce document enti�rement connect� matrice de poids de la couche interpr�t�e comme un ensemble d'espace de fonction � projection ou un ensemble de mod�les, United D�composition valeur singuli�re (SVD) caract�ristiques de profondeur d'optimisation d'un processus d'apprentissage, a apport� d'importantes am�liorations de performance, et r�v�le tr�s int�ressant le m�canisme du ph�nom�ne. Partager l'ordre suivant se fait selon Sun �tudiants Yi-fan en direct sur Lei Feng r�seau GAIR grande salle de conf�rences. Lecture vid�o Adresse: http: //www.mooc.ai/open/course/381

Sun Yi-Fan, l'Universit� de Tsinghua, le Dr lecture �lectronique, les grandes orientations de recherche pour la vision par ordinateur, la reconnaissance des pi�tons et des applications d'apprentissage re-profondeur.

th�me Partager : Ce papier et introduit les pi�tons, puis identifier les derniers d�veloppements

Partager le contenu

Bonjour � tous, je suis de l'Institut des syst�mes intelligents et cognitifs, Tsinghua Sun Yi-fan. La part est principalement les trois aspects suivants:

Reconnaissance pi�tons Liste des t�ches � nouveau;
SVDNet pour le papier de r�cup�ration des pi�tons pour expliquer;
Pi�tons et identifier les progr�s r�cents et d'introduire la prochaine pr�diction de point chaud (avec le dernier papier);

CV mentionn� pr�c�demment, nous avons d'abord la pens�e est la reconnaissance, en fait, la reconnaissance re-pi�tons une nouvelle direction de recherche au cours des derni�res ann�es par le degr� de pr�occupation est tr�s �lev�. Pourquoi les pi�tons et l'identifier?

Du point de vue acad�mique, depuis 2008, le nombre d'articles dans les trois premiers lors de la r�union comprenait la re-identification des pi�tons pertinentes augmente d'ann�e en ann�e.

Du point de l'industrie de vue, que ce soit un v�t�ran des soci�t�s de vision par ordinateur telles que Hikvision, ou se retrouver face licorne ++, la science et la technologie Shang Tang, il y a certains comme BAT, Huawei et d'autres g�ants technologiques pour r�identifier les pi�tons sont tr�s pr�occup�s, ils ont une certaine accumulation dans la technologie, les algorithmes, les donn�es, le personnel.

D'un haut politique, puis d'identifier les pi�tons aussi eu une certaine traction. Minist�re de la S�curit� publique a lanc� le concept Safe City, et a publi� des sujets de recherche plus pr�liminaires normes de l'industrie sont en cours d'�laboration bat son plein.

2017 a �t� une autre reconnaissance des pi�tons a fait la plus grande perc�e de l'ann�e. En ICCV 2017 a accept� le papier 16 sont ensuite identifi�s sur le pi�ton. Il deux papier fort, qui se concentre aujourd'hui sur un.

Je bri�vement expliquer les pi�tons et identifier la t�che elle-m�me, veulent se lancer dans d'autres domaines de la recherche chez les personnes de vision par ordinateur peut participer � l'�tude ont ensuite identifi� les pi�tons.

La premi�re consiste � identifier les pi�tons et les t�ches de vision par ordinateur, il se caract�rise par une personne donn�e d'int�r�t, puis identifier les pi�tons Re-ID n�cessaire � d'autres moments, d'autres lieux, une autre cam�ra � personne d�sign�e � nouveau. Pour l'ensemble de la formation, l'ensemble de test est concern�, il se caract�rise par beaucoup de chevauchement il n'y a pas d'identit�. Ceci est tr�s diff�rent classement de l'image, la classification des images toutes les classes sont peut �tre vu et appris dans la phase de formation.

Reconnaissance des visages et d�tection des pi�tons � nouveau la plus grande diff�rence est la reconnaissance des pi�tons fonctionne � nouveau dans un �tat non coop�ratif, c'est-�-dire avec l'acquisition des pi�tons ne pas besoin de vous faire une action. La reconnaissance a �t� travaill� en coop�ration avec l'Etat, mais maintenant avec le d�veloppement de la technologie, la v�rification du visage peut �tre fait la coop�ration semi-�tatique, mais dans la plupart des cas ne sont pas tout � fait non-coop�ration. Comme l'image pi�tonne est relativement difficile � marquer, les donn�es obtenues de formation est relativement faible, et d'autres raisons, la pr�cision de reconnaissance faciale pour �tre un peu �lev�.

Les demandes de r�-reconnaissance pi�tons

Par exemple, vous pouvez re-faire une nouvelle perspective pour identifier des suspects par le suivi des pi�tons. vous pouvez �galement se r�unir et de reconnaissance faciale pour identifier l'effet de l'identit� d'un moniteur dans la sc�ne suivante. Dans les affaires, par exemple, peut-�tre dans le commerce de d�tail physique, le juge du m�me int�r�t des clients des marchandises.

Pi�ton proc�dures standard, puis identifi�

Apr�s la premi�re s�rie � une premi�re vid�o, il commence � d�tecter un pi�ton, la d�tection des pi�tons de toutes les formes d'une biblioth�que de candidats, appel�s galerie. Puis toutes galerie d'images qui extrait une caract�ristique, apr�s un besoin donn�, un pi�ton, appel� requ�te, extraction de caract�ristiques en utilisant la m�me m�thode, et compar�e � la distance entre la biblioth�que candidate fonction et renvoie les r�sultats de recherche. Une d�tection des pi�tons est relativement ind�pendante du lien, g�n�ralement l'accent sur les caract�ristiques du contraste de l'arri�re.

travaux de papier sur le SVDnet

Tout d'abord, je fait beaucoup de travail pour essayer de comprendre ce que CNN a appris � la fin? J'utilise des outils de donn�es traditionnels processus de d�composition de valeurs singuli�res pour optimiser la profondeur de l'apprentissage, qui est aussi tout � fait unique.

Cet article est sur la motivation.

Pedestrian ensuite utilis� pour identifier la profondeur des m�thodes d'apprentissage sont g�n�ralement trois �tapes. Tout d'abord form� le r�seau de classification sur un ensemble de formation, puis, apr�s le r�seau converge, sa couche pleine de connexion de sortie exprim�e en sa fonction. Enfin, pour toutes les caract�ristiques de l'image, il calcule la distance euclidienne, pour d�terminer leur similitude.

Nous vous proposons SVDNet Dans cet article, l'objectif est d'apprendre les caract�ristiques d'une couche de pr�sentation matrice orthogonale de poids.

Structure figure SVDNet

Il est construit sur la base d'une �tude approfondie du r�seau commun sur la classification d'images, et ce r�seau g�n�rique, il y a peu de diff�rence, caract�ris� en ce que la diff�rence sera exprim�e avec une matrice de poids de couche ayant Eigenlaye orthogonale pour remplacer la connexion traditionnelle compl�te.

Avec les processus li�s � SVD

Une fois que vous avez li� au processus de SVD, nous avons con�u une �tape suppl�mentaire de formation, appel� la m�thode it�rative de relaxation. Lorsque la formation intense, l'am�lioration des performances, des performances constantes dans la phase de formation d�tendue, et m�me l�g�rement inf�rieur. Mais la tendance g�n�rale est en hausse.

phase de formation intense et caract�ristiques de phase de formation de relaxation

la performance SVDNet

Nous avons �tendu ce travail dans la t�che de classification d'image.

A propos de SVDNet, je suis �galement pr�t � discuter des d�tails de la comparaison, nous pouvons aller voir mon github code source, le remplacement lorsque W n'est pas une substitution simple, mais il y a un processus r�ordonnancement, qui est en fait la d�composition de valeur singuli�re avec la valeur certaines caract�ristiques de la solution sont li�es, je l'ai expliqu� sur GitHub.

Il y a beaucoup de gens se demandent, si un des termes de r�gularisation souples ne peuvent pas obtenir des r�sultats similaires, nous avons fait cette exp�rience, la performance est relativement faible. Non seulement sont eux-m�mes orthogonaux, comment obtenir un effet orthogonale pour SVDNet est tout aussi important.

De plus, je pense que la comparaison est instructive, SVD est le droit de la matrice orthogonale, il dispose lui-m�me li� � exprimer tout contact m�rite d'�tre examin�e. Ici, il y a deux documents pour le faire, je vous recommande un coup d'oeil. (Sujet de th�se sur la figure ci-dessus)

Les derniers d�veloppements sur arXiv

Une partie des recherches les plus r�centes sur la fa�on d'am�liorer le courant d�j� tr�s �lev� (peut m�me dire �tre au-del� du niveau humain) d'un niveau sur arXiv, par exemple, sur le march� 1501 Dao et un taux de pr�cision de l'�lection de 90% � 95% Gamme. Voici trois papier, ils ont quelque chose en commun, ils sont utilis�s pour extraire les caract�ristiques au niveau des pi�ces de mod�le de pi�ce, mais leur strat�gie sur la question fondamentale de la fa�on de g�n�rer une partie utilis�e est compl�tement diff�rent. Les �tudiants int�ress�s peuvent �tre recrut�s pour voir.

objectifs et d�fis futurs

Lorsque nous Re-ID sous la supervision d'une sc�ne forte a atteint un niveau �lev�, en fait, Re-ID des applications pratiques sont encore beaucoup de probl�mes � r�soudre.

Nous trouverons des donn�es sur le mod�le exp�rimental d�finit une bonne performance, mais il est plus difficile de changer � un autre ensemble de donn�es, la performance diminuera. Face � la complexit� r�elle de l'environnement ext�rieur, nous avons tendance � utiliser l'effet sera encore pire.

L'autre est quand un mod�le de donn�es �tablies apr�s la fin de la formation, afin de tester un ensemble de donn�es, la performance sera une baisse tr�s importante, cette baisse est pas autoris�e. Dans la pratique, nous ne pouvons pas pour chaque cam�ra recueilli des donn�es un certain degr� d'�talonnage, j'esp�re que, apr�s plus d'un r�sultat de formation douzaine peuvent �tre g�n�ralis�s � plusieurs cam�ras, il n'y a pas de donn�es d'�talonnage de l'appareil, afin que nous puissions d�ployer un syst�me tr�s pratique.

Enfin, deux questions ouvertes et tout le monde pensait:

SVDNet �tre en mesure de s�parer la perte m�trique (contrastive \ triplet) utilisation conjointe il?
Pi�tons et l'apprentissage de la reconnaissance faciale pour identifier beaucoup d'exp�rience et de la pratique. Pi�tons et identifier si l'�tude de certains de la nouvelle approche peut �tre appliqu�e � la reconnaissance faciale?

Ce sont mes tout � partager.

Lecture vid�o Adresse: http: //www.mooc.ai/open/course/381

Lei Feng r�seau GAIR Auditorium produit, l'attention bienvenue � AI Technology Review regarder la derni�re vivre une le�on gratuite.

Route de la soie

Apprenez � conna�tre la Chine

Sun Yi-fan de l'Universit� de Tsinghua: Ce papier introduit et les pi�tons, puis identifier les derniers d�veloppements