Cercles | nuage Mito Acad�mie chinoise des sciences classification propos�e conjointement repose sur les m�canismes d'interaction attention perception techniques comportementales du r�seau de neurone

Technologie AI Revue de presse : Cet article est le recrutement du secteur de la technologie de vision nuage ECCV Mito 2018 documents de lecture.

On notera que le mod�le conventionnel est calcul� par le m�canisme de pond�ration toutes les caract�ristiques locales et extraction de caract�ristique critique, sans tenir compte de la forte corr�lation entre la caract�ristique locale respective, il existe une forte fonctionnalit� inter-redondance. Pour r�soudre ce probl�me, les chercheurs du secteur de la technologie de vision nuage Mito et l'Acad�mie chinoise des sciences Institut de PCA de r�f�rence Automation (analyse en composantes principales) id�e propos�e mod�le de m�canisme d'auto-attention locale a introduit des fonctionnalit�s interactives de la perception, et le mod�le est int�gr� dans le r�seau CNN la structure propos�e d'une extr�mit� de r�seau � la fin. Le comportement de l'algorithme de classification entre les ensembles de donn�es multiples de rendement scolaire et des ensembles de donn�es vid�o interne de l'industrie Mito sont tr�s bons. ECCV2018 a �t� inclus ci-dessous de l'arri�re-plan, l'id�e de base, effets et perspectives bas� sur plusieurs aspects li�s papier introduit l'id�e de l'algorithme � Attention spatio-temporelles Interaction-aware Pyramid R�seaux de classification d'action. �

I. Contexte

Profondeur de convolution r�seau de neurones, dans lequel les canaux spatiaux locaux dans des positions adjacentes de l'�l�ment FIG, souvent en raison de leur chevauchement des champs r�cepteurs ayant une corr�lation �lev�e. De la somme pond�r�e (ou autre fonction) Notez que le m�canisme interne de chaque mod�le d'�l�ment utilisent g�n�ralement les scores de caract�ristiques locales pour obtenir son poids, cette somme pond�r�e en poids de toutes les caract�ristiques locales pour l'acc�s aux fonctions principales. En d�pit de la forte corr�lation entre les caract�ristiques locales, mais le calcul du poids ne pas tenir compte de l'interaction entre eux.

PCA informations en composantes principales peut �tre extrait dimension primaire globale caract�ristique, qui peut �tre consid�r�e comme la principale composante d'information de l'extraction de caract�ristiques locales, et enfin la r�duction globale des fonctionnalit�s de dimensionnalit� qui est un ensemble de caract�ristiques locales de la cl�. Notez que le but d'extraire une partie cl� du m�canisme de l'ensemble des fonctionnalit�s locales, � savoir les caract�ristiques locales de l'APC. Diff�rents m�canismes d'attention est pond�r�e correspondant � chaque fonction locale calculer un score final de caract�ristiques globales. PCA est obtenue en utilisant la matrice de covariance r�duction de la dimension (ou du poids pond�r�) des vecteurs de base, et de r�duire la redondance des informations entre les caract�ristiques de bruit. Sur la base de l'arri�re-plan ci-dessus, l'�quipe a utilis� l'APC pour diriger l'attention du mod�le propos�, et en convertissant la conception d'algorithmes de PCA et de mise en uvre en pertes. En outre, du fait de la profondeur diff�rente des r�seaux de couche peut capturer les caract�ristiques de la figure �chelles diff�rentes, dans lequel l'algorithme figure utilise ces pyramide spatial est construit, � chacune de la caract�ristique locale des informations de canal plus pr�cises multi-�chelle attention scores, les scores pour ces poids la pond�ration de la caract�ristique locale dans toutes les positions spatiales.

En second lieu, l'id�e de base

Ce document d�finit une nouvelle perception de la pyramide de la couche d'interaction espace-temps attention, afin de r�aliser l'impression d'interaction entr�e de fonction et les caract�ristiques spatiales et temporelles des caract�ristiques locales � diff�rentes �chelles de chaque couche � une profondeur d'int�gration du r�seau de neurones de convolution. Son architecture ci-dessus, l'algorithme de d�finir une premi�re fonction d'�chantillonnage R dans les diff�rentes couches de la caract�ristique figure une �chelle uniforme. Suivant canaux locaux en utilisant des �chelles diff�rentes des caract�ristiques des m�canismes d'extraction de caract�ristiques cl�s de l'attention, la figure fusion de diff�rentes �chelles en utilisant une fonction de fusion, et l'attention est calcul�e pour chaque points caract�ristiques locales, pour pond�rer les caract�ristiques.

vecteur de projection calcul�e de la matrice de covariance en utilisant l'APC et ainsi r�duire la dimension, � savoir la touche de fonction locale extraite, la fonction de perte con�u de papier est ajout� au mod�le transform� final:

l'attention de la pyramide de l'espace carte de fonction nouveau aux contraintes du mod�le propos�, donc essayer de se concentrer sur diff�rentes �chelles de diff�rentes couches d'informations, ajout�es � notre catalogue arrivent � une perte finale de fonction de perte:

Quel que soit le nombre des caract�ristiques d'entr�e des param�tres du mod�le de carte documents pr�sent�s, par cons�quent, il augmentera � un temps de formation r�seau de niveau vid�o naturellement fin et dans l'espace, la structure du r�seau final est d�fini ci-dessous:

En troisi�me lieu, l'effet

le personnel de R & D ont �t� appliqu�es aux entreprises li�es vid�o de Mito ont �t� class�s comportement espace-temps des personnages pyramide m�canismes attentionnels perception Interagir algorithme de r�seau de neurones bas� sur d'excellents r�sultats de performance. En plus de l'ensemble de donn�es dans le UCF101 ouvert, HMDB51 aucun comportement de d�tourage et la base de donn�es Charades avis, conduire les r�sultats obtenus �galement, les r�sultats pr�sent�s ci-dessous:

En outre, le document de l'�valuation temporelle d'entr�e vid�o, des r�sultats de l'�valuation montrent que le mod�le est capable de traiter simultan�ment dans un certain nombre de trames vid�o d'entr�e, et d'obtenir de meilleurs r�sultats.

La figure montre les r�sultats de la sortie visuelle au cours de l'algorithme de classification d'action, l'algorithme peut voir que l'emplacement pr�cis du comportement critique de la vid�o.

Quatri�mement, perspectives

applications pratiques, sc�narios d'affaires en cours d'ex�cution temps des exigences de l'algorithme plus strictes. Les r�sultats d�crits dans le pr�sent document sur l'ensemble de donn�es sont prises par une pluralit� de trames obtenues dans la vid�o, la complexit� temporelle est plus �lev�, permettra de r�duire la complexit� de calcul ult�rieur pour l'objectif d'optimiser le module de base. Il est int�ressant de noter que le mod�le de l'attention de la pyramide de l'espace propos� dans le pr�sent document ne constitue pas l'entr�e num�ro de carte de restrictions, il peut �tre facilement �tendu � une version compatible d'un certain nombre de temps d'entr�e et des trames espace, dans l'application peut �tre taux classifi�e de pr�cision pr�misse est � peine affect�e en r�duisant le nombre d'images pour am�liorer la vitesse de traitement de la coupe.

Cliquez pour mettre fin � la Lire l'original Voir le facteur d'impact AI.

(^ 0 ^) partage de bienvenue, � demain!

Route de la soie

Apprenez � conna�tre la Chine

Cercles | nuage Mito Acad�mie chinoise des sciences classification propos�e conjointement repose sur les m�canismes d'interaction attention perception techniques comportementales du r�seau de neurone

I. Contexte

En troisi�me lieu, l'effet

Quatri�mement, perspectives