Kuang face ++ comme la technologie propos�e RepLoss, optimisation intensive pour r�soudre le probl�me d'occlusion

top vision informatique du monde CVPR 2018 (Conf�rence sur la vision par ordinateur et reconnaissance de formes, � savoir la Conf�rence internationale IEEE sur Vision par ordinateur et reconnaissance) se tiendra � Salt Lake 18 � 22 Juin. En tant que sponsor de diamant de l'Assembl�e g�n�rale, comme la technologie face ++ Kuang Institut sera �galement lourd assister sous la direction du Dr Sun Jian en cas, cette exclusion, le total d'un des documents de projecteur, 7 papiers d'affiches dans la cha�ne de r�seau universitaire Lei Feng AI le projet de base de donn�es de l'�valuation technique � facteur d'impact AI � dans une performance exceptionnelle. Mais avant la tenue, ouverte en fonction de la mise au point pour CVPR s�rie 2018 inclus ont �t� interpr�t�es des documents de l'�v�nement. Cette s�quence 3 th�me est optimis� pour r�soudre le probl�me de l'occlusion bond�s RepLoss.

Documents lien: https: //arxiv.org/abs/1711.07752

annuaire

Lead
id�es de conception RepLoss
Impact de l'occlusion intensive
Proc�d� de calcul RepLoss
attirer les entr�es
R�pulsion (RepGT)
R�pulsion (RepBox)
r�sultats RepLoss
conclusion
r�f�rences

Lead

D�tection des foules d�veloppement de la technologie de vision par ordinateur ne peut pas �tre contourn�e par un porte-cl�s, dans lequel un bloc dense (occlusion de la foule) est l'un des probl�mes les plus difficiles. Kuang comme la technologie face ++ propose un nouveau mod�le de d�tection de la foule et l'emplacement R�pulsion Perte (RepLoss) du niveau technique sous-jacente, optimis� pour r�soudre ce probl�me dans une certaine mesure. Port�e de l'innovation technologique sous-jacente exceptionnellement large, ce qui signifie que la grande majorit� des personnes associ�es � la d�tection des applications de ce produit peut utiliser pour atteindre des degr�s d'am�lioration, de promouvoir la surveillance de la s�curit� fondamentale, pilote automatique, pas de d�tail, le d�veloppement intelligent de la ville et l'atterrissage . De plus, la technologie de positionnement de la foule cible de d�tection RepLoss ne se limite pas aux personnes, mais aussi � la g�n�ralisation migrate la d�tection d'objet g�n�ral, la force motrice sous-jacente de la propagation de l'innovation tr�s large gamme, aide � construire une machine Eye des personnes, des objets, personnages, v�hicules la matrice de d�tection, voir plus loin, comprendre ce monde.

id�es de conception RepLoss

D�tection de pi�tons parmi la foule reste un probl�me difficile, parce qu'en r�alit�, les pi�tons sc�ne souvent rassembl�s en groupes, bloquant l'autre. En g�n�ral, l'objet peut �tre divis� en occlusion au sein de la classe et de l'occlusion d'occlusion de classe dans les deux cas. Bloqu� entre les classes dans le m�me objet produit R�unissons, aussi appel� occlusion dense (occlusion de la foule). D�tection de pi�tons, bloc dense dans toute la plus grande proportion de l'occlusion, ce qui affecte s�rieusement les performances du d�tecteur de pi�tons.

L'impact principal de la performance de blocage intense dans une augmentation significative de la difficult� de localiser les pi�tons. Par exemple, lorsque la cible T est bloqu�e par le pi�ton B pi�ton, puisque les deux l'apparence des caract�ristiques similaires, le d�tecteur peut �tre incapable de le localiser. T devrait �tre accord�e de telle sorte que le ch�ssis pr�sente au cadre au lieu de la bo�te de d�limitation B, ce qui entra�ne le positionnement impr�cis. Pire encore, en raison de la suppression non-maximale (suppression non-maximale / NMS) traiter en outre les r�sultats d'essai principal, la zone de d�limitation est retir� de T peut �tre supprim�e bloc de pr�diction B, ce qui entra�ne T manqu�e. � savoir, de telle sorte que la population de d�tection d'occlusion est sensible aux NMS de seuil: le seuil sup�rieur apportera plus de fausse d�tection (faux positifs), la valeur de seuil inf�rieure provoque plus interrompue (d�tection manqu�e). Cet �chec la plupart des cas diviser cadres, car ils n�cessitent �galement des r�sultats de test pr�cis. Par cons�quent, comment positionner avec pr�cision chaque pi�ton parmi la population est l'un des plus d�tecteurs de probl�mes critiques.

Figure 1: RepLoss illustr�.

Dans le cadre actuel de la technique de d�tection optimal, la r�gression bo�te englobante sont couramment utilis�s pour localiser un objet, qui est form� pour revenir � combler l'�cart entre la proposition et la bo�te Groundtruth (mesur�e par le nombre de mesure de distance, par exemple Smooth_L1 ou IoU). N�anmoins, la m�thode actuelle ne n�cessite qu'une proposition plus proche de son objectif, ne consid�re pas les objets environnants. 1, la bo�te de d�limitation par une perte de retour standard, lorsque le bloc de pr�diction est d�plac� autour de l'objet, et aucune p�nalit� suppl�mentaire de celui-ci. Cela ne peut pas emp�cher de faire les imaginer: Si vous voulez d�tecter une cible parmi la population, devrait envisager de cibler son objet autour?

p�les inspiraient attirent mutuellement exclusifs, ce document propose une nouvelle technologie de positionnement, connu sous le nom R�pulsion Perte (RepLoss), par laquelle chaque proposition sera non seulement proche de l'objectif T, mais aussi loin d'autres objets et cibles sur Groundtruth l'autre proposition n'est pas T. Comme repr�sent� sur la. Figure 1, en raison du chevauchement avec l'objet non-cible autour, bo�te englobante rouge B sera d�plac� vers une p�nalit� suppl�mentaire. Ainsi, RepLoss signifie la zone de d�limitation peut �tre efficacement emp�ch�e vers des objets adjacents se chevauchent, afin d'am�liorer la robustesse du d�tecteur sur la sc�ne de la foule.

Impact de l'occlusion intensive

Cette section traitera de meilleurs moyens actuels de d�tecteur exp�rimental des pi�tons touch�s par la fa�on dont l'occlusion dense (occlusion de la foule), et une meilleure compr�hension de l'occlusion intensive. Les principaux probl�mes de cause occlusion dense � la fois la d�tection manqu�e et fausse d�tection, l'explication suivante sera faite par deux illustr�s s�par�ment, dans lequel la mesure de base est optimis� pour la d�tection des pi�tons plus rapide R-CNN, et la d�tection des pi�tons gr�ce � la nouvelle s�rie de donn�es CityPersons.

Figure 3: L'analyse de la base de d�tection d'erreur de RepGT.

. La figure 3 (a) est le nombre de rat� en foule raisonnable de d�tection de diff�rents sous-ensemble des scores de ligne rouge indique le nombre de pi�tons Groundtruth de r�f�rence manqu�e. Dans les applications du monde r�el, en consid�rant que la zone de d�limitation pr�dire avec un degr� �lev� de confiance, haut de gamme de volume manqu� de la courbe implique un long chemin de l'application pratique. La figure 3 (b) indique la d�tection d'erreur totale par les r�sultats de d�tection d'erreurs dans un rapport d'occlusion dense, ce rapport a montr� la ligne de base rouge � environ 20%. 3 rouge, ligne bleue comme le montre en revanche, les pertes de RepGT sont effectivement r�duit le nombre de d�faillances de d�tection et une occlusion fausse provoqu�e par l'intense.

Des exemples de d�tection d'erreur Visualisation: 4 Fig. Le cadre rouge repr�sente la fausse d�tection provoqu�e par la couverture dense.

4, la zone de d�limitation de la bo�te verte est pr�dictions correctes, alors que la bo�te rouge est bloqu�e par la d�tection erron�e provoqu�e par dense et donne un d�tecteur de valeur de confiance. Si la trame de pr�diction est d�plac� l�g�rement GroundTruth ou sensiblement objet non-cible adjacent (par exemple � droite), ou plusieurs chevauchant partiellement objet d'obstruction (par exemple � droite) cadrage, la d�tection d'erreur est souvent. En outre, l'erreur de d�tection est g�n�ralement caus�e par un bloc dense a un degr� �lev� de confiance et conduit � des classements d�tection de faux. Cela sugg�re que, pour am�liorer la robustesse du d�tecteur dans le sc�nario intensif, la n�cessit� d'une perte de puissance plus discriminatoire dans la mise en uvre du retour du cadre de s�lection. Voici un autre exemple de la visualisation:

Comparaison de base RepLoss: Fig. Les bo�tes bleues repr�sentent une fausse d�tection, les bo�tes rouges indiquent manqu�. la ligne en pointill�s gris, la premi�re ligne des deux parties est le r�sultat pr�dit de la ligne de base, la seconde ligne est ajout�e apr�s que les pr�dicteurs RepLoss.

En analysant la d�tection d'erreur a montr� que l'effet de blocage intensif sur le d�tecteur de pi�tons Etonnamment, est non seulement la principale source non d�tect�e, il augmente la difficult� de localiser en m�me temps cr�e une d�tection plus faux. Il est de r�soudre les probl�mes ci-dessus, d'am�liorer la robustesse du d�tecteur de pi�tons en sc�ne intensive, RepLoss �t� mis en avant.

Proc�d� de calcul RepLoss

Cette section d�taillera comment calculer RepLoss. Inspir�s des propri�t�s magn�tiques, RepLoss comprenant trois composants, exprim�s en tant que:

Ce qui L_Attr attirer l'entr�e, vous devez pr�voir la bo�te pr�s de sa cible, L_RepGT et L_RepBox est r�pulsion, respectivement bloc de pr�diction loin de la n�cessit� de diff�rents objets autour d'autres Groundtruth et d'autres ciblage pr�disent bo�te. et agit comme un facteur d'�quilibrer l'aide � la perte de poids.

Par souci de concision, seuls deux types consid�r�s ci-dessous d�tection, on suppose que tous les objets appartenant � la m�me cat�gorie Groundtruth. Respectivement P = (L_p, T_P, w_P, h_P), et G = (l_G, T_G, w_G, H_G) pour la proposition et Groundtruth cadre de d�limitation cadre de contour, respectivement, par leurs coordonn�es du point sup�rieur gauche et la hauteur, la largeur, la Fig. P_ + = {P} est l'ensemble de toutes les propositions positives (et celles d'au moins une bo�te de Groundtruth haute IoU est consid�r� comme un �chantillon positif, alors que l'�chantillon n�gatif); G = {G} est un ensemble de toute l'image de la bo�te groudtruth .

attirer les entr�es

Cet article fait suite � la structure Smooth_L1 attirer les entr�es. Compte tenu de la proposition P P_ +, la bo�te de Groundtruth IOU a une valeur maximale en tant que son ciblage: G ^ = arg P_Attr max_GG IoU (G, P). B ^ trame P est pr�dite � partir de la r�gression de la proposition P. Ainsi attirer la perte peut �tre calcul�e comme suit:

R�pulsion (RepGT)

perte de RepGT visant � rendre la proposition de non-cible adjacente Groundtruth objet exclusif. Compte tenu de la proposition P P_ +, son exclusion de l'objet Groundtruth de Groundtruth est d�fini comme �tant un objet en plus de son ayant la plus grande IoU r�gion de ciblage. Inspir�, la perte de RepGT par peine de perte IoU est calcul�e � chevauchement (tel que d�fini par la IOG) entre B ^ P et G ^ P_Rep. Institut sur la gouvernance (B, G) , de sorte que la perte de RepGT peut �tre �crite comme:

Dans lequel Smooth_ln est un r�glage de param�tre de lissage sensibilit� RepLoss aux valeurs aberrantes dans l'intervalle (0, 1) ln fonctions lisses contin�ment diff�rentiables,

Route de la soie

Apprenez � conna�tre la Chine