Kuang face ++ comme la technologie proposée RepLoss, optimisation intensive pour résoudre le problème d'occlusion | CVPR 2018

top vision informatique du monde CVPR 2018 (Conférence sur la vision par ordinateur et reconnaissance de formes, à savoir la Conférence internationale IEEE sur Vision par ordinateur et reconnaissance) se tiendra à Salt Lake 18 à 22 Juin. En tant que sponsor de diamant de l'Assemblée générale, comme la technologie face ++ Kuang Institut sera également lourd assister sous la direction du Dr Sun Jian en cas, cette exclusion, le total d'un des documents de projecteur, 7 papiers d'affiches dans la chaîne de réseau universitaire Lei Feng AI le projet de base de données de l'évaluation technique « facteur d'impact AI » dans une performance exceptionnelle. Mais avant la tenue, ouverte en fonction de la mise au point pour CVPR série 2018 inclus ont été interprétées des documents de l'événement. Cette séquence 3 thème est optimisé pour résoudre le problème de l'occlusion bondés RepLoss.

Documents lien: https: //arxiv.org/abs/1711.07752

annuaire

  • Lead

  • idées de conception RepLoss

  • Impact de l'occlusion intensive

  • Procédé de calcul RepLoss

  • attirer les entrées

  • Répulsion (RepGT)

  • Répulsion (RepBox)

  • résultats RepLoss

  • conclusion

  • références

Lead

Détection des foules développement de la technologie de vision par ordinateur ne peut pas être contournée par un porte-clés, dans lequel un bloc dense (occlusion de la foule) est l'un des problèmes les plus difficiles. Kuang comme la technologie face ++ propose un nouveau modèle de détection de la foule et l'emplacement Répulsion Perte (RepLoss) du niveau technique sous-jacente, optimisé pour résoudre ce problème dans une certaine mesure. Portée de l'innovation technologique sous-jacente exceptionnellement large, ce qui signifie que la grande majorité des personnes associées à la détection des applications de ce produit peut utiliser pour atteindre des degrés d'amélioration, de promouvoir la surveillance de la sécurité fondamentale, pilote automatique, pas de détail, le développement intelligent de la ville et l'atterrissage . De plus, la technologie de positionnement de la foule cible de détection RepLoss ne se limite pas aux personnes, mais aussi à la généralisation migrate la détection d'objet général, la force motrice sous-jacente de la propagation de l'innovation très large gamme, aide à construire une machine Eye des personnes, des objets, personnages, véhicules la matrice de détection, voir plus loin, comprendre ce monde.

idées de conception RepLoss

Détection de piétons parmi la foule reste un problème difficile, parce qu'en réalité, les piétons scène souvent rassemblés en groupes, bloquant l'autre. En général, l'objet peut être divisé en occlusion au sein de la classe et de l'occlusion d'occlusion de classe dans les deux cas. Bloqué entre les classes dans le même objet produit Réunissons, aussi appelé occlusion dense (occlusion de la foule). Détection de piétons, bloc dense dans toute la plus grande proportion de l'occlusion, ce qui affecte sérieusement les performances du détecteur de piétons.

L'impact principal de la performance de blocage intense dans une augmentation significative de la difficulté de localiser les piétons. Par exemple, lorsque la cible T est bloquée par le piéton B piéton, puisque les deux l'apparence des caractéristiques similaires, le détecteur peut être incapable de le localiser. T devrait être accordée de telle sorte que le châssis présente au cadre au lieu de la boîte de délimitation B, ce qui entraîne le positionnement imprécis. Pire encore, en raison de la suppression non-maximale (suppression non-maximale / NMS) traiter en outre les résultats d'essai principal, la zone de délimitation est retiré de T peut être supprimée bloc de prédiction B, ce qui entraîne T manquée. À savoir, de telle sorte que la population de détection d'occlusion est sensible aux NMS de seuil: le seuil supérieur apportera plus de fausse détection (faux positifs), la valeur de seuil inférieure provoque plus interrompue (détection manquée). Cet échec la plupart des cas diviser cadres, car ils nécessitent également des résultats de test précis. Par conséquent, comment positionner avec précision chaque piéton parmi la population est l'un des plus détecteurs de problèmes critiques.

Figure 1: RepLoss illustré.

Dans le cadre actuel de la technique de détection optimal, la régression boîte englobante sont couramment utilisés pour localiser un objet, qui est formé pour revenir à combler l'écart entre la proposition et la boîte Groundtruth (mesurée par le nombre de mesure de distance, par exemple Smooth_L1 ou IoU). Néanmoins, la méthode actuelle ne nécessite qu'une proposition plus proche de son objectif, ne considère pas les objets environnants. 1, la boîte de délimitation par une perte de retour standard, lorsque le bloc de prédiction est déplacé autour de l'objet, et aucune pénalité supplémentaire de celui-ci. Cela ne peut pas empêcher de faire les imaginer: Si vous voulez détecter une cible parmi la population, devrait envisager de cibler son objet autour?

pôles inspiraient attirent mutuellement exclusifs, ce document propose une nouvelle technologie de positionnement, connu sous le nom Répulsion Perte (RepLoss), par laquelle chaque proposition sera non seulement proche de l'objectif T, mais aussi loin d'autres objets et cibles sur Groundtruth l'autre proposition n'est pas T. Comme représenté sur la. Figure 1, en raison du chevauchement avec l'objet non-cible autour, boîte englobante rouge B sera déplacé vers une pénalité supplémentaire. Ainsi, RepLoss signifie la zone de délimitation peut être efficacement empêchée vers des objets adjacents se chevauchent, afin d'améliorer la robustesse du détecteur sur la scène de la foule.

Impact de l'occlusion intensive

Cette section traitera de meilleurs moyens actuels de détecteur expérimental des piétons touchés par la façon dont l'occlusion dense (occlusion de la foule), et une meilleure compréhension de l'occlusion intensive. Les principaux problèmes de cause occlusion dense à la fois la détection manquée et fausse détection, l'explication suivante sera faite par deux illustrés séparément, dans lequel la mesure de base est optimisé pour la détection des piétons plus rapide R-CNN, et la détection des piétons grâce à la nouvelle série de données CityPersons.

Figure 3: L'analyse de la base de détection d'erreur de RepGT.

. La figure 3 (a) est le nombre de raté en foule raisonnable de détection de différents sous-ensemble des scores de ligne rouge indique le nombre de piétons Groundtruth de référence manquée. Dans les applications du monde réel, en considérant que la zone de délimitation prédire avec un degré élevé de confiance, haut de gamme de volume manqué de la courbe implique un long chemin de l'application pratique. La figure 3 (b) indique la détection d'erreur totale par les résultats de détection d'erreurs dans un rapport d'occlusion dense, ce rapport a montré la ligne de base rouge à environ 20%. 3 rouge, ligne bleue comme le montre en revanche, les pertes de RepGT sont effectivement réduit le nombre de défaillances de détection et une occlusion fausse provoquée par l'intense.

Des exemples de détection d'erreur Visualisation: 4 Fig. Le cadre rouge représente la fausse détection provoquée par la couverture dense.

4, la zone de délimitation de la boîte verte est prédictions correctes, alors que la boîte rouge est bloquée par la détection erronée provoquée par dense et donne un détecteur de valeur de confiance. Si la trame de prédiction est déplacé légèrement GroundTruth ou sensiblement objet non-cible adjacent (par exemple à droite), ou plusieurs chevauchant partiellement objet d'obstruction (par exemple à droite) cadrage, la détection d'erreur est souvent. En outre, l'erreur de détection est généralement causée par un bloc dense a un degré élevé de confiance et conduit à des classements détection de faux. Cela suggère que, pour améliorer la robustesse du détecteur dans le scénario intensif, la nécessité d'une perte de puissance plus discriminatoire dans la mise en uvre du retour du cadre de sélection. Voici un autre exemple de la visualisation:

Comparaison de base RepLoss: Fig. Les boîtes bleues représentent une fausse détection, les boîtes rouges indiquent manqué. la ligne en pointillés gris, la première ligne des deux parties est le résultat prédit de la ligne de base, la seconde ligne est ajoutée après que les prédicteurs RepLoss.

En analysant la détection d'erreur a montré que l'effet de blocage intensif sur le détecteur de piétons Etonnamment, est non seulement la principale source non détectée, il augmente la difficulté de localiser en même temps crée une détection plus faux. Il est de résoudre les problèmes ci-dessus, d'améliorer la robustesse du détecteur de piétons en scène intensive, RepLoss été mis en avant.

Procédé de calcul RepLoss

Cette section détaillera comment calculer RepLoss. Inspirés des propriétés magnétiques, RepLoss comprenant trois composants, exprimés en tant que:

Ce qui L_Attr attirer l'entrée, vous devez prévoir la boîte près de sa cible, L_RepGT et L_RepBox est répulsion, respectivement bloc de prédiction loin de la nécessité de différents objets autour d'autres Groundtruth et d'autres ciblage prédisent boîte. et agit comme un facteur d'équilibrer l'aide à la perte de poids.

Par souci de concision, seuls deux types considérés ci-dessous détection, on suppose que tous les objets appartenant à la même catégorie Groundtruth. Respectivement P = (L_p, T_P, w_P, h_P), et G = (l_G, T_G, w_G, H_G) pour la proposition et Groundtruth cadre de délimitation cadre de contour, respectivement, par leurs coordonnées du point supérieur gauche et la hauteur, la largeur, la Fig. P_ + = {P} est l'ensemble de toutes les propositions positives (et celles d'au moins une boîte de Groundtruth haute IoU est considéré comme un échantillon positif, alors que l'échantillon négatif); G = {G} est un ensemble de toute l'image de la boîte groudtruth .

attirer les entrées

Cet article fait suite à la structure Smooth_L1 attirer les entrées. Compte tenu de la proposition P P_ +, la boîte de Groundtruth IOU a une valeur maximale en tant que son ciblage: G ^ = arg P_Attr max_GG IoU (G, P). B ^ trame P est prédite à partir de la régression de la proposition P. Ainsi attirer la perte peut être calculée comme suit:

Répulsion (RepGT)

perte de RepGT visant à rendre la proposition de non-cible adjacente Groundtruth objet exclusif. Compte tenu de la proposition P P_ +, son exclusion de l'objet Groundtruth de Groundtruth est défini comme étant un objet en plus de son ayant la plus grande IoU région de ciblage. Inspiré, la perte de RepGT par peine de perte IoU est calculée à chevauchement (tel que défini par la IOG) entre B ^ P et G ^ P_Rep. Institut sur la gouvernance (B, G) , de sorte que la perte de RepGT peut être écrite comme:

Dans lequel Smooth_ln est un réglage de paramètre de lissage sensibilité RepLoss aux valeurs aberrantes dans l'intervalle (0, 1) ln fonctions lisses continûment différentiables,

Sonja Zhu Yawen « Poète » a été inclus dans le Festival du Film de Tokyo, au nom du film chinois en compétition pour Golden Unicorn Award
Précédent
Le nouveau Eby SA ses débuts en Mars 2017 de la plate-forme MQB
Prochain
Commercial et résidentiel, l'interprétation de l'utilisation de la diversité de Smart Home
OnePlus un atome d'hydrogène OS 3.0 Beta 3 Sortie: Basé sur Android 7.0 prend en charge la carte de transport en commun
Wo plus la technologie: avant l'atterrissage du pilote automatique de passagers, ce qui doit être fait
version thaïlandaise des nouveaux modèles de libération Corolla sport une nouvelle routine au changement d'aller
Forfait de Bell "Action Team Fat Man" festival "de visage froid" de la fréquence de contrôle épicée Head Yoko Comedy NG
Et faire quelque chose PDD, dire un fort voleur de pépite XX, puis éclater à travers un marteau quand en direct! bordereau de glissement
Les causes de la rage au volant, peut-être parce que 98% d'entre eux!
Académie chinoise d'ingénierie, le forum a eu lieu à Huizhou, né Xu Yang, Gao Wen, Wang Haifeng, Wu Feng, vous prenez pour voir AI Développement et avenir
ville du vin de Maxime de 600.000 personnes accueillant le Nouvel An chinois, « la revitalisation des zones rurales » voir l'efficacité de
marché du petit SUV indépendant est une autre nouvelle recrue Tiggo 3 fois vrai coup
LOL La plus grande série de course de la peau! Tyran jouer la ligue de héros do?
brosse Shu avec vibrato, prenez une enveloppe rouge ...... ville millénaire et Internet s'écraser sur l'ancienne et à la mode