� Segmentation d'image �tape � Nankai a fait les premiers indicateurs de la division de simulation des yeux personnels, la performance optimale actuelle

Ji-won nouvelle colonne

Source: IJCAI Oral 2018

Auteur: Gong en, dipl�m� de l'Universit� Nankai

Edit: trois pierres

[New Ji-won EXAMEN La segmentation d'image est la base de la reconnaissance de l'oeil humain, l'oeil humain est identifi� � partir du tout � la partie de la mani�re divis�e. Ce document d'abord propos� un nouvel indice dans le jugement simul� de l'oeil humain, le r�sultat est de loin sup�rieur aux m�thodes existantes et prouve que l'oeil humain est plus conforme au r�sultat de la discrimination.

La segmentation d'image est souvent identifi�e sur la base de l'il humain, l'oeil humain est identifi� de la mani�re de la division de l'ensemble de la partie. A partir de deux directions globales et locales, une nouvelle m�thode et efficace pour am�liorer la mesure d'�talonnage (E-mesure) pour �valuer l'avant-plan binaire par un simple combin� avec des informations locales a �t� tr�s fiable et mondial d'information les r�sultats de l'�valuation.

Pour FM GT (GroundTruth, valeur r�elle figure) et l'algorithme de segmentation pr�dit (ForegroundMap, au premier plan), L'�valuation de l'importance de l'image est le calcul de la FM et GT similitude , Entre une valeur comprise entre 0-1 (peut �tre consid�r�e comme une probabilit�), 1 repr�sente exactement la m�me, et 0 ont des r�sultats diff�rents en fonction de l'algorithme, qui est compl�tement diff�rent (ou oppos�e � la GT). chercheurs GT souvent marqu�s par la main,

GT est consid�r� comme repr�sentatif g�n�ralement de l'oeil humain est le r�sultat de la segmentation. L'objectif de l'algorithme d'�valuation doit �tre r�alis�e � la suite de la classification d'image avec l'il humain. Le IOU est actuellement largement utilis� est bas� sur des informations locales d'erreur (niveau de pixels), tout en ignorant l'information globale de l'image, ce qui dans son �valuation inexacte.

l'information E-mesure est l'�valuation globale diff�rence moyenne de l'information � base de pixels locale Nous employons plus de cinq ensembles de donn�es de r�f�rence de cinq yuans une mesure de E-mesure av�r�e beaucoup sup�rieure aux m�thodes de mesure existantes, et a obtenu les meilleurs r�sultats sur l'il humain pour trier les ensembles de donn�es que nous proposons de le prouver avec et l'�valuation subjective d'un haut degr� de coh�rence.

Question conduit �: une limit�e �vidente

L'�valuation raisonnable ou non le d�veloppement d'un mod�le dans le domaine joue un r�le d�cisif, le plus largement utilis� application au premier plan d'�valuation classique est d�tect�e IOU (Intersection-Over-Union, croix et ensemble), comme le montre la figure 1, IOU formule peut �tre repr�sent�e par la formule 1.

Figure 1: IOU repr�sent� figuratif

Facile � voir IOU est d'�valuer la m�thode de diff�rence de pixel local bas� sur des informations globales manquantes . Comme repr�sent� sur la figure illustr�e, (d) 2 est le motif de bruit, cependant, il est clair en (c) et la figure (b) est plus proche GT, et (D) peut en fait que le premier plan et tout blanc ou tout noir Affichage des r�sultats similaires, et pour tout blanc ou tout noir tableau, on ne peut pas �tre consid�r� comme similaire (mais pas la valeur de similarit� est 0, 0 est en fait repr�sente g�n�ralement le contraire). Dans les r�sultats algorithme IOU nous dit, (d) mieux que (c)! Ceci est manifestement d�raisonnable.

Figure 2: Comparaison des diff�rents types d'�valuation du FM premier plan

Sur la base uniquement sur la diff�rence de pixel de l'ordinateur local est peut-�tre efficace, mais ne r�pond pas aux m�canismes de la segmentation de l'image de l'oeil humain. Analysons un exemple simple d'exp�rience, � la figure 3, la gamme bleue de GT, rouge pour FM. Comme on peut le voir, grand (a) et (b) une diff�rence FM en forme, mais la croix GT a exactement le m�me, ce qui entra�ne exactement les m�mes r�sultats obtenus.

Figure 3: analyse des simples IOU, GT est le bleu, le sujet est un FM rouge, comme (a) et (b) dans la zone de l'intersection

Parce que IOU bas�e uniquement sur la diff�rence de pixel partielle �valu�e, ce qui conduit � obtenir seulement les r�sultats locaux optimaux, il est difficile d'obtenir une �valuation compl�te. Nous avons besoin d'une �valuation compl�te et coh�rente de la vision humaine.

Solution: Big World, les oreilles

En raison de l'�valuation actuelle sont prises en compte les erreurs d'un seul pixel, le manque de consid�ration de l'information mondiale, entra�nant une �valuation inexacte. � cette fin, nous consid�rons la combinaison des informations locales et des informations globales sur mesure.

Figure 4: (b) est le r�sultat de segmentation image originale (A), carte1 (c) et la carte2 (d) sont le r�sultat des deux algorithmes de segmentation

Nous regardons un exemple, la figure. 4 est divis� de deux Map1 et r�sultat dans la carte2 l'algorithme de d�tection, on d�termine la similitude des r�sultats avec GT prendra en compte la similitude globale du corps comme le cerf. Par cet arr�t, plus la similitude per�ue des diff�rences entre les deux. De plus amples d�tails sur la d�termination locale (voir fig. 5}). Nous avons constat� que par rapport � la carte1, les r�sultats de la segmentation comprennent carte2 plus de d�tails (pied), qui, comme le montre la figure 6, nous penserons � une meilleure segmentation r�sultats carte2 carte1.

Figure 5: (b) est le r�sultat de segmentation image originale (A), carte1 (c) et la carte2 (d) sont le r�sultat des deux algorithmes de segmentation

Figure 6: (b) est le r�sultat de segmentation image originale (A), carte1 (c) et la carte2 (d) sont le r�sultat des deux algorithmes de segmentation

1, en liaison avec des informations locales et des informations globales

Nous consid�rons que le niveau d'information statistique de l'image en compte la gamme, s�lectionnez l'image globale moyenne de niveau de pixel que des informations statistiques, parce que l'image globale moyenne globale peut repr�senter l'information et des calculs simples. Comme repr�sent� sur la Fig. 7 (c) (d) sont indiqu�es en tant que moyenne ,, GT, FM de. Chaque valeur de pixel dans la FM GT sa moyenne, l'�cart � la diff�rence entre la matrice globale de l'information de liaison

2, l'estimation d'erreur

Calculer une matrice d'�cart (matrice de polarisation), l'estimation d'erreur, nous pouvons obtenir GT, erreur FM entre la valeur estim�e, et parce que la variation de matrice de liaison des informations globales des informations de pixel local, qui repr�sente l'erreur entre le puits de GT, FM.

La valeur de l'�cart entre la matrice continue , on utilise la matrice d'alignement (matrice d'alignement) erreur entre la matrice d'�cart �valu�:

Photo 7: La combinaison de l'information mondiale et l'information locale. Et sont GT, la FM moyenne,

Il se lie information globale � la d�viation locale de la matrice d'information (matrice de polarisation)

parmi

multiplication Hadamard, mol�culaire

Pour �valuer l'erreur, et

Les r�sultats d'�valuation mis � l'�chelle � entre, o� -1 repr�sente exactement le contraire, et 1 repr�sente la m�me chose. � savoir, pour chaque erreur locale contient des informations globales, nous pouvons calculer l'erreur entre une estimation.

3, la transformation non lin�aire

Nous avons besoin d'une �valuation entre les balises , vous devez est mis � l'�chelle � la gamme entre . Pour un r�sultat de classification dichotomique d'une sortie al�atoire, � savoir, FM g�n�r� de fa�on al�atoire, l'erreur GT qui devrait �tre uniforme, � savoir, l'erreur doit �tre �galement r�partie entre , et nous utilisons la transformation lin�aire directe il est mis � l'�chelle dans une plage (par exemple en utilisant

Mais en fait, tous les classificateurs devraient �tre beaucoup mieux que classificateur al�atoire, ce qui signifie que beaucoup de m�thode de sortie FM est similaire � la GT et rarement en face, que la grande majorit� concentr�e sur le score d'�valuation de et seulement une partie tr�s faible appara�t entre les balises , auquel cas la poursuite de la fonction de zoom plage lin�aire n'est plus appropri�, car dans ce cas la majeure partie du jeu de r�sultats � 0,5 ou plus conduisant � un r�sultat de le manque de discrimination. En second lieu, les r�sultats de l'�valuation de l'oeil humain est d'appr�cier la similitude entre FM et GT, plut�t que dissemblance (similitude ou n�gative), ce qui montre aussi la r�utilisation �chelle lin�aire ne convient pas. Il suffit de la valeur est d�finie entre tous est �gal � 0 (par exemple, un r�seau de neurones est connu la fonction d'activation de Relu) perdent des r�sultats d'�valuation, et par cons�quent ind�sirable.

Sur la base de l'analyse ci-dessus, nous vous proposons une fonction de transfert non lin�aire:

Cette fonction est seulement une fonction de la place de ce qui pr�c�de, �galement � l'�chelle entre , mais l'�quation 3 est une fonction non lin�aire qui l'image sur la Fig. 8, qui sera de la valeur mise � l'�chelle entre une plage plus petite, et la valeur de mise � l'�chelle entre pour une plus grande gamme, ce qui �vite les probl�mes caus�s par mise � l'�chelle lin�aire.

Figure 8: une fonction de transformation non lin�aire qui sera une valeur comprise entre r�duite � une plus petite distance, et la valeur de mise � l'�chelle entre la plage � une plus grande

4, estimation compl�te

Nous serons tous mis � l'�chelle � l'erreur entre , en ligne avec les r�sultats qu'ils obtiennent plage d'erreur (4):

E-mesure est d�finie comme �tant les r�sultats complets de tous l'erreur de position:

Les exp�riences d�montrent l'efficacit� des mesures de yuans

Afin de d�montrer les indicateurs de validit� et de fiabilit�, les chercheurs ont utilis� la m�thode pour mesurer yuans exp�rience . En proposant une s�rie d'hypoth�ses raisonnables, et v�rifier l'�tendue de ces indicateurs en ligne avec les hypoth�ses que vous pouvez obtenir l'indice de performance. En bref, la mesure du dollar est un indicateur sp�cifique des normes d'�valuation. mesure exp�rimentale en utilisant un 5 yuan :

mesure Yuan 1: Trier Application

Une raison importante de promouvoir le d�veloppement du mod�le sont les exigences d'application, et donc une sorte d'indicateurs de r�sultats et de trier les r�sultats devraient �tre appliqu�s avec un degr� de coh�rence. C'est une s�rie d'entr�e de premier plan dans l'application, au rang de leur premier plan la norme par l'application, les r�sultats de l'�valuation pour obtenir une bonne �valuation du programme devrait trier les r�sultats de son application de premier plan standard avec un haut degr� de coh�rence. 9 ci-dessous.

Figure 9

mesure Yuan 2: Le dernier niveau par rapport � des r�sultats Universal

Un principe de l'indice d'�valuation devrait pr�f�rer l'utilisation des r�sultats de la plus algorithme de d�tection avanc�e plut�t que les r�sultats g�n�raux de ceux qui ne consid�rent pas le contenu de l'image (comme haut-Stuttgart centre). 10 au-dessous.

mesure Yuan 3: Le dernier niveau par rapport � des r�sultats al�atoires

Un indicateur de principes d'�valuation devrait pr�f�rer plut�t que des r�sultats al�atoires (tels que la carte gaussienne du bruit) ceux qui utilisent les r�sultats de l'algorithme de d�tection les plus avanc�es de ceux qui ne consid�rent pas le contenu de l'image. Comme le montre la figure.

Yuan mesure 4: le tri manuel

En tant que primates humains sup�rieurs, bien � capturer la structure de l'objet, de sorte que le type de d�tection de premier plan d'�valuation des r�sultats, et les gens devraient avoir le genre de degr� �lev� de coh�rence subjective. Nous avons centralis� toutes les donn�es de l'�chelle, personnes choisies au hasard par le groupe en ligne avec le genre de premier plan de l'oeil humain, sorte l'ensemble de donn�es consistant en FMDatabase artificielle. 11 ci-dessous.

�l�ment m�trique 5: R�f�rence GT de remplacement al�atoire

A l'origine identifi� comme indicateurs de bon r�sultat de d�tection de mod�le, lors du remplacement de l'erreur dans le rez-de-v�rit� de r�f�rence au sol de la v�rit�, le score devrait �tre r�duit. 12.

Les r�sultats exp�rimentaux

Test� sur papier largement 5 caract�ristiques diff�rentes, difficiles ensemble de donn�es, afin de v�rifier la stabilit�, les indices de robustesse.

Les r�sultats ont montr� que: nos indicateurs sont plus robustes et la stabilit� dans PASCAL, ECSSD, SOD et HKU-IS ensemble de donn�es. Pendant ce temps sur FMDatabase (MM4), nos indicateurs ont les meilleurs r�sultats.

Documents Adresse:

New Ji-won AI MONDE 2018 Assembl�e de billets Early Bird []

En solde!

New Ji-won aura lieu le 20 Septembre AI Conf�rence mondiale des 2018 � Beijing National Convention Center, a invit� l'apprentissage machine parrain, en mettant l'accent sur le professeur de l'intelligence artificielle � la CMU Tom Mitchell, Maike Mark Si-Tiger, Zhou Zhihua, un grand Cheng Tao, Chen Yiran AI et d'autres dirigeants et le destin de l'humanit�.

Le site officiel de l'Assembl�e g�n�rale:

Maintenant jusqu'au 19 Ao�t, Ji-won nouveau num�ro d'�dition limit�e de billets Early Bird communication �troite avec le leader mondial de l'IA, l'intelligence artificielle, t�moin de l'industrie mondiale � pas de g�ant.

Billets de ligne active lien:
billet de ligne active de code � deux dimensions:

Route de la soie

Apprenez � conna�tre la Chine

� Segmentation d'image �tape � Nankai a fait les premiers indicateurs de la division de simulation des yeux personnels, la performance optimale actuelle