image de migration Berkeley � chien chat variable � cycleGAN, chiens et chats mobiles effet de change

Ji-won 1 nouvelle compilation

GAN (g�n�r� contre le r�seau) apporte beaucoup de surprises pour les t�ches de transformation d'image concernent par de nombreux chercheurs. R�cemment, par exemple, est le feu projet � chat peint � (edges2cats): d�finir les contours des objets, r�seau de neurones peuvent automatiquement des informations d'image compl�te, pour g�n�rer l'image correspondante (figure 1). Il a �galement �t� trou du cerveau grand ouvert, avec DCGAN, WGAN GAN pour produire quatre sortes de � tableau de chat � (figure 2). R�cemment, NTT Data itok_msi est le petit fr�re du Japon avec lequel le relativement nouveau r�seau cycleGAN, a fait un mod�le de � l'image du chien est devenu chat �, et g�n�re la couleur du pelage et de la posture d'un chat et de garder un chien comme une entr�e d'image.

Figure 1: edges2cats dessin chats

Figure 2: Image de chat g�n�r� WGAN

cycleGAN

le style cycleGAN est une technologie de conversion d'image � l'UC Berkeley Jun-Yan Zhu, qui a propos�. L'id�e dans le cas d'une paire de donn�es de formation n'a pas r�alis� le style de conversion d'image. effet cycleGAN est impressionnant, il permet � diff�rents styles de peintures de l'artiste r�duit � des photos, l'�t� devient l'hiver, le cheval devient z�bre, orange deviennent des pommes, etc. (figure 3).

Figure 3: le rendement de transfert d'image cycleGAN

m�thodes sp�cifiques CycleGAN et les d�tails de mise en uvre voir les documents, l'adresse papiers: https: //arxiv.org/abs/1703.10593

les chiens et les chats cycleGAN des difficult�s de conversion

En fait, dans cycleGAN documents originaux (Zhu, Jun-Yan, et al., 2017) a �galement soulev� l'image du chien devient l'id�e d'un chat, mais les r�sultats exp�rimentaux du papier est un �chec (Figure 4).

Figure 4: cycleGAN le chien dans un chat est un exemple d'�chec

Ceci est parce que les chats et les chiens couleur du pelage, des textures diff�rentes, en particulier, le visage tr�s diff�rent. papier original a �galement soulign� que c'est un sujet des besoins de recherche future.

En particulier, le chat de Gdog (chien dans un chat) hors de l'image est presque identique � l'original. Qu'est-ce? Les auteurs sugg�rent deux raisons possibles:

1. Cycle effet de perte de coh�rence est trop forte

Pour transformer les chats et les chiens, vous devez sacrifier une partie de l'information de l'image d'entr�e. Cela n�cessite le cycle augmente de perte de coh�rence. Dans un aspect, exactement comme si l'image de l'image d'entr�e et la sortie, � savoir n�cessite une perte de coh�rence de cycle minimum. Nous voulons devenir un chien un chat, alors il est pas exactement la m�me chose, qui est, cycleGAN besoin d'une plus grande perte. Cependant, le probl�me est ici chez les chiens et les chats ont des caract�ristiques locales sont tr�s similaires.

2. Les caract�ristiques locales sont tr�s similaires pour les chiens et les chats

discriminateur cycleGAN (DA, DB) en utilisant patchGAN (R�f�rence ) un m�canisme d'apprentissage. image d'entr�e discriminante est une image g�n�r�e par le g�n�rateur ou l'image source, l'image enti�re n'a pas �t� utilis�, mais l'utilisation d'images partielles (patch) discrimin�.

Bien que petit r�seau discriminateur est bon, mais certains chats et les chiens est tr�s similaire � des caract�ristiques locales, cet apprentissage difficile (fig. 5). En d'autres termes, m�me si le chat de Gdog (chien dans un chat) a produit des r�sultats coh�rents avec l'image source, il est �galement susceptible de discriminateur tromper ledit effet de conversion est tr�s bon.

Figure 5: Les chiens et les chats ont des caract�ristiques locales sont tr�s similaires

version modifi�e de cycleGAN

Pour les deux questions ci-dessus, � cycleGAN �taient deux changements simples.

1. Soit les juges discriminantes observ�s fonction mondiale

En bref, une couche discriminateur augmentation de patchGAN, LGAN garde de l'information de l'information globale et locale.

2. sur la proportion de la fonction d'erreur devient une perte de coh�rence du cycle plus petit

cycle de coefficient de perte de coh�rence est r�duite � 1/10 de la fonction d'erreur.

exp�rience

Mettre en uvre des modifications mineures sur la base open source dans les auteurs cycleGAN pytorch, environnement exp�rimental est des exemples p2.2xlarge de aws.

utilisation des donn�es

Utilisez Oxford-IIIT Pet Dataset, o� l'image est chien 1922, image de chat 3922 en tant que donn�es de formation, et le reste que les donn�es de v�rification.

Les r�sultats exp�rimentaux

Bon r�sultat ( Chats Chiens)

Les chats semblent regarder la sortie stupide stupide stupide stupide est le r�sultat d'un chien

Bon r�sultat ( Chiens Chats)

Les cons�quences de l'�chec ( Chats Chiens)

Les cons�quences de l'�chec ( Chiens Chats)

penser

Bien que certaines modifications ont �t� apport�es, mais parfois ne peuvent pas obtenir les r�sultats escompt�s, en particulier:

Les animaux � fourrure pas gard� l'information
Et m�lange d'arri�re-plan animal
L'image r�sultante est tr�s floue
Chats et chiens images avant et apr�s la conversion semble pas diff�rent

Des exemples de d�faillance peu plus.

La raison peut �tre:

taux d'erreur r�seau de la petite modification
r�seau discriminateur est trop grand pour �tudier l'effet est pas bon

D'autres r�sultats

Sur la base des exp�riences ci-dessus, les raisons possibles pour continuer � modifier l'exp�rience a �chou�, pour obtenir quelques bons r�sultats:

Bon r�sultat ( Chats Chiens)

Bon r�sultat ( Chiens Chats)

Les cons�quences de l'�chec ( Chats Chiens)

Les cons�quences de l'�chec ( Chiens Chats)

En g�n�ral, si les chiens et les chats font face � l'avant de l'image, le r�sultat sera meilleur. En effet, � l'avant, les chats et les chiens ont des traits du visage similaires. Cependant, dans les exemples ci-dessus deux, si l'image d'un visage de chien ou un chat vers le c�t�, le chien a de grandes oreilles et les chats ne ont pas besoin d'�tre audacieux transformation, il est encore assez difficile.

r�f�rences

Jun-Yan Zhu, Taesung Park, Phillip Isola, Alexei A. Efros, appari� image � l'image en utilisant la traduction accusatoire R�seaux Cycle Consistent, arXiv pr�publication arXiv: 1703,105932017.

Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, Alexei A. Efros, Traduction image-to-Image avec Conditionnel accusatoires Networks, Traduction image-to-Image avec Conditionnel accusatoire Networks, arXiv pr�publication arXiv: 1611,070042016.

Original: http: //qiita.com/itok_msi/items/b6b615bc28b1a720afd7

Cliquez ici pour lire le message original pour voir les d�tails, esp�rons que vous pouvez rejoindre ~

Route de la soie

Apprenez � conna�tre la Chine

image de migration Berkeley � chien chat variable � cycleGAN, chiens et chats mobiles effet de change