Le pire GAN est au-del� de Google! donn�es d'annotation avec 90% de moins, mais la fraude d'effet plus r�aliste

R�servez bouillie de ch�taignes s�ches � partir du bas de la non-Temple en retrait

rapports Qubit | Num�ro public QbitAI

L'image de la g�n�ration actuelle est la plus r�aliste au-del� BigGAN!

Tourn�, est le cerveau Google et l'EPF de Zurich. Ils mettent en avant une nouvelle g�n�ration de GAN: S�GAN .

Ils ont produit des images �taient r�elles � l'ennemi.

En dessous de ces deux papillons, qui ne vive plus?

Deux photographies de paysage, qui Zhang est plus r�el?

Dilemme est normal, de toute fa�on, sont fausses. Selon mensonge ci-dessus, sont laiss�s de S�GAN, BigGAN par la main droite.

Ils ont aussi plus d'articles:

Quant � ce qui est S�GAN, a annonc� la fin de la r�ponse.

Difficile de rivaliser avec l'oeil nu, ils parlent avec des donn�es. Ex�cuter un FID (Frechet Inception Distance) score, plus le score, cela signifie que ces photos se trouvent plus pr�s de la connaissance humaine dans la vraie photo -

S�GAN est de 8,0 et 8,4 minutes BigGAN. Les nouveaux joueurs pour gagner un peu.

Vous vous souvenez peut BigGAN cr�ation, la fid�lit� d'image g�n�r�e directement au niveau suivant, a tir� sur Twitter astuces appr�ciation?

Aujourd'hui, il est non seulement au-del�, et d�tendu Au-del�.

� Easy � O� est-il?

S�GAN obtenir ces bons r�sultats, seulement 10% des donn�es �tiquet�es manuellement. Et BigGAN v�t�ran, les donn�es de formation utilis�s 100% par rapport � l'annotation manuelle.

Si vous passez 20% des donn�es d'annotation, l'effet sera S�GAN un niveau plus �lev�.

Marqu� manque de donn�es, GAN d�j� contribu� � accro�tre la capacit� de production et d'�largir un des sc�narios d'utilisation de goulot d'�tranglement majeur. Aujourd'hui, le goulot d'�tranglement a presque �t� bris�e.

Maintenant S�GAN, apr�s seulement la IMAGEnet d'exp�rience, est moins marqu� la premi�re �tape dans les donn�es de formation pour produire des images de haute fid�lit� avec la mise en uvre.

Ensuite, les auteurs veulent appliquer cette technologie � un � plus � et � plus diversifi�e, � l'ensemble de donn�es.

Pas tellement marque

Pourquoi l'image g�n�r�e GAN de formation, il faut marquer une grande quantit� de donn�es?

Il g�n�rateur de GAN, l'assemblage de deux discriminateur.

Classificateurs de garder laquelle identifi� fausse image, le g�n�rateur d'excitation sur l'image plus r�aliste.

L'image de l'�tiquette, est de donner au discriminateur de faire un jugement fond�. Par exemple, ce qui est vraiment un chat, un chien qui est vrai, il est vrai ...... Ceci est une vue fausse de Hambourg.

Cependant, pas marqu� la quantit� de donn�es ne?

les chercheurs de Google et de l'EPF de Zurich, a d�cid� de former leur propre annotation d'image AI, � la consommation de discriminateur.

Vs auto-surveillance semi-supervis�

Laissez discriminateur propre image de l'�tiquette, il y a deux fa�ons.

premier �tant donn� que la m�thode de surveillance est d'ajouter un discriminateur extracteur de caract�ristiques �(Feature Extractor), la v�ritable formation � partir des donn�es non marqu�es � l'int�rieur de leur caract�risation (repr�sentation de fonction) a appris.

Faire le regroupement (clustering) pour la caract�risation et affecter le r�sultat du regroupement, � utiliser comme une �tiquette.

La formation ici, utiliser la fonction de perte d'auto-surveillance.

deuxi�me m�thodes semi-supervis�, un extracteur de caract�ristique � faire, mais plus compliqu� que sur un chemin un peu.

Dans un ensemble de formation Sous-ensemble de L'affaire a �t� marqu�e au large, sur la base des informations connues � l'apprentissage de caract�riser, alors que la formation d'un classificateur lin�aire �(Linear classificateur).

De cette fa�on, la croix-entropie de la fonction de perte sur la base de l'auto-surveillance, en plus d'une semi-supervis� (perte Entropie-Crois�e).

extracteur fonction de pr�-formation, vous pouvez prendre le train GAN. Cela a marqu� une fraction du connu d�velopper le GAN, appel� S�GAN .

Cependant, avant la formation n'est pas la seule fa�on.

Voulez-vous approche � deux volets, vous pouvez utiliser Co-formation �(Co-formation):

Discriminateur directement la caract�risation ci-dessus, la formation semi-supervis� un classificateur lin�aire pour pr�dire l'image non annot�e. Ce processus, GAN et de formation men�es ensemble.

Donc, il y a une version S�GAN de synergie, appel� S�GAN-CO .

vague de mise � niveau

Ensuite, l'�quipe veut aussi S�GAN devenir plus puissant, juste au-dessus de la stabilit� formation GAN a pris la pens�e.

Les chercheurs ont dit discriminateur il est un classificateur Eh bien, si ce classificateur amplification (augmentation), il peut �tre bon sur l'efficacit�.

Donc, ils ont donn� un classificateur suppl�mentaire des t�ches de surveillance, il est de Amplification de rotation Gr�ce � l'ensemble de la formation (y compris vrai et faux Figure Figure), faire une pr�diction.

Ensuite, cette �tape, et en face du mod�le semi-supervis� se combinent, la formation GAN devient plus stable, il y aura une version am�lior�e S�GAN :

Architecture n�e de BigGAN

Que ce soit S�GAN ou S�GAN, ont emprunt� l'architecture r�seau BigGAN sup�rieurs, les param�tres d'optimisation sont aussi super et pr�d�cesseurs.

La diff�rence est que cette �tude n'a pas utilis� la r�gularisation orthogonale (Orthogonal R�gularisation), ne pas utiliser les comp�tences tronqu�es (troncature).

G�n�rateur BigGAN et un diagramme sch�matique d'un discriminateur

les donn�es de formation �tablies IMAGEnet, dont 1,3 millions d'images de formation et 50000 images de test, images au total de 1.000 cat�gories.

Devenir l'ajustement de la taille de l'image est de 128 � 128 � 3, k% des �chantillons choisis au hasard dans chaque cat�gorie, pour d�finir la section d'acquisition de donn�es marqu� m�thode semi-supervis�e utilis�.

Enfin, la formation dans Google TPU v3 base Pod 128.

Au-del� BigGAN

La comparaison des �tudes de base est DeepMind de BigGAN, le d�tenteur actuel du record, le score FID 7.4 .

Cependant, ils sont eux-m�mes dans IMAGEnet BigGAN mis en uvre, est de 8,4 FID, 75 IS, et en tant que norme.

Dans ce tableau, S�GAN est une des m�thodes pr�-formation semi-supervis�. m�thodes de formation semi-supervis�e S�GAN-CO.

S�GAN, est coupl� avec un S�GAN auto-supervis�e lin�aire classificateurs (l'ensemble de donn�es d'amplification de crier apr�s la rotation de ce classement).

En quoi, le meilleur est S�GAN, seulement 10% des donn�es �tiquet�es manuellement, la marque 8.0 FID, IS score de 78,7, la performance a �t� meilleure que BigGAN.

. Si vous �tes int�ress� par cette �tude S'il vous pla�t garder un bon portail:

papier:

Image haute fid�lit� g�n�ration Avec moins d'�tiquettes

https://arxiv.org/abs/1903.02271

Le d�but de l'article pour montrer ces photos pour tricher, � venir parmi les papiers:

La premi�re ligne est fonctionne BigGAN, la deuxi�me ligne est S�GAN nouvelle, vous l'avez devin� encore?

De plus, ils code source �galement ouvert pour tous les documents utilis�s dans les exp�riences sur GitHub:

https://github.com/google/compare_gan

- complet �-

recrutement sinc�re

Qubits recrutent �diteur / journaliste, bas� � Zhongguancun de Beijing. Nous attendons de talent, des �tudiants enthousiastes de nous rejoindre! D�tails, s'il vous pla�t interface de dialogue qubit num�ro public (QbitAI), r�ponse mot "recrutement".

qubit QbitAI � manchettes sur la signature de

' � suivre les nouvelles technologies AI dynamiques et de produits

Route de la soie

Apprenez � conna�tre la Chine

Le pire GAN est au-del� de Google! donn�es d'annotation avec 90% de moins, mais la fraude d'effet plus r�aliste