Machine Can See 2018 attaque contre le concours d'image exp�rience Bisai

Note de Lei Feng r�seau AI Technology Review: Cet article Des scientifiques de donn�es Russie, les amateurs d'apprentissage automatique, les entreprises en d�marrage dans la vision informatique chercheur Alexander Aveysov. Il a pris part � l'offensive et d�fensive �chantillon conflictuel concours de 2018 annuel � Machine Can See � et a remport� la deuxi�me place dans la course. Cet article est un r�sum� de ses sentiments personnels et de l'exp�rience du jeu. Lei Feng r�seau AI Technology Review compil� comme suit.

Tous les simples paradigme attaques conflictuelles

synopsis complet

Il n'y a pas longtemps, j'ai eu la chance de participer � la � Machine Can See 2018 � �chantillon conflictuel concours offensif et d�fensif. En fait, quand je course tr�s tard (Heureusement, j'ai gagn� la deuxi�me place � la fin du jeu), notre �quipe finale de quatre personnes, dont trois personnes, y compris moi-m�me, a fait pour la victoire contribution exceptionnelle (pour �liminer l'un d'eux, nous ne parviendrons pas � de tels r�sultats).

Les objectifs de la concurrence pour modifier les images visage humain (SSIM SSIM limite inf�rieure de 0,95), de sorte que la bo�te noire ne peut pas �tre la source de CNN Portrait (personne source) et des portraits cibles (personne cible) zones distinctes.

En bref, la condition de jeu est: modifier une image du visage, ce qui rend le mod�le de bo�te noire ne peut pas �tre deux zone d'image de visage s�par� (au moins du niveau � norme L2 / distance euclidienne � alors) .

Ce qui fonctionne en attaque est contradictoire? Nous utilisons quelle m�thode?

1. Symboles m�thode de gradient rapide (FGSM) vraiment efficace. m�thodes heuristiques peuvent �tre l�g�rement ajout�s pour am�liorer les performances;

2. m�thode de la valeur de gradient rapide (FGVM). Ajouter heuristiques peut grandement am�liorer les performances de celui-ci;

3. algorithme d'�volution diff�rentielle gradient (ici fournissent un excellent article sur l'algorithme pour tout le monde: https: //pablormier.github.io/2017/09/05/a-tutorial-on-differential-evolution-with-python /) + attaques de niveau de pixel;

4. L'int�gration du mod�le (la meilleure solution � empiler, par exemple, six ResNet-34);

La combinaison de l'image d'objet intelligente traversal;

6. faire pleinement usage de la technologie FGVM attaquer au d�but d'arr�t (arr�t pr�coce).

Approche ne fonctionne pas pour nous sont les suivants:

1. algorithme de FGVM pour ajouter l'�lan (cette m�thode ne peut am�liorer les performances du mod�le des �quipes moins bien class�es alors peut-�tre en utilisant seulement heuristiques mod�le d'int�gration + sera en mesure d'obtenir une meilleure performance que l'�lan.?);

2. C & W � l'attaque (fin de la nature de l'attaque, le rapport de l'�v�nement ne se produit pas, il se concentre sur le mod�le bo�te blanche � logits � (un certain nombre d'�v�nements), https: //arxiv.org /abs/1705.07263);

3. M�thode � base de fin connexion r�seau � siamois � (une sorte de unet une architecture similaire, mais est bas�e sur pr�sure d�velopp� � partir) a. Cette m�thode est efficace pour la Banque mondiale, mais pas � BB.

Nous avons pas essay� la pratique (en raison du manque de temps, d'effort ou de volont�):

1. Pour les �tudiants r�seau d'apprentissage correctement am�lioration des donn�es de test (Nous avons �galement besoin de modifier le descripteur);

2. Les donn�es am�lior�es au moment de l'attaque;

Aper�u du concours:

1. Les donn�es de comp�tition fournis par le 1000 est un ensemble de 5 + 5 (respectivement pour la personne source et personne cible) de l'ensemble de donn�es d'image consistant en une combinaison de petites;

2. utilis� pour former des �tudiants � des ensembles de donn�es de r�seau relativement grande taille - plus de 1 M image;

3. BB est (en raison du logiciel BB en cours d'ex�cution dans cet environnement, ces mod�les ne peuvent pas utiliser le bon d�roulement de la derni�re version, le probl�me sera finalement r�solu h�te) autant de mod�le Caffe compil� pr�-offre. En effet, cette question quelque peu douloureuse, parce que le BB n'a pas accept� le traitement par lots d'images;

4. Le jeu �tablit une base de comparaison tr�s �lev�e (je ne pense pas honn�tement que la base ne en t�te de liste des);

Ressources essentielles:

1. Une copie du d�p�t d�finitif de code de mod�le (https://github.com/snakers4/msc-2018-final);

2. Notre mod�le d�montre (https://drive.google.com/file/d/1P-4AdCqw81nOK79vU_m7IsCVzogdeSNq/view);

3. Le mod�le montre tous les gagnants (https://drive.google.com/file/d/1aIUSVFBHYabBRdolBRR-1RKhTMg-v-3f/view);

Description d�taill�e - Pr�sentation du concours � Machine Can See 2018 �, voir comment j'obtenir les r�sultats finaux

1. Le processus de concurrence et solutions

Pour �tre honn�te, j'ai �t� attir� � ce jeu int�ressant, jeu de prix pour la version publique NVIDIA GTX 1080Ti de la carte graphique et je pense que le niveau de la concurrence relativement faible dans le jeu (ce qui est loin et ceux avec 4000 participants jeu Kaggle + ODS enti�re de pair d'�quipe).

Comme d�crit ci-dessus, l'objet du jeu est de tromper mod�le BB, nous ne pouvons pas diff�rencier entre les diff�rentes image d'une personne (en utilisant la norme L2 ou mesure de distance euclidienne). Le jeu est une � bo�te noire � concours, donc nous devons utiliser le jeu disponible pour nos donn�es, � distillation � (Knowledge Extraction), le r�seau �tudiant et gradient d'espoir mod�le BB et WB peuvent �tre assez semblables � l'attaque.

En fait, si vous lisez la litt�rature acad�mique compl�te (par exemple, celui-ci (https://arxiv.org/abs/1712.07107) et celui-ci (https://arxiv.org/abs/1801.00553), bien que ces documents nous n'avons pas discut� comment la situation dans la vie r�elle) et extraire que les connaissances acquises �quipe de haut, vous pouvez facilement trouver les modes suivants:

1. Les attaques les plus faciles � atteindre (d�sormais populaire dans le cadre) se rapporte � l'attaque bo�te blanche ou r�seau de neurones comprennent convolutionnel (CNN) structure interne (ou simplement un cadre);

1.1 Il a m�me �t� sugg�r� que j'enregistre le mod�le de bo�te noire pour estimer le temps, de sorte que l'inverseur de pouss�e son architecture, �tait si dr�le au moment de discuter avec moi!

2. Si vous pouvez obtenir suffisamment de donn�es, vous pouvez utiliser un mod�le bo�te blanche gr�ce � la formation appropri�e du mod�le de bo�te noire pour simuler;

La sp�culation, la m�thode la plus avanc�e est:

3.1 C & W de fin aux attaques de fin (ici l'effet est pas bon);

3.2 FGSM ing�nieux �tendu algorithme (https://arxiv.org/pdf/1710.06081.pdf), par exemple: + dynamique int�gration du mod�le;

Pour �tre honn�te, nous avons �t� une fois pris dans la confusion, parce qu'il ya deux personnes dans notre �quipe pour obtenir un des ensembles tr�s diff�rents de fin � des solutions extr�mes (et entre eux, ils ne le savent pas, qui ont �t� achev�s deux ensembles syst�me), mais ils n'ont pas utilis� le mod�le de bo�te noire. Ce essentiellement signifie que notre t�che, notre cadre de mod�le manqu� un facteur cach�, mais nous ne le remarquent pas. Comme beaucoup maintenant populaire de bout en bout, comme des applications de vision par ordinateur, ils vous offrent soit avec de tr�s bons r�sultats (par exemple: le style Migrate, l'algorithme du bassin versant de profondeur (pour la segmentation d'images), g�n�ration d'image, image de d�bruitage), ou de base sur cela ne fonctionne pas.

Comment fonctionne la m�thode de gradient

En fait, vous pouvez utiliser les connaissances par une technique de distillation mod�le de bo�te blanche simule un mod�le de bo�te noire, puis vous la valeur de calcul des gradients d'image sur la sortie du mod�le d'entr�e. Et le myst�re de tout cela est l'algorithme heuristique.

2. Objectif Metrics

Une m�trique cible est d'autant 25 (5 * 5 = 25) image source et l'image cible combinaison de norme moyenne L2 (distance euclidienne).

En raison des restrictions CodaLab (Les organisateurs de l'�v�nement), et je pense que les scores individuels (ainsi que les scores �quipe processus de fusion) est effectu� manuellement par un administrateur, qui un peu g�n�.

3. �quipe

Quand je l'ai fait une meilleure formation des �tudiants dans le r�seau que d'autres sur la liste (AFAIK), et et Atmyre (https://github.com/atmyre) eu une discussion (elle me aider mod�le de bo�te noire compil� correctement, car elle fait aussi face � ce probl�me), je me suis joint � l'�quipe maintenant. 2-3 jours avant la fin du jeu, nous avons partag� les scores locaux dans le cas de ne pas partager nos algorithmes et du code:

1. mod�le My-end a �chou� (elle est);

2. Mes �l�ves de performance meilleur mod�le;

3. Ils ont une meilleure variante heuristique FGVM (en fonction de leur code est modifi� par rapport au d�part);

4. Dans un premier temps, je pris le mod�le � base de gradient, et obtenir le score local d'environ 1,1. Au d�but, certains de mes raisons personnelles (penser qu'il n'y a pas d�fi aussi) Je ne veux pas utiliser le code de base;

5. ne pas avoir assez de puissance de calcul;

6. Enfin, nous avons pris un pari, les moissonneuses-batteuses politiques respectives - Je contribuais mon devbox poste de travail / convolution neuronale exp�riences mod�les r�seau / simplifi�es et observations, ils ont apport� leurs modifications pendant plusieurs semaines code.

Cette fois-ci, elle a sugg�r� acclamait pour ses propres excellentes comp�tences organisationnelles et une �quipe n'a pas de prix! Nous avons obtenu de bons r�sultats.

les membres de l'�quipe comprennent:

1. https://github.com/atmyre-- Elle est notre capitaine de l'�quipe (je d�duis de ce qu'elle a fait dans). Sa version am�ricaine soumise � la contribution la plus au diff�rentiel de g�ne attaque algorithme d'�volution;

2. https://github.com/mortido-- ses deux bons mod�les pour un algorithme FGVM optimal d'attaque avec des algorithmes heuristiques sophistiqu�s, et il a utilis� la formation de base de code;

3. https://github.com/snakers4, sauf pour certains tests effectu�s par les mod�les, j'ai aussi contribu� trois grands scores des �l�ves de mod�le, la puissance de calcul, et j'ai besoin aussi des pr�sentations de mod�les et soumettre �tape finale du mod�le d'am�lioration continue la performance;

4. https://github.com/stalkermustang;

En fin de compte, nous avons beaucoup appris les uns des autres, je suis heureux que nous ayons mis ce pari. Si vous manquez l'une de ces trois contributions en un, nous ne gagnerons pas.

4. Les �l�ves convolution r�seau de neurones de la connaissance distill�e

J'ai re�u le score le plus �lev� dans la formation du mod�le �tudiant, parce que j'utilis� mon propre code au lieu du code de base.

Points cl�s et facteurs:

1. Chaque sch�ma d�velopp� s�par�ment un syst�me de mod�le de r�gression logistique (LR);

2. Adam d'abord seulement besoin d'utiliser l'algorithme et la formation de la technologie d'att�nuation LR;

3. Ensuite, en utilisant le pliage et / ou d'autres encore plus subtile, comme le v�lo ou le poids apprentissage pratique d'int�gration tarifaire (je ne le faisais pas ici);

4. Surveiller attentivement underfitting, mod�le surajustement et de la capacit�;

5. manuellement ajuster votre programme de formation, ne comptez pas sur des solutions automatis�es. Ils peuvent aussi travailler, mais si vous ajustez correctement tous les d�tails de la formation, votre temps de formation peut �tre raccourcie 2-3 fois. Surtout pour un profond processus de r�solution mod�le gradient DenseNet, ce qui est tr�s importante;

6. Les meilleurs mod�les sont souvent tr�s profondes;

7. la perte de la perte L2 au lieu de l'erreur quadratique moyenne (MSE) est tout aussi efficace, mais cela ne suffisait pas pr�cis. Lors de l'ex�cution de l'essai en utilisant la perte de formation de mod�le d'erreur quadratique moyenne, montrant la distance L2 entre le mod�le et sa sortie est plus petite que la formation du mod�le d'affaiblissement L2 BB. Cela peut �tre parce que l'erreur quadratique moyenne, si l'on utilise le proc�d� de l'invention, de traiter chaque lot d'�chantillons B * 512 (qui permet plus de param�tres de r�glage, et le partage d'informations entre les images) et la norme L2 traiter s�par�ment chaque vecteur en combinaison de 2 * 512.

Ne fonctionne pas est:

1. cr�ation architecture (en raison de la haute r�solution et un taux d'�chantillonnage sup�rieur doit pas applicable). Je ne sais pas pourquoi, troisi�me �quipe de lieu d'essayer d'utiliser l'architecture cr�ation-v1 et images pleine r�solution (environ 250 * 250);

2. Mod�le d'architecture VGG (�quip�e pass�);

3. architecture "l�g�re" (SqueezeNet / MobileNet-- underfitting);

4. Am�lioration de l'image (non descripteurs modifi�s - bien que troisi�me �quipe de personnes travaillent dur pour atteindre ce point);

5. Utilisation de l'image en taille r�elle;

6. De plus, nous sommes enfin dans un des organisateurs de la comp�tition de r�seau fournis rejoint par une couche de normalisation par lots. Il n'a pas jou� pour aider mes co�quipiers, je me suis retrouv� en utilisant leur propre code, parce que je ne comprends pas pourquoi cela se produit. ;

7. La carte utilisation de saillance (cartes de saillance) et une attaque � pixel unique. On suppose que plus utile pour l'image en taille r�elle (l'espace de recherche est seulement 112 * 112 * 299 et 299 de l'espace de recherche);

Notre meilleur mod�le. Peut �tre vu, le meilleur score �tait de 3 * 1E-4 (plus le meilleur). En fonction de la complexit� du mod�le, vous pouvez deviner d'une mani�re que le mod�le BB est ResNet-34. Dans mes tests, la performance de ResNet-50 est pire que ResNet-34.

MSE sch�matique premi�re perte

L'analyse finale de score et simplification mod�le

Notre analyse du mod�le simplifi� Les r�sultats pr�sent�s ci-dessous:

La meilleure solution, comme indiqu� ci-dessous (oui, il y a des gens blague que vous voulez ResNet empil�s, ils devinent ResNet est l'architecture du mod�le de bo�te noire):

D'autres �quipes ont offert une autre utilisation intelligente de la technologie:

1. epsilon param�tres adaptatifs;

2. L'am�lioration des donn�es;

3. Utilisez l'�lan au cours de la formation;

4. Nesterov dynamique (

L'attaque d'image en miroir invers�;

6. Modifier les donn�es - le jeu offre seulement 1000 images uniques 5000 combinaisons d'images, vous pouvez g�n�rer plus de donn�es de formation;

heuristiques FGVM pratiques:

1. Noise = * eps serrage (grad / grad.std, -2, 2);

2. plusieurs r�seau neuronal convolutif (CNN) en int�grant gradient pond�r�;

3. La seule modification au stockage diminue le mod�le de la perte moyenne;

4 pour r�aliser la s�lection des cibles plus robuste en utilisant la composition cible;

La seule diff�rence plus grande que la moyenne, plus le gradient standard (pour FGSM Algorithmiquement);

Un aper�u rapide:

1. Le premier est le plus � solutions esprit hacker �;

2. Notre �quipe a les solutions les plus diverses;

3. La troisi�me solution est la plus � belle � dans;

mod�le 6.-end

En d�pit de cette concurrence, cette approche a �chou�, mais il �tait encore la peine d'essayer � l'avenir. Pour plus de d�tails, s'il vous pla�t se r�f�rer au r�f�rentiel de code fourni ci-dessus, cependant, en quelques mots, nous avons essay�:

1. attaque C & W;

2. Il y a deux objectifs par mod�le connexion r�seau d'inspiration siamois;

Mod�le de fin

mod�le de fin du flux de travail

7. R�f�rences et lectures

1. Le site officiel de la concurrence: https: //competitions.codalab.org/competitions/19090#participate

2. Notre r�f�rentiel de code: https: //github.com/snakers4/msc-2018-final

3. En ce qui concerne la variation de codeurs s�rie (VAE) - le look et le th�me est tr�s pertinent: https: //habr.com/post/331552/

4. Informations sur les similitudes structurelles:

4.1 Wikipedia: https: //en.wikipedia.org/wiki/Structural_similarity

4.2 � concept peut �tre utilis� pour l'inversion de pouss�e � de r�alisation Pytorch: https: //github.com/Po-Hsun-Su/pytorch-ssim

5. Informations sur l'algorithme d'�volution diff�rentielle:

5.1 merveilleux Bowen: https: //pablormier.github.io/2017/09/05/a-tutorial-on-differential-evolution-with-python/

5.2 r�alisation SciPy: https: //docs.scipy.org/doc/scipy-0.17.0/reference/generated/scipy.optimize.differential_evolution.html

6. Mod�le de d�monstration

6.1 Notre mod�le d�montre: https //Drive.google.com/open id = :? 1P-4AdCqw81nOK79vU_m7IsCVzogdeSNq

6.2 Tous les mod�les montrent: https: //drive.google.com/open id = 1aIUSVFBHYabBRdolBRR-1RKhTMg-v-3F?

7. Les deux plus d'articles utiles:

7.1 https://arxiv.org/pdf/1710.06081.pdf

7.2 https://arxiv.org/abs/1708.03999

8. Les deux tr�s respect� papier:

8.1 https://arxiv.org/abs/1712.07107

8.2 https://arxiv.org/abs/1801.00553

par �tincelle dans, Lei Feng r�seau compil� AI Technology Review

Route de la soie

Apprenez � conna�tre la Chine