vous appris comment gagner le tournoi MSC

Lei Feng r�seau (num�ro public: Lei Feng r�seau) Note: Cet article est compil� � partir du groupe de blog de technologie de Lei Feng, la lecture du titre original avec des attaques sur les machines accusatoires Can See concours 2018, l'auteur est snakers41.

Traduction | Liao Ying finition | MY

A propos du jeu contre les attaques

TLDR;

Je me trouvais � participer � la MCS2018 face � la concurrence. Lorsque vous participez � ce concours �tait en retard (lorsque la distance suppl�mentaire de temps de seulement une semaine), mais � la fin form� une �quipe de quatre membres. Parmi eux, trois membres de l'�quipe (moi plus) est une condition n�cessaire pour payer cette victoire (pour enlever un ou l'autre, nous sommes probablement pass� la brosse et la victoire).

L'objectif de ce jeu est de changer la face (exigence SSIM SSIM d'au moins 0,95), de sorte que la convolution bo�te noire de r�seau de neurones ne peut pas distinguer entre les diff�rentes face � la source et le visage cible.

Br�ve description de l'essentiel du jeu - visage modifi�, de telle sorte que deux faces de la bo�te noire ne peut pas distinguer la diff�rence (une mesure de distance sur la distance euclidienne � partir de la au moins une repr�sentation de la norme L2 de vue).

Le travail contre la n�cessit� d'attaquer et les choses utiles pour nous:

� notation gradient rapide (FGSM) est utile, il fera une addition heuristique d'un peu mieux;

� Valeur M�thode rapide gradient (FGVM), ajoutera grandement heuristique effet d'am�lioration;

� �volution diff�rentielle de la formule (r�seau � satellite constant de l'article Stellar parl� de cette m�thode) + une valeur de pixel d'attaque;

� Mod�le de Fusion (structure de r�seau est de pr�f�rence de 6 couches 34 mod�le ResNet);

� combinaison ing�nieuse de traverser l'image cible;

� Fondamentalement arr�t� le plus t�t possible lors de l'attaque FGVM.

Pour ce que nous inutile:

� Ajout de l'�lan � FGVM (ce qui est valable pour les �quipes moins bien class�es, peut-�tre la fusion et plus efficace qu'une combinaison de mouvement heuristique?);

� Attaque (C & W attaque, sensiblement bout � bout, les attaques logits mod�le de bo�te d'attention) Carlini et Wagner propos�s - Cette m�thode bo�tes de dialogue (WB) est utile, mais la bo�te noire (BB) est inutile;

� Sur la base de fin de siamois LinkNet (similaire � une architecture UNET, mais sur la base ResNet) m�thode. La m�me bo�te de dialogue est utile et inutile sur la bo�te noire.

Nous avons pas eu le temps d'essayer le (manque de temps, ou le manque d'effort et d'adh�rer aussi):

� Pour am�liorer test appropri� apprentissage des �l�ves (nous allons modifier le descripteur);

� Am�lior� au moment de l'attaque.

Pr�sentation g�n�rale du jeu:

� Comp�tition contient un petit ensemble de donn�es 10005 + 5 image combin�e;

� Fournir aux �l�ves des consid�rables apprentissage ensemble de donn�es - plus de 10.000 images;

� Caffe mod�le de bo�te noire comme un grand nombre de pr�-compil� (en raison de l'utilisation de ceux-ci ne peuvent pas �tre bien utilis� sur la version actuelle du logiciel - mais finalement pris en charge par les organisateurs). Il est encore un peu douloureux, car la bo�te noire n'accepte pas des lots d'images;

� Ce jeu fournit un code de base (Honn�tement, ce n'est pas open source, je pense, pas de gens).

Mat�riau du noyau:

� Les r�sultats reproduisent la base de code;

� Notre d�monstration;

� Tous les gagnants de la d�mo.

1, MCS2018 un aper�u du jeu et la fa�on dont je me suis inscrit

Concours et m�thodes

Honn�tement, j'ai �t� fascin� par ce domaine int�ressant. Je pense qu'il ya des prix GTX 1080 la version Ti FE de la carte, il est relativement niveau comp�tition � faible � (loin derri�re la concurrence avec 4.000 personnes ODS de l'�quipe Kaggle + enti�res).

Comme mentionn� ci-dessus, l'objet du jeu est de confondre le mod�le de bo�te noire, ce qui rend impossible de distinguer la diff�rence entre deux personnes (avec L2 norme ou de la distance euclidienne). La comp�tition est un jeu � bo�te noire �, nous avons donc d� les donn�es donn�es sur le r�seau �tudiant est distill� bo�te noire de gradient d'espoir et de gradient de bo�te blanche est suffisamment similaire � l'attaque sur la performance.

En fait, si vous lisez la litt�rature acad�mique (comme ceci et cela, m�me si elles ne vous disent pas vraiment dans la pratique ce qui est utile), et le mod�le haut obtenu par distillation de l'�quipe, vous pouvez facilement trouver certains des �l�ments suivants loi:

� La mise en uvre plus simple de l'attaque (sur le cadre moderne), y compris bo�te blanche ou comprendre la structure interne que vous attaquez la convolution du r�seau de neurones CNN (ou tout simplement un cadre);

Le chat ... Il a �t� sugg�r� de calculer le temps de l'estimation de la bo�te noire r�alis�e, comprimant ainsi sa structure;

� La prise en compte des donn�es assez donn�, vous pouvez simuler la bo�te noire bo�te blanche avec la formation correcte;

� � l'heure actuelle la plupart des m�thodes classiques sont:

Fin de l'attaque C & W (ici non utilis�);

FGSV l'extension intelligente (comme l'int�gration de la dynamique de +).

Pour �tre honn�te, nous avons d�rout� les rangs des personnes qui utilisent la solution de deux tout autre fin (ne se connaissent pas, qui est compl�tement ind�pendant), mais ils ne travaillent pas pour la bo�te noire. Cela peut signifier que dans nos param�tres de la t�che, il y a certains param�tres cach�s de fuite, mais on n'a pas remarqu�. Comme beaucoup d'applications modernes de vision machine compl�tement fin peut donner de bons r�sultats (tels que la conversion de style, l'algorithme du bassin versant profond, g�n�ration d'images et r�duire les artefacts de bruit, etc.), mais il ne sert � rien.

Comment fonctionne la m�thode de gradient

Vous pouvez en principe par distillation, pour simuler une bo�te noire avec une zone blanche, et ensuite calculer le gradient de l'image d'entr�e sortie de mod�le. Comme d'habitude un secret cach� dans l'heuristique.

matrice cible

Une matrice de cible est la norme moyenne de L2 (distance euclidienne), et les images source et cible (5 * 5) 25 combinaisons en moyenne.

En raison des restrictions CodaLab, je pense score individuel (score total et �quipe) sont manipul�s manuellement par un administrateur, ce qui est un peu peur.

�quipe

Apr�s ma formation apr�s les effets du r�seau des �tudiants sont mieux que d'autres (jusqu'� pr�sent), et Atmyre discuter (parce que face � des probl�mes semblables avant elle, elle m'a aid� � la traduction correcte de la bo�te noire), nous avons partag� les uns des autres scores pour, Bien s�r, deux ou trois jours avant la date limite dans le jeu que nous ne partageons pas les m�thodes et les codes:

� mod�le My-end a �chou� (elle aussi);

� J'ai un grand mod�le �tudiant;

� Ils ont une excellente heuristique de FGVM diff�rentiel (leur code est bas� sur la ligne de base);

� Je ne l'avais pas commenc� mod�le de traitement en fonction de gradient, pour atteindre pr�s de 1,1 - d'abord pour des raisons personnelles, je rejette l'utilisation du code de base (pas de d�fi) sur le plan local;

� � ce moment-l�, ils ont pas trop forte puissance de calcul;

� Enfin, nous prenons un risque, combin� avec d'autres forces - j'ai donn� mon devbox / CNNs / exp�riences d'ablation et observations, ils ont sorti plusieurs semaines fournissent la base de code.

Une fois de plus, ses comp�tences organisationnelles et des recommandations d�sint�ress�s ont exprim� leur profonde gratitude.

les membres de l'�quipe sont les suivants:

� https://github.com/atmyre-- elle �tait capitaine (je suppose que de sa performance). Elle a pr�sent� la version finale de l'�volution de l'attaque de diff�rence g�n�tique;

� Il https://github.com/mortido-- heuristique stellaire mieux atteint avec l'attaque du code de base + de FGVM form� deux mod�les;

� https://github.com/snakers4 - sauf pour certains tests d'ablation, je donne trois r�sultats des �l�ves au cours d'un mod�le de pr�sentation + calcul des heures suppl�mentaires et la version finale + capacit� soumise;

� https://github.com/stalkermustang;

Enfin, nous avons beaucoup appris les uns des autres, tr�s heureux d'avoir cette exp�rience. Lequel des trois premiers en l'absence de la contribution, nous ne pouvons pas gagner.

2, les �tudiants convolution distillation de r�seau neuronal

J'utilise le mod�le d'�tudiant pour obtenir le meilleur score dans la formation, parce que j'utilis� mon propre code au lieu de l'int�rieur de la ligne de base.

La cl� / point valide:

� Pour chaque architecture con�ue individuellement r�gime LR;

� Par la formation d'att�nuation Adam + LR au d�but;

� Ensuite le pliage et / ou encore plus intelligent (je ne pas utiliser) ou un taux d'apprentissage int�gr� poids p�riodique;

� Soigneusement contr�l�e due � une sur-raccord et le raccord et la capacit� de mod�le;

� R�gler manuellement votre journal, ne vous fiez pas uniquement sur le journal automatique. Bien qu'ils fonctionnent bien, mais si vous avez le droit d'ajuster, le temps de formation peut �tre raccourcie 2-3 fois. En particulier, lorsque le mod�le de gradient lourd tel que DenseNet;

� La meilleure architecture est encombrant appropri�e;

� La formation des pertes L2 plut�t que l'�cart quadratique moyen est �galement possible, mais pas si pr�cis. G�r�e par mod�le moyen de formation d'erreur quadratique est plus qu'un spectacle avec un mod�le de perte distance L2 L2 train approche sortie du mod�le de bo�te noire. Probablement parce que l'erreur quadratique moyenne, les bo�tes que nous utilisons l'objet pour chaque lot s�par�ment Bx512 de la formation (pour permettre le partage d'informations entre plus peaufinage et images) et L2 sont respectivement vecteur formation 2x512 paradigme.

Pas d'utilisation:

� (Ne convient pas, parce que la haute r�solution et sous-�chantillonnage requis plus) architecture de lancement. Bien que le troisi�me lancement-v1 et a essay� d'utiliser l'image en pleine r�solution (environ 250x250);

� l'architecture � base de VGG (over-raccord);

� architecture "Light" (SqueezeNet / MobileNet-- underfitting);

� Am�lioration de l'image (ne modifie pas le descripteur - m�me troisi�me ami �teint);

� Dans l'op�ration d'image pleine grandeur;

� Remettre en question l'esprit des organisateurs du r�seau fournit enfin une sp�cification de traitement par lots. Mais ceci est pour mon �quipe et ne sert � rien, je suis en utilisant votre propre code, mais je ne comprends pas pourquoi il est ici;

� Lequel la carte de pixels et en utilisant la seule attaque. Cela suppose que l'image en taille r�elle est plus utile (il suffit de comparer 112x112x search_space et 299x299xseach_space).

Notre meilleur mod�le - Notez que le score maximum est de 3 * 1E-4. Compte tenu de la complexit� du mod�le, il est difficile de deviner le mod�le de bo�te noire est ResNet34. Dans mes tests, ResNet50 + a sous-perform� ResNet34.

La perte a �t� la premi�re variance

3, score final et l'analyse d'ablation

Notre analyse d'ablation comme ceci:

Top solutions comme celui-ci (d'accord, cela est empil� ResNet a ouvert une blague, il pensait ResNet est l'architecture de bo�te noire):

Certaines des autres �quipes intelligentes conseils utiles:

� Epsilon param�tres adaptatifs;

� Enhanced Data;

� Momentum;

� la dynamique de Newton;

� Attaque miroir de r�flexion;

� donn�es d'image Zhang combin� --5000 break seulement 1000 images uniques, ce qui signifie que vous pouvez g�n�rer plus de donn�es de formation.

heuristique utile pour FGVM:

� Noise = * eps serrage (grad / grad.std, -2, 2);

� Plusieurs int�gr� par r�seau de neurones gradient de convolution CNN;

� Enregistrer les modifications que lorsque plus la perte moyenne;

� Lupin plusieurs cibles en utilisant une combinaison de la cible;

� Utilisez uniquement que le gradient carr� norme moyenne (pour FGSV).

Un bref r�sum�:

� La premi�re est pas la plus �l�gante solution;

� Nous avons les solutions les plus diverses;

� La troisi�me est la solution la plus �l�gante.

4, de bout en bout mod�le

M�me si elles �chouent, l'avenir est la peine d'essayer. Pour plus de d�tails, voir le r�seau d'examinateur, bref, nous avons essay�:

� C & W � l'attaque;

� Deux excitation cible siamois LinkNet;

Mod�le de fin

processus de mod�le de fin

Je pense toujours que ma perte est tr�s belle.

5, r�f�rences et lectures

1, le jeu Accueil

2, notre biblioth�que publique

3, une s�rie d'articles sur la variation de codage (VAE) est le sujet de pr�s

4, la structure du mat�riau sur la similitude (SSIM) de

1, Wikipedia

2, "Backpropable" PyTorch atteindre

5, l'algorithme diff�rentiel mat�riau �volution

1, le blog de Stellar

2, SciPy

6, demo

1, notre

2, tous

7, le plus utile des deux articles

1, https: //arxiv.org/pdf/1710.06081.pdf

2, https: //arxiv.org/abs/1708.03999

8,2 dans tous les journaux de lieu:

1, https: //arxiv.org/abs/1712.07107

2, https: //arxiv.org/abs/1801.00553

Lien original: https://spark-in.me/post/playing-with-mcs2018-adversarial-attacks

Lei Feng Lei Feng net net

Route de la soie

Apprenez � conna�tre la Chine

vous appris comment gagner le tournoi MSC