Dry: Universal Image routine du jeu ont? �quipe m�daille d'or de la comp�tition Kaggle pour vous r�pondre

Lei Feng r�seau AI Yanxishe par: Kaggle est premier plan des donn�es scientifiques du monde, l'apprentissage automatique des concours de la communaut� des d�veloppeurs et la plate-forme, jetez un oeil � la m�daille d'or par �quipe Kaggle exp�rience for�t amazonienne pour le partager.

R�cemment, les jeunes universitaires partageront Lei Feng r�seau de l'organisation AI Yanxishe, laboratoire CIS �tudiant de l'Universit� Zhongshan Kenji Liusi Cong nous a apport� une magnifique action. L'�quipe o� il a remport� la m�daille d'or en Amazonie en comp�tition sur Kaggle, dans ce partage, il d�taille l'exp�rience ainsi que quelques images de jeu de routine g�n�rale obtenue au cours du jeu pour nous.

Voici sa part, Lei Feng r�seau AI Yanxishe n'a pas chang� l'intention de l'�dition:

Bonjour � tous, mon nom est Liusi Cong, de Sun Yat-sen laboratoire CIS. Il y a quelque temps nous avons particip� � une Kaggle images au-dessus du satellite for�t amazonienne correspondent, et obtenu de bons r�sultats, et aussi obtenir une certaine exp�rience, donnez-nous aujourd'hui pour partager une partie de notre routine r�sum� de l'image fr�quemment utilis�e du jeu.

Je vais faire une br�ve introduction au jeu, en parlant de quelques-unes des m�thodes communes, comme le mod�le de construction, d'analyser, d'am�liorer et les donn�es de jeu pour am�liorer certains de nos cas. De plus, K fois la validation crois�e dans le jeu Kaggle, que ce soit une m�thode pour le texte ou l'image des jeux concours sont plus couramment utilis�s, je vais parler de la raison pour laquelle nous devons faire aussi bien que la validation crois�e K fois, nous avons divis� le temps de faire attention � ce que K pli il souligne. Ensuite, je dirais que les comp�tences Kaggle concurrence impliqu�s dans l'int�gration du mod�le finira par pr�senter la situation de base de notre �quipe.

Tout d'abord dire � peu pr�s sur ce jeu, beaucoup de gens pensent � tort que, apr�s avoir vu le nom de ce jeu est de faire Amazon, en fait, aucun lien entre les deux. La raison pour laquelle il est appel� l'Amazone � cause de ses images satellites de la for�t amazonienne, nous devons faire est de marquer la t�che de classification sur un certain nombre d'images satellite donn� un total de 17 �tiquettes diff�rentes.

Nous avons r�alis� comme indiqu� dans PPT.

Il y a aussi le r�sultat de notre grille d'analyse.

Alors dire comment construire un mod�le unique.

C'est le plus concentr�, partageant une partie de ce qui est impliqu� dans l'utilisation du cadre fourni par le mod�le de pr�-formation ou votre propre mod�le d'initialisation al�atoire pour construire un mod�le qui implique �galement l'utilisation si le mod�le de pr�-formation, qui peut �tre utilis�. Apr�s cela, je saurai expliquer � peu pr�s comment former un mod�le de base, analyser les r�sultats et l'am�lioration.

D'abord parler Avec le mod�le pr�-formation ou utilisez le mod�le de param�tres d'initialisation al�atoire Ce jeu est un choix diff�rent pour diff�rents. Les avantages du mod�le de pr�-formation est que nous pouvons utiliser les param�tres pr�-form�s sur IMAGEnet, IMAGEnet est un peut �tre au-dessus de la formation, de sorte que les mod�les ensembles de donn�es tr�s volumineux obtenir une meilleure mise � niveau. Mais si nous utilisons le mod�le de pr�-formation, ce qui signifie que le cadre du mod�le sont g�n�ralement le maintien et la formation comme temps de pr�-s�rie, donc faire l'ajustement est relativement faible. Si nous utilisons les param�tres d'initialisation al�atoire pour le mod�le, les avantages sont presque envie de dire comment la fa�on de faire le tour, l'inconv�nient est que nous ne pouvons pas utiliser le param�tre pr�-form� sur IMAGEnet.

Au d�but du jeu quand nous avons fait quelques exp�riences, lui-m�me construit un certain mod�le de param�tres d'initialisation al�atoire et le mod�le pr�-formation, nous avons constat� que les param�tres d'initialisation al�atoire des t�ches de taux de convergence du mod�le jusqu'� pr�sent moins que le mod�le pr�-formation, donc nous sommes de retour le jeu est presque toujours utilis� dans le mod�le de pr�-formation, au moins � ce stade est un mod�le unique.

Apr�s avoir d�termin� la n�cessit� d'utiliser le mod�le de pr�-formation, qui prendra en compte le choix sp�cifique. En fait, presque tous les diff�rents cadres doivent fournir leur propre mod�le de pr�-formation, en plus de certaines communes, il y a quelques diff�rences, un certain mod�le de pr�-formation est seulement un cadre, il y a un certain mod�le de pr�-formation, nous pouvons avoir un plus analyse, nous avons d�cid� de choisir le cadre d'un PyTorch. Nous avons choisi PyTorch car tout d'abord, il est un code relativement l�ger, le type de mod�le de pr�-formation et de fournir plus, nous �crivons, il est �galement tr�s facile, vous pouvez rapidement construire des mod�les, nous sommes essentiellement une �cole il couvre la grande majorit� des mod�les.

Apr�s avoir s�lectionn� le mod�le d'outil peut �galement �tre utilis�, tout est pr�t � former un mod�le. En g�n�ral, nous avons fait un d�but de base, c'est la routine normale, g�n�ralement seulement un mod�le de formation, je peux avoir un sentiment sur ce mod�le. Par exemple, peut �tre form� ResNet18, ce qui est relativement simple. Ensuite, nous avons divis� un peu de jeu de formation, par exemple, la formation de 80%, 20% de la v�rification, puis Adam � faire avec une telle optimisation, ajustons le taux d'apprentissage, vous pouvez probablement essayer de s'adapter � mieux former apr�s ces mod�les.

Au d�but, nous ne savions pas quelle est la port�e du taux d'apprentissage est plus appropri�, nous utilisons 0,0001 cette valeur est un meilleur mod�le de convergence est plus rapide, mais aussi plus stable, le taux g�n�ral d'apprentissage est trop grande, la formation va secouer, alors trop petite, la convergence est ralentir ce processus, nous avons �galement utilis� un outil d�velopp� par l'�quipe Hyperboard, vous pouvez enregistrer les modifications en temps r�el dans le processus de formation de la formation de ces courbes, et l'interface est relativement simple, apr�s une telle formation vers le bas, on peut g�n�ralement obtenir des commentaires, puis faire les r�sultats de l'analyse, apr�s l'ach�vement de l'analyse que nous pouvons consid�rer l'�tape suivante consiste � la fa�on d'am�liorer la formation ou des donn�es.

Nous avons �t� consult�s sur un mod�le plus petit au r�sultat est cela, un mod�le a commenc� � converger tr�s rapidement, puis il commence � surajustement, chute de perte sur l'ensemble de la formation, la validation ensemble anti-croissance de perte. Nous analysons ensuite, et sentir les donn�es d'entra�nement fournis par les seuls 40000 �chantillons officiels, cette t�che est relativement plus faible, plus enclins � surajustement, et nous utilisons un �tre humain a priori pour en faire une des donn�es am�lior�, de sorte que vous pouvez utiliser une partie de l'�chantillon original devient plus de moyens pour eux, puis avec ces donn�es � travers l'�chantillon am�lior�, il y a plus de donn�es, le mod�le est form� pour adapter plus triste. Apr�s la mise en valeur des donn�es pour r�soudre le probl�me de surajustement, nous pouvons commencer � ajuster le mod�le.

R�sout le probl�me des donn�es alors nous pouvons Pensez � utiliser un plus grand mod�le A. La m�thode la plus simple est d'am�liorer les param�tres du mod�le en utilisant un mod�le de pr�-formation plus grande �chelle, une autre est le num�ro de mod�le de changements, il est difficile de faire des changements � la couche de convolution avec un mod�le de pr�-formation.

La plupart de nos changements sont dans la couche pleine de connexion de convolution apr�s couche, nous pouvons changer l'arri�re de la derni�re couche globale Pooling taille de la couche de sortie de convolution, �galement les deux mod�les caract�ristiques de sortie de petits morceaux puis distribu�, fait un grand mod�le. Vous pouvez alors augmenter �galement Batchnorm, d�crochage scolaire, L2, etc., mais ne pas observer ces param�tres ont un impact tr�s important dans le jeu, donc nous ne l'avons pas en arri�re les ajuster soigneusement.

Il sert � d�terminer le mod�le du cadre g�n�ral, l'�tape suivante est plus ennuyeux l'�tape de r�glage des param�tres Voici un param�tre tr�s important est le taux d'apprentissage initial, nous venons de parler du choix d'un tel taux de r�f�rence d'environ 0,0001 � apprendre, mais une gamme d'environ d�termin�e, nous pouvons faire quelques ajustements. L'ajustement du taux d'apprentissage initial, la convergence finale va affecter.

Il y a un lot s�lectionner la taille, essayez de remplir le GPU, est g�n�ralement entre 32-128, et parfois fera une mise au point. En g�n�ral, le processus de formation, puis a chut� dans une certaine mesure du possible, � la convergence compl�te, ou le d�but il y a eu montage, cette fois souvent faire une action est de r�duire le taux global d'apprentissage, qui tend � am�liorer la formation les r�sultats de finition. Lors du r�glage des param�tres, le param�tre r�sultat doit continuer � le faire sortir du dossier, de faire l'analyse et la v�rification, pour voir quels param�tres seraient mieux.

Nous avons presque une douzaine de mod�les d'ex�cuter � nouveau, et quelques ran � plusieurs reprises, nous trouvons ResNet effet est le meilleur, DenseNet effet suivi. VGG, l'effet de lancement presque. Le pire est AlexNet et SqueezeNet, parce que le premier est en effet ancien et les r�sultats sont pauvres, qui font partie du travail de compression, pas beaucoup de param�tres, de sorte que l'effet est pire. Inception v4 et Inception Res v2 est tr�s mauvaise, nous n'avons pas utilis� plus tard. En outre, bien que certains mod�les sont relativement m�diocre dans l'ensemble, mais la diversit� d'entre eux, ainsi que l'Ensemble peut am�liorer les performances.

Ensuite, parler de l'am�lioration des donn�es.

Je vais vous dire ce m�thodes d'am�lioration des donn�es , Il est d'ajuster une luminosit�, la saturation, le contraste. Apr�s ces ajustements, nous pensons qu'il est un nouvel �chantillon. Ensuite, nous devons passer pour un autre �tre humain a priori, nous pouvons voir la vue sur le fleuve d'un peu plus clair, il est une rivi�re, mais nous pouvons obtenir une luminosit� et diff�rent de l'�chantillon initial.

Ensuite, il y a aussi couramment utilis� au hasard recadrage d'une image, vous pouvez voir apr�s la coupe en entr�e, mais dans ce jeu, nous ne sommes pas all�s cette technologie, parce que nous consid�rons qu'il ya des images, si pour faire une coupe al�atoire, la figure certaines caract�ristiques peuvent �tre mis � l'int�rieur de la coupe.

Ensuite, il y a l'�chelle al�atoire, retournement horizontal / vertical, rotation, brouiller l'image, ainsi que le bruit gaussien, etc., ce sont m�thode tr�s courante, mais pas tous conviennent.

Pour toute t�che, nous devons choisir un bon donn�es pour am�liorer la situation r�elle. Bonne am�lioration des donn�es devrait �tre ceci: Reinforced images doivent �tre aussi pr�s de la distribution originale. Pour ce jeu, nous avons principalement utilis� est de retourner et faire pivoter ces deux moyens, tels que le retournement autour. Nous tourne alors l'image de 90 degr�s, 180 degr�s, 270 degr�s de fa�on � tourner. Retourner et faire pivoter avec, nous pouvons obtenir une carte de huit angles et de l'image de l'�tiquette ne changera pas.

Dans ce cas, nous avons plus d'�chantillons de formation, ce qui �quivaut � huit fois la s�rie �largie de donn�es, cette m�thode est appliqu�e � ces donn�es pour am�liorer le jeu, mais il ne vaut pas pour tous les jeux. Il faut comprendre la situation r�elle, dans l'ensemble, ne pas d�vier de la distribution originale est trop, puis terminez le meilleur niveau d'origine apr�s am�lioration des donn�es.

Ensuite, il y a l'utilisation r�guli�re d'une am�lioration des donn�es. Cette am�lioration ne vise pas � emp�cher surajustement dans la formation, nous pouvons am�liorer r�ellement les donn�es au moment du test. Nous d�gusterons les huit directions d'une image du test effectu� au moment de la pr�vision, nous pouvons obtenir les r�sultats de huit, puis utiliser les r�sultats de ce huit � aller voter, ou une moyenne pond�r�e de la moyenne ou directement, pour obtenir ce r�sultat g�n�ralement beaucoup plus stable que le sens unique d'origine, ce qui peut apporter une am�lioration �vidente.

La conversation suivante est K fois la validation crois�e.

Tout d'abord, que notre Pourquoi K fois la validation crois�e . Il est un objet de la plus intuitive possible de toutes les donn�es de formation, parce que quand nous avons form�, en divisant souvent 80% des donn�es pour faire l'ensemble de la formation, 20% de l'ensemble de donn�es pour faire le test, assurez-vous que la performance actuelle de g�n�ralisation du mod�le Il n'y a pas de probl�me. Mais cette fa�on, nous avons aucun moyen de v�rifier cette prise sur une partie de l'ensemble de donn�es � former.

Dans la K fois la validation crois�e, nous pouvons mettre les donn�es dans l'original Koff, est un exemple ici, nous mettons en cinq parties, chacune avec quatre parties qui font alors l'ensemble de la formation, le reste du travail comme un ensemble de validation, tels �taient cinq fois, nous pouvons former � nouveau avec l'ensemble des donn�es d'origine, puis a remport� cinq mod�les, leurs r�sultats et faire une moyenne, et que cela est en fait la moyenne des r�sultats sur l'ensemble d'apprentissage sont form�s r�sultats. Nous formerons assemblant les r�sultats peuvent �tre int�gr�s pour pr�voir les �l�ments suivants hors fois les donn�es.

Un autre point est alors Pliez la division de K exactement ce qu'il faut faire attention �. Les principaux points sont les suivants: Premi�rement, les �quipes partagent la m�me division interne, le second est un mod�le unique de la sc�ne et le stade int�gration du mod�le � utiliser la m�me division, le troisi�me est divis� en ensembles de formation et de validation pour �tre compatibles avec la formation et de test divis� fa�on ; Quatri�mement, le num�ro du r�gime plus d'escompte, plus la consommation de puissance de calcul, il est n�cessaire de voir si les ressources informatiques suffisantes, le cinqui�me, la quantit� de suffisamment de donn�es, vous ne pouvez pas utiliser la division K pli.

Le bouquet final est le mod�le int�gr�.

Mod�le d'int�gration en g�n�ral le jeu sera utilis�, il est un aspect tr�s important. Position dans l'image du jeu est relativement correspondent pas � ceux du texte si important, parce que le jeu d'image, nous sommes principalement utilis�s dans les r�seaux de neurones de convolution et autres, n'a pas une diff�rence particuli�rement importante entre ces mod�les.

am�lioration Ensemble principalement pour former certains des meilleurs mod�le unique, afin de rendre la finale � mieux int�grer, et dans certains textes comme le jeu, il peut utiliser une m�thode d'apprentissage en profondeur, certains utilisent des m�thodes d'apprentissage traditionnelles certains ont besoin d'ajouter manuellement quelques fonctionnalit�s que la grande diversit�, le plus souvent dans la phase d'int�gration du mod�le du jeu, vous pouvez apporter grandement am�lior�e.

Nous avons utilis� diff�rentes �tapes dans les moyens de jeu un mod�le d'int�gration diff�rent, comme l'ensachage moyenne, ensachage Ensemble de s�lection, ainsi que l'attention Stacking, Attention Stacking est une chose de notre propre parti, les r�sultats �taient bons.

Ensuite, parler entr�e d'un �chantillon phase d'int�gration du mod�le , Comme le montre le PPT, pour un �chantillon, chaque mod�le peut pr�dire les r�sultats de 17 classes, si nous avons cinq mod�les, alors nous pouvons obtenir cinq ce r�sultat, nous pouvons les mettre ensemble pour lutter contre obtenir une courbe de probabilit�. Ensuite, la fa�on la plus simple et brut est de prendre un r�sultat direct de la moyenne, le r�sultat final. C'est notre fa�on pr�coce, tous les mod�les ont le m�me poids, le mod�le de la matrice de probabilit� ainsi que plusieurs moyennes dimensions.

Attendez que le terme moyen, nous avons utilis� un peu mieux Ensachage Ensemble Selection M�thode. Son avantage est que chaque mod�le a un poids diff�rent dans le processus de s�lection, certains mod�les peuvent �tre s�lectionn�s � plusieurs reprises, et certains mod�les ne peuvent pas �tre �lues � la fois, en fonction du nombre s�lectionn� en tant que le poids, le long de mod�le de matrice de probabilit� dimension moyenne pond�r�e. Par exemple, nous choisissons d'abord les trois meilleurs mod�les, respectivement 12345, puis ajouter au m�lange, dont l'effet meilleur look. Cette m�thode est relativement simple et brut, le processus ne comporte pas de validation crois�e.

Nous utilisons un stade ult�rieur Stacking C'est une performance peu plus fort. Chaque classe de chaque mod�le a son propre poids, c'est en fait une meilleure compr�hension, par exemple, un mod�le de performance de classe m�t�orologie est mieux, mais sa performance sur d'autres types de relativement pauvres, comme il il devrait y avoir une cat�gorie de poids plus �lev� sur le temps, sur d'autres types de poids est relativement faible. Nous utilisons diff�rents mod�les de performance dans les diff�rentes classes de performance faire une int�gration.

En g�n�ral, l'�tape d'empilage, une pratique courante est de mettre tous les classificateur de classe de formation unique, puis entrez tout avant le mod�le en entr�e, puis de pr�dire un r�sultat. Nous avons 17 cat�gories, formerons 17 classificateur unique, puis de pr�dire les r�sultats 17. Voici la plus simple directement par une r�gression lin�aire, mais nous avons trouv� facile pour moi de tenir dans le temps de l'ensemble de validation.

Nous avons mis ensuite leur propre un m�canisme relativement simple, � savoir Stacking Attention . Pour chaque cat�gorie, nous devons apprendre autant que le nombre d'un param�tre unique mod�le, puis il l'a fait Softmax, ce qui rend ces param�tres de pond�ration 1, la pond�ration est 1, qui est un poids naturel, vous pouvez mettre les cinq originaux cat�gories en fonction de ce poids moyen pond�r� en poids directement.

Plus tard, nous avons aussi utilis� la r�gression logistique, Ridge r�gression � faire l'empilement, on trouve sur l'ensemble de validation des r�sultats Attention Empilement �taient meilleurs, mais en raison de contraintes de temps, ne fait pas une quantit� suffisante d'exp�riences comparatives. Ils doivent mentionner, peu importe comment int�grer ces mod�les font, dans cette image le jeu devrait avoir un meilleur mod�le unique, mais aussi d'avoir la diversit�, tel ensemble est logique.

Concours Routines parlent, et enfin introduire les composants de base de notre �quipe. Nous avons une �quipe de six personnes, tous les �tudiants de troisi�me cycle de l'Universit� Zhongshan Rong professeur Pan laboratoire de SIC. Ce jeu un total de trois mois, avant m�me occup� avec d'autres projets, le dernier reste environ 20 jours ou si le temps de participer pleinement, alors nous avons probablement pass� 5-6 jours en cours d'ex�cution Titan X, enfin RAN mod�le 64. D�tails du jeu lui-m�me, vous pouvez voir que je connais presque colonne.

Enfin, session de questions et r�ponses.

Q: Qu'est-ce que vos outils d'enregistrement de donn�es?

R: Nous utilisons l'outil de journalisation des donn�es, comme la courbe d'enregistrement est Hyperboard, puis d'autres statistiques utilisent simplement tableau Excel pour enregistrer.

Q: pourquoi ne angle de phase al�atoire d'am�lioration de donn�es, mais avec quatre angle fixe?

R: C'est le contraste, avant que nous avons fait un certain point de vue au hasard, mais a constat� que par rapport � quatre angle fixe, l'Ascension apporte n'est pas �lev�, mais consommera plus de ressources informatiques.

Q: s�lection Ensemble avec le nombre de mod�les?

R: Ensemble de s�lection a pris un temps assez long, de plus d'une douzaine de mod�les � soixante plusieurs mod�les que nous avons essay�, mais plus tard que cette m�thode ne divise pas l'ensemble de validation, nous voulons seulement utiliser l'ensemble de validation Stacking.

Route de la soie

Apprenez � conna�tre la Chine

Dry: Universal Image routine du jeu ont? �quipe m�daille d'or de la comp�tition Kaggle pour vous r�pondre