Une br�ve histoire du style d'image de migration (Neural style)

Les lecteurs pour: pas d'exp�rience ou ont un apprentissage de la machine et les lecteurs int�ress�s par les principes derri�re l'application Prisma et similaires. Les lecteurs plus exp�riment�s peuvent se r�f�rer � des citations directes � la fin de l'arbre technologique pour lire l'article ci.

Temps de lecture: 10-20 minutes

Note: sur la carte, s'il vous pla�t attention � la circulation.

Migration de style d'image arbre tech

Avant-propos: Quelle est la migration de style d'image?

Tout d'abord sur un ensemble de graphiques � barres. Chacun des tableau ci-dessous est un style diff�rent. En tant que les professionnels non-art, je ne tire aucun style artistique est, tout le monde a le point de vue de tout le monde, certaines choses sur le monde de l'art n'a pas clairement d�fini. Comment faire une image de style dans une autre question de style encore plus difficile � d�finir. Pour les programmeurs, en particulier pour les programmeurs d'apprentissage de la machine, cette d�finition vague est tout simplement un cauchemar. En fin de compte comment dire ne peut pas dire une chose dans un programme ex�cutable, il est en proie par le probl�me de nombreux chercheurs aspects migr�es de style d'image.

Avant les r�seaux de neurones, programme de migration de style d'image ont un point commun: un certain type de style, analyse d'image, et de lui donner un style cr�e un mod�le math�matique ou statistique, puis changer l'image de la migration faire mieux en mesure de r�pondre � la mod�le �tabli. Faites-le hors effet est bon, comme le montrent les trois chiffres suivants, mais un gros d�savantage: Un programme de base ne peut faire un certain type de style ou une certaine sc�ne. Par cons�quent, sur la base de l'application pratique de la recherche sur la migration traditionnelle est tr�s limit�e.

Voir la migration de temps les photos

Chang� le statu quo est deux documents Gatys, avant que le programme d'imiter une peinture une image ne peut pas �tre imagin�s.

Les premiers algorithmes de migration de style d'image bas�e sur les r�seaux de neurones, le temps de g�n�ration: 5-20 minutes

Dans cet article, vous ne verrez pas des formules math�matiques, si vous voulez une compr�hension plus d�taill�e des math�matiques qui peuvent ensuite lire les documents originaux. Je veux parler d'essayer de repartir � z�ro, de Gatys et al., 2015a et Gatys et al., Histoire 2015b de quelques-uns de la technologie utilis�e dans le d�marrage avec, la meilleure fa�on de rendre le style clair bas� sur l'image du r�seau de neurones de la migration Quelle id�e est et pourquoi Gatys peut penser � utiliser des r�seaux de neurones pour r�aliser la migration de style d'image.

Si vous, alors, je vais continuer � �crire � ce sujet des progr�s sur un certain nombre d'int�ress�s style Neural derni�res recherches ou �tudes li�es � un autre type de g�n�ration d'image, contre le r�seau et similaires. Il n'y a pas de lieu o� une �criture d'erreur s'il vous pla�t ne h�sitez pas � me corriger.

Neural Style de yuans il y a 20 ans il y a 3 ans

Pour comprendre ce que l'image d'un style d'ordinateur qui ne peut �tre attribu�e � l'�tude en 2000 et ant�rieures images de g�n�ration de texture. Il est �vident que l'article de la migration d'image de style, pourquoi il vient d'imaginer la texture? Ici, je voudrais garder le secret il.

Je comprends qu'en 2015, tous les papiers sur la texture de l'image sont la mod�lisation manuelle (tel que le mod�le A Texture Parametric bas� sur les statistiques conjointe du complexe Wavelet Coefficients), l'un des plus id�e importante est utilis�e: Texture mod�le statistique peut �tre utilis� pour d�crire l'image caract�ristique locale. Sans cette condition pr�alable � tous les mod�les de la question. Quelle est les caract�ristiques statistiques de celui-ci, il suffit de donner la ch�taigne

Cette image peut �tre appel�e texture de ch�taignes, la texture a cette caract�ristique est que tous les marrons ont des ouvertures, repr�sente une ouverture avec un mod�le math�matique simple, alors, est un arc d'environ deux arcs qui se croisent bien, statistiquement jusqu'� cette texture est dit que la probabilit� de deux arcs qui se croisent arc de relativement grande, ce qui peut �tre appel� caract�ristiques statistiques. Avec cette pr�misse ou une id�e apr�s le succ�s des chercheurs utilisant des mod�les math�matiques sophistiqu�s et des formules pour r�sumer et g�n�rer une certaine texture, mais apr�s tout, du temps de mod�lisation manuelle, (populaire pour dire, imaginez un calcul math�matique ouverture manuelle des ch�taignes mod�le, a calcul� le mod�le peut �tre appliqu� en plus sur les pistaches sur une vaine ...) n'�tait pas pr�sent dans le calcul de la puissance et fort t�l�phone mobile, la lenteur des progr�s de la recherche dans ce domaine, donc dix ans plus tard.

Les premiers r�sultats de la g�n�ration de texture

En m�me temps, la migration suivant le style de l'image de la porte est pas beaucoup mieux, encore pire que la g�n�ration de texture. Parce que la g�n�ration de texture, peu importe quel genre de texture pour g�n�rer au moins appel g�n�ration de texture, cependant, le style d'image migr� dans ce domaine n'�tait m�me pas un nom propre ne sont pas, parce que chaque algorithmes de style sont des tubes de chacun, et il n'y a pas grand-chose entre eux en commun. Tels que la migration peinture � l'huile, qui utilise sept �tapes diff�rentes et caract�ristiques d�crites migration peinture. Un autre exemple est l'image de la migration dans le style utilis� dans les trois �tapes � la migration d'une sorte d'avatar style de la photographie � l'autre. Pas plus de dix �tapes dans un lourd genre de style peut �tre vu dans la recherche de traitement d'image en 2015 sont essentiellement se battre entre eux, crissant l'algorithme n'a pas caus� de l'attention. Bien que le contraste Photoshop pour la retouche manuelle, mais plus utile que la plupart des algorithmes.

Avatar de style Migration

Peinture � l'huile de style migration

En m�me temps, un des plus grands progr�s de la recherche informatique dans le domaine peut dire de l'infographie. (Cela a des connaissances pertinentes peuvent ignorer la lecture apr�s aucun effet.) Simple, l'infographie est maintenant la base de presque tous les jeux, que ce soit son petit ami 1 (champ 1) dans une guerre � l'arri�re des sc�nes de bataille, ou FGO comme Voyage � la main, le travail et en fin de compte, derri�re les g�n�rations de chercheurs graphiques. Dans leur journ�e et la nuit pour �tudier comment rendre le programme dans le papier soeur pour devenir chair et de sang comme le point temporel des points d'arbre technologique sur une branche importante: la carte graphique (GPU). Depuis le d�but de la machine de jeu venait d'�tre n� avec la carte vid�o. fonction de traitement graphique est bien s�r les images maximum et d'affichage. Contrairement � la CPU, CPU d�but monothread, � savoir que g�rer une t�che, le GPU peut g�rer plusieurs t�ches � la fois, bien que la vitesse des t�ches individuelles et la capacit� de traitement de la CPU beaucoup de diff�rence. Par exemple, un 128x128 jeu Super Mario, le traitement du processeur, chaque image doit ex�cuter ho 128x128 = 16384, tandis que le GPU peut �tre calcul�e comme tous les pixels en m�me temps, un seul pas de temps, beaucoup plus rapide que le CPU. Afin de rendre le jeu plus en plus proche de la r�alit�, les graphiques au cours des 20 derni�res ann�es est devenu de mieux en mieux. Par co�ncidence, la croissance explosive de puissance de calcul de la carte graphique directement conduit � la mont�e de la r�surrection et de l'apprentissage en profondeur du r�seau de neurones sont plac�s le jeu plus d'une d�cennie, les similitudes que les r�seaux de neurones et des graphiques de jeux informatiques est � la fois de grandes quantit�s de donn�es doivent �tre r�p�t�es seul calcul. Si vous ne pouvez pas dire que l'industrie du jeu est pas une �tude approfondie, il n'y a pas de style Neural. Donc, je voulais apprendre � venir vapeur apprentissage machine acheter acheter support achat pour la recherche graphique (par erreur).

reconnaissance d'objets IMAGEnet en utilisant un an num�ro de comp�tition par �quipe GPU apr�s ann�e, le taux d'erreur est en baisse

Je voudrais mentionner le r�seau de neurones un peu parler de r�seaux de neurones (en particulier du r�seau de neurones convolution) et la diff�rence entre les pratiques traditionnelles, doivent savoir que vous pouvez sauter ce paragraphe. r�seau neuronal convolutif divis� en plusieurs couches, chaque couche est r�alis�e en un seul lot de neurones artificiels. Chaque neurone peut �tre consid�r� comme un identifiant, des ch�taignes, alors il est juste la combinaison d'un ou plusieurs de chaque neurone peut �tre utilis� pour identifier une caract�ristique, comme l'ouverture de la ch�taigne. La formation avant qu'ils ne soient au hasard, et par cons�quent ne peut pas le faire, le processus de formation, ils seront automatiquement transform� en un identifiant diff�rent en combinaison avec l'autre et, apr�s un grand nombre de combin� peut reconna�tre reconnaisseur l'objet. En plus de r�gler l'ensemble du processus et des param�tres de conception du r�seau de neurones du d�but de l'autre enti�rement automatique. Ici, nous ne pr�sentons pas les r�seaux de neurones (r�seau de neurones) et r�seau de neurones de convolution (Convolutif Neural Network) sp�cifiquement la fa�on de travailler, si le travail ne comprenait pas comment sp�cifique pour les r�seaux de neurones, je crois que l'Internet a beaucoup, beaucoup li�s � l'introduction et tutoriel, les parties int�ress�es peuvent aller � savoir, ne comprennent pas ne modifie pas la lecture de cet article.

Circonvolution r�seau de neurones Legend

Neural style de yuans il y a 1 an il y a 3 ans

2012-2014, quand le feu a commenc� l'apprentissage en profondeur, une des principales causes de l'incendie est parce qu'il a �t� trouv� l'apprentissage en profondeur peut �tre utilis� pour former le mod�le de reconnaissance d'objets. Certains mod�le pr�c�dent de reconnaissance d'objets avec des parties diff�rentes de la g�om�trie de l'objet et la comparaison afin d'identifier, selon une certaine couleur, selon une mod�lisation 3D, selon certaines caract�ristiques locales. algorithme de reconnaissance d'objet classique est une valeur que, selon mention de l'objet de comparaison des fonctionnalit�s locales est identifi�e, qui fonctionne comme suit:

Par exemple, notre objectif est de trouver la personne dans l'image:

L'objet cible

Pour ce programme est un groupe de personnes pixels Eh bien, il ne peut lui ordonner de trouver les mots pour comparer un pixel, puis revenir au plus proche (voisin le plus proche). Mais en r�alit�, la forme de la couleur de l'objet changera, si seulement celui-photo � port�e de main, allez directement � la vitesse et la pr�cision est trop faible. Certains chercheurs pensent que cette photos individuelles peuvent �tre divis�s en plusieurs petits morceaux et un morceau de comparaison (m�thode appel�e sac de fonctionnalit�s). Enfin, le nombre de blocs d'une r�gion similaire mis en place cette zone balis�e. L'avantage de cette approche est que m�me un petit morceau d'identifier un probl�me, il y a d'autres morceaux peuvent �tre identifi�s comme la base, le risque d'erreurs est consid�rablement r�duit qu'auparavant.

Sac de Caract�ristiques

Le plus grand inconv�nient de cette approche est qu'elle est consid�r�e comme un petit morceau de pixels et les valeurs de pixels selon la comparaison, les r�sultats des changements mentionn�s pr�c�demment en changeant la forme de la lumi�re sur l'objet ne peut pas �tre reconnu simplement question n'a pas �t� r�solu.

Faites convolution la th�orie des r�seaux de neurones et reconnaissance d'objets est en fait pas tr�s diff�rent sac de caract�ristiques, Juste une fonction utile (fonction) sont mont�s � l'int�rieur du r�seau de neurones . Il suffit de mentionner le r�seau de neurones form�s extraira automatiquement les plus fonctionnalit�s utiles, il n'est plus seulement une simple caract�ristique de l'objet d'origine un petit morceau d'un petit morceau de produit de coupe, mais choisir la meilleure fa�on d'extraire le r�seau de neurones .

Convolution r�seau de neurones caract�ristiques extraites sch�matique, chaque cellule repr�sente un neurone est activ� dont la plupart image.

L'un d'une convolution de reconnaissance d'objets r�seau r�seau de neurones a �t� appel� est VGG19 le plus c�l�bre, structur� comme suit:

Structure de r�seau VGG19

Chaque couche de la couche de sortie du r�seau de neurones va �tre davantage extrait � l'aide des fonctions plus complexes, peut �tre utilis� jusqu'� ce que le complexe d'identifier l'objet, Par cons�quent, chaque couche peut �tre consid�r�e comme un certain nombre d'extracteur de caract�ristiques local . la pr�cision de reconnaissance d'objets VGG19 jet� devant une grande partie de l'algorithme, apr�s les syst�mes de reconnaissance d'objets de base utilisent un apprentissage en profondeur.

En raison de l'excellente performance VGG19, il a caus� beaucoup d'int�r�t et de discussion, mais interne sp�cifique VGG19 faire vraiment difficile � comprendre, parce que chaque param�tres internes de neurones juste un tas de chiffres. Chaque neurone a des centaines de plusieurs centaines d'entr�es et de sorties, pour distinguer clairement une relation entre un neurone et le neurone difficile. Donc, quelqu'un est venu avec une fa�on: Bien que nous ne savons pas comment les neurones travail, mais si l'on sait son �tat d'activation, ne sera pas en mesure de comprendre les r�seaux de neurones plus d'aide? Donc, ils ont fait une proc�dure (m�thode appel�e propagation de retour, et les m�thodes de formation du r�seau de neurones du m�me, mais en sens inverse les images g�n�r�es.) Correspondant � chaque neurone peut l'activer dans l'image pour d�couvrir, avant que extraction de caract�ristiques est une vue sch�matique de la bande ainsi produite. Il �tait plus loin, penser, eh puisque nous pouvons trouver des conditions pour activer un neurone, il peut mettre tous les neurones sur le � chien � pour trouver, de sorte qu'ils sont tous activ�s, puis la recherche d'un r�seau de neurones dire look � chien � comme beaucoup plus est ce fait ?:

R�seaux de neurones chien imagin�

Ceci est un r�seau de neurones a imagin� le look plus chien parfait, tr�s psych�d�lique, peut se sentir une faction a pr�sent� un style d'art sur. Et toutes les images peuvent l�g�rement modifi�e de sorte que le r�seau de neurones produit l'illusion que le programme de chien est appel� r�ve profond.

r�ve profond

ann�e Neural style

Avec autant de literie, tous les �l�ments ont �t� mis en place, les arbres pr�-technologie ont �t� allum�s, enfin en mesure d'obtenir � la. La migration du style d'image bas�e sur le r�seau de neurones fait en 2015 par le Gatys et al dans deux documents: Gatys et al, 2015a et Gatys et al, 2015b ... Commen�ons par le premier chapitre. La premi�re texture de l'article par rapport � l'algorithme de g�n�ration pr�c�dente, l'innovation est une seule: elle donne une m�thode pour mod�liser la texture de l'apprentissage en profondeur � l'utilisation. Avant peut �tre d�crit une hypoth�se importante en mati�re de texture g�n�ration de texture par le mod�le statistique local et la m�thode de mod�lisation manuelle est trop lourd. Ainsi, le papier peint Gatys regard� la reconnaissance d'objets, on a constat� que VGG19 blanc regroupez pas fonction locale est incorrect reconnaisseur. Il r�seau pr�alablement form� pour prendre le relais et a vu que ces identifiants tr�s facile � utiliser. Donc Gatys mis en place avait une d�terminant de gram oublier la pertinence de ces diff�rentes caract�ristiques locales, le transformant en un mod�le statistique, donc il existe une m�thode sans mod�lisation manuelle peut g�n�rer des textures.

Les algorithmes de g�n�ration de textures bas�e sur le r�seau de neurones

En fait, de la texture � l'image style're � deux pas. La premi�re �tape est plus �tonnant, se trouve Gatys La texture peut d�crire le style d'une image . Strictement parlant arts lib�raux style est seulement une partie de l'image, mais ne porte pas sur la diff�rence entre la texture et le style, puis de donner l'impression au premier coup d'il est vraiment la m�me chose. La deuxi�me �tape est Comment extraire le contenu de l'image et ne comprend pas le style graphique . Ces deux points est son deuxi�me document � faire: Gatys a vol� paresseux, le mod�le de reconnaissance d'objet une chance de l'utiliser � nouveau, cette fois de ne pas prendre Gramian consid�r� comme un mod�le statistique, consid�r� comme directement aux caract�ristiques locales similaires contenu de l'image, de sorte que vous obtenez un contenu d'image et le style graphique (cela signifie la texture) des syst�mes s�par�s, le reste est une image du contenu et le style d'une autre image ensemble. En collaboration avec la m�thode de sorte que le r�seau de neurones est l'approche � r�ve � a �t� mentionn� pr�c�demment un chien, qui est, les chercheurs jouent sur r�ve profond, trouver une extraction de caract�ristiques appropri�e permet neurones sont activ�s image peut �tre.

Migration de style d'image bas�e sur le r�seau de neurones

� ce stade, nous allons nous concentrer sur l'interpr�tation de l'image en fonction de la migration de style des r�seaux de neurones (style Neural) est clair. Chaque pas en arri�re sont le r�sultat des �tudes ant�rieures, non pas parce que le nom de la profondeur Li Dai ah ah r�seau de neurones et d'augmenter le sentiment de ce que les cascades, classe sp�ciale. Gatys am�lior�e ne fut mis deux champs diff�rents de moissonneuses-batteuses de recherche en agriculture biologique, a fait un r�sultat �tonnant. En fait, il me surprend le plus est l'esprit et les textures du peuple aurait pu reconna�tre l'image de style co�ncide dans une large mesure. (Et vrai style art est tr�s diff�rent, mais il semble tr�s beau ...) depuis pour am�liorer le style de neurones sont sans fin, o� vous mettez d'abord quelques-uns des dessins, les d�tails techniques pour l'instant n'est pas la table.

L'am�lioration de l'algorithme de migration de style d'image, � gauche: image d'entr�e, dans laquelle: am�lioration avant, � droite: apr�s l'am�lioration. Le temps de g�n�ration: 5-20 minutes

Une pluralit� de style de fusion pr�d�termin�e, le temps de g�n�ration: moins de 1 seconde, le temps de formation: 1-10 heures chaque style

L'un des derniers algorithme de migration en temps r�el dans tous les styles, le temps de g�n�ration: moins de 10 secondes (moins d'une seconde algorithmes sont disponibles, mais pense pas personnellement que cette apparence de bonne mine), le temps de formation: 10 heures

analogie images, temps de g�n�ration: 5-20 minutes

Enfin, cet article n'a rien � voir avec Amway un article de celui-ci, la dette de la recherche (�crit en anglais, savoir les questions connexes presque ici) est ma motivation pour �crire cet article. J'esp�re que vous prendrez plaisir � lire, j'esp�re qu'il ya une capacit� de r�serve de gens peuvent �crire plus populaire texte scientifique. L'�criture mauvaise lacune.

citation

Note: par ordre chronologique Trier de base, plus en plus important avec un ast�risque, ouvrage dans le seul mentionn� dans l'article avait des papiers, plus tard si n�cessaire.

Technologie avant:

Mod�le A Texture Parametric bas� sur les statistiques conjointe des complexes Wavelet Coefficients

hallucination ax�e sur les donn�es de diff�rents moments de la journ�e d'une seule photo en plein air

Style de transfert pour Portraits Headshot

Image stylisation par fi ltrage peinture � l'huile � l'aide des palettes de couleurs

Bas� sur l'image de style r�seau de neurones de la migration:

** synth�se de texture utilisant des r�seaux de neurones convolutionnels

*** Un algorithme de neurones du style artistique

* La combinaison de champs de Markov et Convolutif Neural Networks pour l'image de synth�se

* R�seaux de texture: synth�se anticipatif des textures et des images stylis�es

Une repr�sentation savante Pour Style artistique

Style rapide de patch transfert arbitraires style

* Transfert arbitraire style en temps r�el avec instance Adaptive Normalization

Transfert visuel d'attributs par image profonde Analogie

Lei Feng r�seau est Note: Cet article auteur original Li Jiaming , Contenues dans l'auteur original est Conna�tre presque colonne .

Route de la soie

Apprenez � conna�tre la Chine

Une br�ve histoire du style d'image de migration (Neural style)