Hot | ami a vu la version Mona Lisa de Avatar vous?

Technologie AI Revue de presse : Style d'image La migration a toujours été une direction de recherche très intéressant, beaucoup de migration d'image sont une source de préoccupation, comme la migration des couleurs, la migration et la conversion de style de texture. En bénissant les médias sociaux de partage de photos de classe, ces emplois attrayants pour les masses particulièrement évidentes. Certains APP très populaires tels que Prisma et Facetune sur l'utilisation réussie de cette attraction. Dr. deux Zhejiang University et Université de Hong Kong de la science et de la technologie Liu Jing Partager sur reddit style avaient un document sur la migration, ce qui provoque de vives discussions, la pâte originale de reddit, papier https://arxiv.org/abs/1705.01088, Code https: / /github.com/msracver/Deep-Image-Analogy. AI Technology a publié des commentaires sur le papier et compilé comme suit d'origine.

Documents Présentation

Dr Liao Jing équipe présente un nouveau style de la technologie de migration de profondeur d'image appelé contraste de l'image, l'image après la migration technique peuvent devenir des styles différents des autres images, mais en fait, ils ont la même structure sémantique. Grâce à cette technologie de migration de style, ils peuvent définir la couleur, le ton, la texture, le style et d'autres informations visuelles à migrer d'une image à une autre image. Illustration, tels que les dossiers de la même scène, par la peinture ou un croquis, vous pouvez également prendre des photos, peuvent migrer entre les deux styles. Leur technologie peut être trouvé sur les deux images correspondent sémantique denses, la mise en uvre est la « comparaison d'image » et la profondeur du réseau de neurones de convolution pour faire correspondre les caractéristiques extraites sont fusionnés, ils ont appelé le contraste de l'image de profondeur technique. Ils ont utilisé de gros à la stratégie fine pour calculer le champ voisin le plus proche. Ils ont également démontré la large applicabilité de leurs technologies proposées, comme le style - migration texture, la couleur - interchangeable style croquis dessin - la migration de photos.

Comme indiqué plus haut, le terme fait référence à la même structure sémantique ayant deux graphiques similaires éléments visuels avancés identifiables, l'équipe technique Dr Liao Jing correspondance dense proposée peut être établie entre les deux images éléments visuels, qui elle fournit la base pour la migration de style. Et cela correspond à l'utilisation de la philosophie est dense « contraste de l'image » (mapping peut être dense dans différentes zones de l'image). champ O en termes de calculs récents, ils élargissent l'algorithme de PatchMatch, sa reconstruction afin qu'il puisse être appliqué aux caractéristiques sur le terrain. Les résultats finaux indiqués ci-dessus, A et B sont similaires, mais il existe des différences significatives dans le style, la finale B «style migré pour générer A A « et A migre au style B » généré B.

Pour résumer la méthode implique généralement trois tâches. Tout d'abord, la migration des attributs visuels, a beaucoup de travail dans ce sens, y compris la migration de la couleur, la migration de la texture. migration Style contraste de l'image. Mais ces scénarios sont le travail spécifique, et de l'équipe Dr Liao Jing est plus généralisée. En second lieu, correspondant à dense, dense correspondance a été trouvée entre les deux images est un problème fondamental dans la vision informatique et des graphiques. Le procédé de mise en correspondance initiale est conçue pour l'adaptation stéréo, flux optique et l'enregistrement de l'image. Ces méthodes peuvent être informatiquement intensive sur le terrain correspondant, mais ils supposent que l'uniformité de la luminance et le mouvement local, et peuvent être difficiles à gérer le problème de l'occlusion. En troisième lieu, la migration du style de neurones, les jumelant à utiliser l'algorithme utilise la profondeur de fonction est la profondeur du réseau de neurones de convolution généré, la profondeur de ces caractéristiques démontrées dans une tâche de reconnaissance avancée, ils peuvent mieux représenter l'image. DeepDream a récemment essayé de générer un travail artistique avec CNN. Cela a un effet inspiré sur la conversion de style nerveux, il a été récemment avec succès CNN (VGG-16 pré-formation) appliquée au style et la texture migration de migration.

Les résultats montrent

Dr Liao résultats de l'équipe Jing dans toutes sortes de convertir une partie de l'émission sont les suivantes:

Photos Photos Turning

photos Huzhuan

Photos Transformez vos photos

Migration entre photo

discussion sur Reddit

La pâte fait débat chauffé sur reddit, AI Technology Review choisir la part des utilisateurs point de vue et poser des questions:

  • DOZENS_OF_BUTTS: Ce style d'image migrate refroidissent très, il n'y a pas d'autres exemples.

  • e_walker: Oui, joindre un lien: https: //liaojing.github.io/html/data/analogy_supplemental.pdf

  • DÉCONNECTÉ: Comment ça et cycleGAN Quelle est la différence?

  • tdgros: Cette technique implique que les réseaux de neurones, car ils utilisent seulement VGG19 fonctionnalités pré-formation de base. Ils sont utilisés d'une manière NNFS image reconstruite multi-résolution sur chaque échelle. Ainsi, la technologie ne soit pas sur la formation et l'utilisation des images aléatoires.

    CycleGAN est un PixToPix similaire de GAN, qui, lorsqu'il est converti pour maintenir la cohérence « dans les deux sens », de sorte qu'il est formé sur un ensemble de données particulier et utilisées pour accomplir des tâches spécifiques.

  • jonny_wonny: Quand peut fonctionner avec une transition animée?

  • madebyollin: Ils complètent le matériel déjà mentionné, étant aucun moyen d'obtenir la version animée, parce que le modèle est une correspondance exacte pour le contenu de la géométrie. Vous devez donc être renforcée par une variété de système de segmentation sémantique pour reconnaître la région associée sémantique, et ces régions peut être un cas de mise à l'échelle (segment d'entrée, il peut être mis en rotation, problème à l'échelle).

  • DÉCONNECTÉ: Si vous pouvez gérer un, vous pouvez alors envisager l'utilisation de la vidéo. Vous pouvez également besoin d'optimiser un certain point, mais il devrait bientôt être en mesure de trouver une version merdique, mais la version inférieure de la vidéo résultante peut prendre beaucoup de temps à rendre.

    Mais cette opération montre vraiment, pense que nous serons bientôt en mesure de voir la version animée de Seinfeld, mais peut être un style Pixar, le style de l'Ouest Anderson, le style de Tim Burton, le style Rick et Morty, expédition de style, de l'argile style d'animation et tout ce que vous pouvez penser à un style, bunker.

  • Boba-Black-mouton (à l'étage de retour): Cette difficulté est grande, parce que vous voulez garder la continuité inter-trame.

  • Noncomment (de l'étage de retour): Ce travail est à noter qu'il ya beaucoup d'endroits, comme arrière-plan et de premier plan fusion anormale d'objets en mouvement pour bloquer l'arrière-plan, résoudre complètement ces problèmes ne peuvent compter que sur les réseaux neuronaux meilleure compréhension de la géométrie 3D.

  • hristo_rv: Quand puis-je demander sur votre appareil mobile?

  • e_walker: Nous envisageons comment le rendre plus efficace. Il y a deux goulots d'étranglement: la recherche pour le fragment correspondant de profondeur NNF et déconvolution. Le premier peut utiliser une certaine recherche existante optimiseur solution NNF (par exemple, en réduisant la caractéristique de quantification du canal). Cette dernière solution peut être considérée comme exhaustive déconvolution optimisée. Il y a encore beaucoup de travail à faire.

  • DÉCONNECTÉ: Est-ce que le passé des travaux pertinents et quelle est la différence?

  • e_walker: Il y a deux différences majeures: Tout d'abord, les méthodes précédentes se pencheront principalement sur l'appariement statistique global (par exemple, en utilisant la matrice Adam), mais cette méthode est considérée comme appariement sémantique plus partielle (par exemple, les yeux et les yeux en conséquence). D'autre part, l'approche est plus généralisée, il y a quatre principales directions d'application: Transformez vos photos d'autres styles, la conversion du système entre autres styles, d'autres styles tournent, photos de transfert de photos.

  • DÉCONNECTÉ: Je veux vous demander est de savoir comment traiter les détails de ces cheveux?

  • e_walker: Ces détails ont une caractéristique de réponse à haute fréquence de la couche de VGG à échelle, tels que le Relu2_1, Relu1_1. Notre approche est basée sur la correspondance à plusieurs niveaux et de reconstruction, des informations sur les différentes fréquences sera progressivement rétablie.

  • rasen58: Je pense que la différence de ce style avant la migration où?

  • e_walker: correspondant sémantique migration de style local a été un problème plus difficile. Cette méthode a besoin de trouver une correspondance locale entre les différents styles image précise, comme face à face, arbre arbre. Et notre méthode peut être divisée Migrate, mais aussi pour la migration de couleur, la commutation de la division, image conversion photo.

Dr Liao équipe Jing a présenté la technologie au concept de « analogie d'image » est appliquée à l'espace profond pour trouver des caractéristiques denses correspondent sémantiquement significative. Cette méthode est supérieure à la méthode précédente, et la méthode d'application plus large. Ils croient que l'infographie méthode et vision par ordinateur sont très utiles pour ceux qui travaillent dans la fonction de la sémantique correspondante.

Ce sont les technologies de l'IA examen interprétation reddit de la pâte originale.

Vous voulez en savoir plus sur la vision par ordinateur?

Bienvenue à cliquer sur « texte lu »

Ou Lieu communautaire AI Yanxishe ~

Quelle est la différence et MAX Plus, vous dire deux nouvelles machines
Précédent
Pèlerinage ira? ! Parc d'Apple assez ouvert officiellement pour vous de jouer toute la journée!
Prochain
Un mot visage ignorant forcé Dafa, je ne sais pas le mot au vif
Buick exposition GL6 sera alimenté par une nouvelle configuration de maille de sécurité intelligent
ZTE Axon 10 Pro 5G officiellement publié, Xiaolong 855 + 48 millions écran principal de la caméra + empreintes digitales
Peau de vache lui-même cru, soufflés Legendary Pictures acquis grâce à idée TVB?
Google Pixel 3 tir des preuves annonce officielle: imagerie est toujours forte
chaussures de verrouillage de luxe sont ASSC « cercle rose »? ! Ce spectacle pantoufles roses vous l'acheter?
Le défendeur, les personnes disparues, veulent acheter Legendary Pictures de TVB, était ces « barbares »?
Trois ans plus tard, la voiture à l'essence de l'éthanol, qui ont un effet sur nous?
Sony Xperia 1 sortie, 21: 9 écran poulpe 4K + 855+ Xiaolong prise après trois domicile
Lindsay avec des paroles, ont été écrit Leslie Faye Wong Eason Chan Miriam Yeung dans les quatre chansons différentes
11 double récompense ce que vous envoyez, trois téléphones mobiles pour comprendre la prochaine
essai routier Ruqierzhi Bao Wo BX520TGDI type automatique