TP-GAN permettent percée de génération d'image re, générant face réaliste positive basée sur un seul tir depuis le côté

Zhi Yuan C nouveau rapport

Tout d'abord, regardons cette image ci-dessus, la colonne du milieu est de 90 ° côté photo, vous pouvez voir le côté positif du visage basé sur la photo générée par ordinateur est sur la colonne de gauche ou colonne de droite vous?

La réponse sera dévoilée à la fin du texte.

A titre d'information complémentaire, le tableau ci-dessous est tout généré par ordinateur, qui montre de 90 °, le profil frontal synthétique de 75 ° et 45 ° en vue de face.

Photo synthétisée selon le côté face frontale a été un problème, maintenant, une étude de l'Académie chinoise des sciences Institut de l'automatisation (CASIA), Rui Huang Académie chinoise des sciences et l'Université de l'Université de Nanchang, Shu Zhang, Tianyu Li, Ran Il coopération, pour la première fois pour résoudre ce problème , ils sont soumis à l'inspiration du processus d'identification visuelle humaine, associée à une bonne performance contre réseau de génération (GAN), et a proposé une GAN à double voie (TP-GAN), peut en même temps en question de la structure globale, traiter détail du visage, à des angles différents conditions d'éclairage ont obtenu de bons résultats. De plus, cette méthode est également capable de gérer un grand nombre de photographies de différentes postures.

Les auteurs disent que leur travail est d'utiliser l'image de visage synthétique pour les tâches de reconnaissance d'image première tentative efficace.

Les auteurs ont écrit dans leur papier, leur principale contribution de ce travail réside dans trois aspects:

1) a proposé un GAN comme les humains peuvent considérer la structure de l'information globale et locale, peut être basée sur une seule vue face frontale de l'image, l'image de synthèse est très réaliste et bien préservé fonction d'identité, et peut faire face à un grand nombre de positions différentes .

2) à partir de la distribution des données (formation de combat) pour obtenir une connaissance préalable, la connaissance du domaine et du visage (symétrie, l'identité conservé perte) combiné à partir d'objets en trois dimensions projetée sur l'image en deux dimensions lorsque le manque inhérent de l'information spatiale précise out de récupération.

3) emplacement montre la possibilité d'un « identifié par génération » (reconnaissance par génération), et obtenu les meilleurs résultats dans l'identification d'un grand nombre de positions différentes.

scénarios d'application réelle, identifier les différentes postures pas de bonne solution

Alors que l'ordinateur reconnaît l'image a une pluralité d'ensembles de données de référence au-delà de l'humain, mais le scénario réel, différentes postures pour identifier les problèmes ne sont toujours pas résolus.

Les méthodes existantes peuvent être divisées en deux catégories, l'une est l'utilisation de fonction ou caractéristique d'apprentissage attitude différente peints à la main (fabriqué à la main), l'autre est dédié à obtenir dans beaucoup de différentes poses visage humain (récupérer) une personne positive vue de face, et la reconnaissance du visage avec ce point de vue.

Cependant, étant donné que le premier type de méthode pour faire un compromis entre les mêmes et peuvent être identifiés, ils sont souvent incapables de gérer efficacement un grand nombre de différentes postures.

La deuxième des méthodes de classe, les premières tentatives est la première image en deux dimensions est alignée avec l'identité générale ou exacte du modèle 3D et de rendu des transformations géométriques tridimensionnelles vue de face frontale. Cependant, cette approche quand un grand nombre d'images de différentes postures d'expérience, les textures ont subi des pertes graves, les performances ne sont pas bonnes.

Récemment, les chercheurs ont proposé la profondeur de l'approche d'apprentissage axée sur les données, les estimations du système tout en apprenant vue positif, de distinguer la caractérisation de l'identité et de la posture. Bien que des résultats prometteurs, mais l'image de synthèse manquant de détails, encore une fois, cette approche ne peut pas être très bon pour faire face à un certain nombre de positions différentes, et donc l'image résultante ne peut pas être utilisée pour les estimations de preuves médico-légales ou de propriété.

Plus important encore, du point de vue de l'optimisation, pas complètement observée du côté de la face pour restaurer une vision positive de lui-même est un pas raisonnable et il n'y a pas de problème bien défini. La récupération est fortement tributaire de la qualité du processus de formation préalable de l'image ou des contraintes.

méthode d'appariement classique habituellement apprentissage supervisé (de supervision par paires), introduisant des contraintes très peu (contraintes) dans le processus de formation, conduit donc à l'image de synthèse floue.

TP-GAN: Inspiré par la vision humaine, combinée à une solide performance GAN

Comme la vision humaine lors de la synthèse, nous avons d'abord observé par le profil, dans l'expérience passée / connaissance basée sur la structure inférées de l'ensemble du visage (ou croquis). Nous allons ensuite tourner leur attention sur les détails du visage, comme les yeux, le nez, les lèvres, ces détails va juste sur le projet « à combler. »

inspiré, Les auteurs suggèrent qu'il ya deux chemins d'une architecture de profondeur (TP-GAN), une synthèse d'image face frontale. Les deux chemins, l'un porté sur la structure globale du raisonnement, l'autre est le raisonnement de la texture locale, deux cartes de fonction sont obtenues. Ces deux caractéristiques seront ensemble la FIG, pour la suite composite final.

la structure générale de TP-GAN. Générateur comprenant deux chemins, un traitement de l'information mondiale, un traitement de transformation locale. Synthèse du discriminateur avant (SF) de la vue réelle et une photo (GT).

Non seulement cela, la face avant de l'information sera intégrée dans le réseau de distribution d'une génération contre (GAN), à la suite du processus de récupération a été bien limitée.

GAN performance exceptionnelle dans la distribution en deux dimensions des aspects de modélisation des données (capacité) a grandement amélioré beaucoup de problèmes de vision inférieurs irrationnels, comme super-résolution et la restauration (inpainting).

La combinaison d'une pluralité de perte, la partie manquante synthétique, dans lequel la partie en saillie retenu

Selon la face auteurs est structure symétrique qui présente une perte de symétrie (perte de symétrie), pour la réalisation fait partie obscurcie.

scène difficile. Les traits du visage, y compris la barbe, lunettes, TP-GAN sont conservés. La colonne de droite, l'image ci-dessus est hors de restaurer la joue, au-dessous cette image est le côté invisible de son front, mais TP-GAN restauré avec succès sur son front.

Afin de conserver fidèlement les plus principales caractéristiques d'un visage humain, l'espace caractéristique de compression de l'auteur, en plus du niveau de perte de pixel L1, utilisé également perçu comme une perte (perte de perception).

Enfin, un porte-clés, conservera la perte d'identité (identité en préservant la perte) d'intégration est venu de réaliser la synthèse fidèle de la face frontale, la qualité de l'image a considérablement augmenté.

TP-GAN synthétisé selon les résultats des différentes postures. De gauche à droite: 90 °, 75 °, 45 °, 60 °, 30 ° et 15 °. La dernière colonne est la photo réelle.

Les résultats synthétisés sous différentes conditions d'éclairage. La rangée supérieure est une synthèse des résultats, la ligne suivante est la photographie originale.

Les auteurs notent que ces images sont susceptibles de faire face à une analyse des tâches.

Documents | Au-delà du visage Rotation: Utilisez GAN global et local génèrent la perception réaliste, les caractéristiques de rétention de l'image face frontale

En utilisant une vision réaliste de l'image unique du visage de la face avant a une large gamme d'applications dans le domaine de la reconnaissance faciale. Bien que les études précédentes ont tenté de trouver des solutions à partir d'un certain nombre de données de visage, la profondeur de l'apprentissage qui est axée sur les données, mais les restes de problème difficile, car il est un problème de sa nature irrationnelle (mal posé).

Dans cet article, une génération à double canal contre réseau (deux Pathway générative accusatoire réseau, TP-GAN), alors que la perception par les détails de la structure globale et locale de la vue face frontale réaliste synthétique.

En plus du codeur global commun - décodeur en dehors du réseau, le document présente également le réseau de quatre marques de positionnement (réseaux de raccordement situé historiques) traiter la texture locale. En plus de la nouvelle architecture, nous avons ce problème de irrationnel avait une très bonne transformation, l'introduction de la perte contradictoire (perte contradictoire), la perte de symétrie (perte de symétrie) perte retenue de portefeuille et de l'identité (identité préservant la perte) de. Cette perte peut être une combinaison de pré-formé en utilisant la distribution et la profondeur du modèle de visage de reconnaissance face avant (pré-formés discriminants modèles de visage profonds), de conserver l'identité du raisonnement à partir d'une face de guidage avant comme une vue latérale synthèse. Contrairement aux modèles précédents d'apprentissage reposent principalement sur une méthode de reconnaissance de caractéristique intermédiaire profondeur pour l'utilisation directe de notre méthode de synthèse, l'image est utilisée pour conserver l'identité des tâches en aval, telles que la reconnaissance faciale et l'estimation d'attribution. Les résultats expérimentaux montrent que notre méthode est non seulement visuellement convaincant, mais aussi une variété de reconnaissance faciale au-delà de la meilleure méthode.

Oui, il y a la réponse à une question du début: la colonne de gauche est les résultats du TP-GAN. Avez-vous encore il?

Adresse Papers: https: //arxiv.org/pdf/1704.04086.pdf

27 mars Chi-yuan nouvel éco-sommet open source et la nouvelle technologie AI Ji-won 2017 Business Plan cérémonie de remise des prix du concours a eu lieu, y compris le courant dominant « BAT » AI, y compris les entreprises chinoises, plus de 600 d'élite de l'industrie se sont réunis pour la Chine 2017 le développement de l'intelligence artificielle peint une marque indélébile.

Cliquez pour lire le texte original, l'Assemblée générale examine la version texte Enregistrement

Cliquez sur les liens suivants, Rappelant sa pompe:

  • communauté Ali Yunqi: http: //yq.aliyun.com/webinar/play/199

  • IQIYI: http: //www.iqiyi.com/l_19rrfgal1z.html

  • Artesyn Technologies: http: //v.qq.com/live/p/topic/26417/preview.html

La marque de luxe en Asie du Sud se réunissent ville a ouvert un nouvel hôtel, une piscine entourée de manoir de style européen
Précédent
Un millier de tonnes de russe « soja chinois » après l'arrivée de la Chine, les médias étrangers stocks de soja chinois chaud peut deviner quelques jours
Prochain
Guo Guangchang: Pas d'innovation technologique, les entreprises doivent vivre
Il y a aussi comparable au Japon saison des feuilles! Le long Jiangqiu Jing a été cuit, cuisine de saison à manger non-stop toute la
Rapidement sauver! Drapeau rouge HS7, Chang'an CS85, Po Chun RS-5 ...... un grand nombre de nouvelle voiture a frappé!
C Luoyi Cong Ming mouvement pour gagner les fans de la Juve et la reconnaissance de haut niveau! Il a la capacité de devenir une légende de la Juventus!
Une vague de nouveaux SUV frappé! BMW X5, le nouveau Outlander, Tang 5 ...... sauver!
Allez lire, il peut vraiment rendre les gens plus intelligents!
Les prix du pétrole ont atteint le plus grand gain de sept semaines, les prochaines semaines il y aura quel prix?
Camel horizon, ivre de beauté!
Les nouveaux 327 yuans entrepreneurs en technologie de l'intelligence artificielle de sommet Chi rêve spectacle: Montagne monde de la lumière, Wangguan Chun, Zhou Xi Record lecture (ppt)
Xiaopeng: ventes après-vente Services financiers me faire payer tout le paquet que vous avez des inquiétudes?
Les médias étrangers: dollar américain ou de l'huile va accélérer la fin du nouveau système Woods post-Bretton peut se développer
2018 plaisir de presse annuelle, en regardant les abs rire! Ha ha ha ha ha ha ha