Facebook AI Research Institute a proposé un réseau de confrontation créative CAN, AI ont acquis artistique plus qu'un humain

Lei Feng réseau AI Technology Review par: évolution itérative peut mimer définir la caractéristique du GAN (formule réseau conflictuel) a été reconnu comme une bonne façon de traiter le problème de génération d'image depuis fait un certain nombre de résultats de recherche pertinents à l'amélioration de l'image, super-résolution, tâche de conversion style peut être décrit comme un effet surprenant. (Référence peut être 2017 Valse | générer confrontation réseau (GAN) Revue annuelle de la recherche du progrès - Lei Feng réseau)

GAN pour obtenir l'image super-résolution en utilisant le style et la conversion échantillon

Cette année a également à faire pour tirer parti de GAN chiffre de bâton modèle de conversion d'image pix2pix (Adresse Code adresse https://github.com/phillipi/pix2pix,demo https://affinelayer.com/pixsrv/). En plus de convertir le chat dans la figure ci-dessous, ainsi que des bâtiments, des chaussures, des sacs, le modèle est très imaginatif, juste dessiner n'a pas d'importance, les lecteurs intéressés peuvent tirer leur propre dans une adresse à la démo pour voir.

démonstration de conversion des lignes avec exemplaire Cat

GAN peut produire des uvres d'art de do?

Maintenant qu'il ya tellement la capacité de génération d'image GAN, nous ne pouvons pas générer avec GAN uvres d'art, après tout, de nombreuses uvres d'art modernes pour voir les photos ne semblent pas aussi la complexité, comme la peinture suivante, ultra-réalisme à mentionner.

Mondrian « constituent rouge, jaune, bleu »

Cependant, pour créer une sensation humaine la valeur artistique de l'uvre est pas si simple. Les êtres humains comme des uvres innovantes, les humains ne aiment pas à imiter le travail, « Mona Lisa » et « Pavillon des Orchidées » Seul l'auteur d'origine n'a été reconnue par les trésors artistiques du monde, même si les générations futures de personnes en fonction de leur création, mais aussi il a sa propre innovation, afin d'apporter une nouvelle valeur artistique, afin d'être reconnu par le spectateur.

La structure de base du GAN, le discriminateur D détermine le générateur G soit généré si le discriminateur image D et l'image a été fournie à l'autre et de la même catégorie (caractéristique d'adaptation), qui détermine la sortie de l'image dans le meilleur des cas soit seule une imitation des uvres existantes, en cas d'innovation, sera discriminateur D identifié, ne parviendra pas à atteindre la cible. L'exemple ci-dessus plusieurs GAN sera en mesure de refléter le discriminateur D pour apporter cette fonctionnalité, des uvres d'art produites par GAN manque également destiné d'innovation de fond, la valeur artistique limitée.

Ainsi, nous pouvons faire GAN avoir une certaine capacité d'innovation, de sorte que ces innovations ont une valeur artistique, ces uvres innovantes peuvent également être reconnus par les êtres humains? Art et laboratoire d'intelligence artificielle à l'Université Rutgers, Facebook Institut pour l'intelligence artificielle (FAIR), Département de papier Histoire de l'art coopération trilatérale sur l'adoption du College of Charleston CAN (Creative accusatoire réseau, confrontation créative réseau) Donner une réponse. Sur la bibliothèque de réseau de neurones Keras François Chollet recommande également l'article sur Twitter.

Jetez un oeil à la façon dont les travaux

CAN modèle généré un certain nombre d'uvres d'art

Nous pouvons voir, les uvres résultant de style d'art est très varié, des plus simples aux lignes abstraites complexes ont un niveau de contenu combiné a également la distinction. Les résultats des tests papier également comparer, les travaux générés peuvent non seulement généré plus de GAN, même des uvres sympathiques de l'homme de l'art de l'art de Bâle ne sont pas aussi CAN. (Voir ci-après des données spécifiques)

Comment comprendre l'art de l'innovation

Juste dit, la nécessité d'uvres d'art novatrices, CAN en C est créatif, des moyens novateurs. Alors, comment mesure innovante, comment y parvenir?

Des études antérieures méthode de génération d'images réseau peut être formé à base de GaN, des images de l'homme et des faits objectifs rapport relatif (super résolution, problèmes d'achèvement de l'image), ou (problèmes de conversion de style) de jugement fondé sur l'expérience, utilisé pour mesurer l'effet du réseau, et il y a eu un certain nombre d'algorithmes plus tôt, de sorte que l'humanité comme une boucle de rétroaction de formation pour guider le processus de formation. Mais pour ce besoin d'émission pour concevoir une formation et peut générer automatiquement, mais aussi de mesurer en termes de fonctionnement du système innovants, les méthodes classiques n'atteindraient aucune aide.

Pendant ce temps, de l'avis des auteurs, afin de mimer le processus de création artistique de l'humanité, l'algorithme est de prendre une part très importante du processus de création et les artistes de l'algorithme de l'homme dans les dernières uvres d'art liées à la compréhension de l'homme comme du passé et les arts la possibilité de créer de nouvelles formes d'art ensemble. Afin d'essayer de trouver une mesure de l'innovation, les indicateurs d'innovation participative formation itérative, les auteurs ont recruté un groupe de théorie de l'art.

  • DEBerlyne pense, du point de vue de la psychologie physiologique de la condition humaine, il y a quelque chose appelé l'indice « niveau d'excitation » qui peut mesurer une alerte personne, et plus excité, le niveau le plus bas d'excitation du sommeil, le repos, jusqu'à ce que rage et d'excitation. Les travaux ont un « potentiel de réveil, » les caractéristiques générales, il peut être relevé ou abaissé le niveau d'excitation du spectateur, il est la nouveauté des travaux, les accidents, la complexité, l'ambiguïté et la confusion d'une réflexion globale du niveau, ceux-ci plus la propriété, le travail plus le réveil potentiel.

  • Colin Martindale (1943-2008) a présenté une hypothèse, il croit que, à un moment donné, les créateurs vont essayer d'augmenter leur travail « potentiel de réveil », qui est une méthode utilisée pour créer des bordures élargies. Cependant, cette action doit être augmentée de telle sorte que la réaction négative de l'observateur le plus petit possible (ne pas essayer de faire l'observateur d'effort supplémentaire), sinon le produit serait trop radicale évaluation négative.

  • Colin Martindale a également proposé une hypothèse, il croit que le rôle d'un artiste d'explorer le style plus artistique de l'époque, le style artistique sera convertie renforcer le rôle du « potentiel de réveil » de.

Cette théorie du groupe est d'expliquer seulement une poignée d'innovation artistique en théorie, mais ensemble, ils donnent deux indicateurs ont des itérations de calcul peuvent être utilisés pour la formation:

  • Degré de travail d'innovation et d'innovation est pas trop élevé, le public ne pense pas que le travail est la possibilité d'une uvre d'art doit être aussi faible que possible;

  • Nouveau style d'art est l'incarnation de l'innovation.

  • La construction du réseau CAN

    Selon ces deux indicateurs extraits du GAN sur papier prototypage un nouveau réseau CAN conflictuel.

    CAN modèle de schéma fonctionnel du système

    Tout d'abord, l ' « indice 1: degré d'innovation et le travail d'innovation est pas trop élevé, le public ne pense pas que le travail est la possibilité d'une uvre d'art doit être aussi faible que possible », il peut être converti en réseau conflictuel classique, G engendré image à travers des uvres d'art D formé des juges pour générer une image G est pas de l'art. Ces images générées par le réseau de confrontation peuvent déjà être considérées comme une uvre humaine de l'art.

    Ensuite, le modèle de papier est également basé sur « Target 2: nouveau style d'art est l'incarnation de l'innovation », ajoute une partie de la nouvelle structure pour faire face à un style artistique.

    Le papier utilisé dans 25 catégories différentes avec une uvre d'art d'étiquettes pour la formation de D, contient un impressionnisme abstrait, le cubisme, le modernisme, baroque, style Renaissance précoce, et donc un total de 75.000 pièces. Ensuite, formé D, en plus de commentaires une image « est une uvre d'art », mais aussi des commentaires « peut distinguer entre ce genre d'image style artistique. » G et D utilisent la génération de contre-réaction, autant que possible Difficiles à distinguer image Art Nouveau - difficile de classer la classification actuelle, est l'innovation.

    « Est-ce une uvre d'art », « il est difficile de distinguer le style d'art » sont deux signaux opposés, forcera l'ancien générateur de signal génère une image G peut être considéré comme l'art, mais si elle est visible dans le style de l'art antérieur à atteindre cet objectif, le discriminateur D sera en mesure de distinguer le style artistique de l'image, puis le générateur sera puni. Ce dernier fera un tel signal générateur génère un travail difficile à distinguer le style. Ainsi, les deux signaux peuvent être ensemble, de sorte que le générateur peut explorer les limites de la gamme pour la créativité dans les uvres d'art, autant que possible tout en maximisant les travaux résultant dérivaient dans la mesure du possible le style d'art standard existant.

    Telle est la thèse intitulée « CAN: Creative accusatoire Génération réseaux » Art « par l'apprentissage de styles et écartons de normes de style » qui signifie, la créativité contre le réseau peut apprendre le style de l'art, puis départ de ces art de style existant.

    Dit style artistique, est maintenant « bonne résolution » est « bonne résolution » ne le fera pas?

    Par rapport GAN, peut augmenter la rétroaction «il est difficile de distinguer le style artistique de » la poursuite de l'image générée style artistique Difficiles à distinguer . Bien que la dérivation de la théorie de l'art, le nouveau style artistique est une société innovante, mais comme il est un salaire de rétroaction plus, la recherche de « style artistique image générée Facile à dire « OK? Vous serez également en mesure de générer un bon morceau?

    D'un autre point de vue, si la poursuite de la CAN est bien meilleure « indiscernables » que la poursuite de « facile à distinguer » l'image générée CAN-mieux, alors c'est un modèle raisonnable de choisir le meilleur mode de réalisation de la rétroaction.

    Il suffit de le faire. En plus de la CAN, le document a également établi trois modèles de comparaison.

    • DCGAN 64x64: Après le travail de formation de l'art DCGAN (formule de convolution de la profondeur sur le réseau), la résolution de sortie de 64x64

    • DCGAN 256x256: Par rapport DCGAN 64x64, deux couches de salaire net plus générateurs, la résolution de sortie de 256x256

    • SCCAN: style classification CAN, la recherche de « style art image générée facile de distinguer » la CAN

    Trois modèles générés écran comme celui-ci

    Et deux types écran DCGAN généré SCCAN

    Écran SCCAN généré a en effet été un style reconnaissable, tels que le caractère gros plan, paysage ou portrait de groupe. Mais il ne semble pas la façon agréable et intuitive.

    Regardons un ensemble d'images générées CAN, au-dessus de la plus haute évaluation humaine, au-dessous du plus bas de l'évaluation humaine. Il faut dire que SCCAN image générée était beaucoup mieux.

    Le plus haut et le plus bas de l'évaluation humaine de l'image générée CAN-

    Peut donner l'image d'un être humain à jouer un peu?

    L'image peut être vu juste, l'effet CAN est certainement vrai, l'image DCGAN 256x256 est en fait assez bonne. Peut alors l'image de la vue des gens ne sont pas vraiment la peinture a été difficile de distinguer les créateurs de celui-ci? fonctionne vraiment avec des artistes de rivaliser par rapport à quoi?

    À titre de comparaison spécifique, le papier a fait quelques expériences, de sorte que les différents groupes de l'homme à la notation de travail.

    Les expériences 1 et 2: oeuvres abstraites par Impressionnistes, oeuvres choisies Art Basel, CAN, Image générée DCGAN, un total de quatre groupes de travaux, ces travaux est déterminée par la personne moyenne de l'homme ou de l'ordinateur, et les travaux de marquage.

    Résultats: 1 à 53% des gens pensent que l'image peut d'origine humaine que l'image DCGAN 64x64 du peuple, 35%, l'expérience 2 a été considéré comme l'image CAN de proportion humaine est de 75%, est DCGAN 256x25665%. Résumé des uvres impressionnistes de l'artiste est sans doute la plus forte proportion, mais il est intéressant de noter que les deux expériences dans la pensée proportion des uvres du peuple Art Basel ne sont pas aussi élevés CAN (Expérience 1, 41%, 48% dans l'expérience 2) .

    Les résultats des données 2, que les évaluateurs humains évaluent des uvres sous plusieurs angles, puis déterminer si elle est une création humaine. L'image est le rapport des évaluateurs humains considèrent la création de Q6

    expérience 3 : Que les évaluateurs humains des intentions du degré de la structure visuelle, interactive, inspirant plusieurs angles aux résultats taux Tous CAN score le plus élevé . Ce résultat peut être décrit comme inattendu.

    Expérience 3 Résultats

    expérience 4 : Afin de confirmer le niveau entre les CAN et la nouveauté SCCAN et la performance esthétique, voir Art Shi Xuesheng un groupe d'images ont été évaluées CAN et SCCAN sélectionnés au hasard. CAN penser plus ratio d'image innovante de 59,47 pour cent, pense que le rapport à l'image de faire appel plus esthétique CAN de 60%, il a une différence significative.

    conclusion

    Le document dit que, bien que ce modèle ne peut toujours pas comprendre le concept des aspects sémantiques du style artistique, mais il montre la capacité d'apprendre des uvres d'art passées. Quant à savoir pourquoi les humains peuvent jouer pour marquer dans divers aspects, les auteurs souhaitent également explorer l'air libre avec tout le monde.

    papier originale Adresse: https://arxiv.org/abs/1706.07068, Lei Feng réseau compilé AI Technology Review

    Naughty Dog parle à embrasser détail « le deuxième acte du dernier préavis de nous en
    Précédent
    île fluviale pris au piège voiture quatre mois, ce près de 5 tonnes de « artefacts » pour le sauver à terre
    Prochain
    LED Cinema hâter l'arrivée de l'ère de la première mondiale à l'échelle de 14 mètres auditorium Samsung Onyx premier film installé
    adoption de filles de chiens errants une longue, deux bouches qui se développent dans l'oreille
    Accélération « académique » Méthode de calcul de conception du module sur la base du Godson 3A1500
    Examens préalables avis | hors du pays du Canada: débarquement canadien du meilleur film à Beijing
    Cinéma mienne | veulent être spectaculaire, ou d'attendre ah
    PK illégitimes deuxième fils du fils aîné de concubines? plomb rouge à lèvres grattoir nuit Palace à un « seau Palace »
    12 modèles à double explosion téléphones ont des valeurs de couleur sont la force recommandée mille machines qui est le plus de la valeur d'achat
    systèmes de communication à spectre étalé de séquence directe à travers des programmes souterrains
    Laser marché TV chaud, qui peut manger un morceau de tarte?
    DC Universe l'action vraiment grand, aux gardes ah
    Montée en flèche plate-forme de devises, la technologie et les géants financiers pour accélérer la mise en page claire | doivent obtenir mensuel
    Une étude d'absorption du taux d'absorption ultra-élevé des matériaux à base de large bande