Profondeur | laisser l'IA apprendre à penser, il peut tout d'abord la peinture à l'église

En Avril de cette année, Google a lancé graphiques, AI pour le tirage automatique aider les gens à faire de la peinture, à quelques coups de l'artiste peut créer un niveau de dessins au trait. Ces applications intéressantes IA pour l'industrie seront excités au sujet. Bien que les résultats de la sortie actuelle de vue, AI coups un peu immature, mais il ne fonctionne tout simplement pas faire obstacle Google pour ses activités scientifiques de grande envergure au grand public derrière les systèmes d'IA, tels que la libération de quelque tendance scientifique papier et ainsi de suite. Derrière le système AI appelé SketchRNN, Google fait partie d'une nouvelle série de projet Magenta pour tester l'IA peut être utilisé pour faire les arts.

Pour mieux comprendre l'histoire derrière ce projet et, le magazine The Atlantic Atlantique a interrogé la personne en charge du projet Magenta Doug Eck. Lei Feng réseau de l'interview faite compilation.

Eck était (est considéré comme un haut lieu de l'IA) est professeur à l'Université de Montréal, et a également travaillé chez Google. Auparavant, il était en charge de Google Music, Google Brian est maintenant mis dans le travail. En 2000, un baccalauréat en informatique de l'Université de l'Indiana, Eck et l'apprentissage de la machine dans la musique a une expérience très riche.

A propos SketchRNN le système AI, si nous voulons comprendre de façon plus vivante, les trois tableaux du point de vue suivant:

Quand les humains sont invités à dessiner un cochon et un camion, il peut être ce style:

Cependant, lorsqu'on lui a demandé de dessiner un « train de porc », vous pouvez être caractéristiques visuellement saillants des deux mixtes et peint cette

Bien que la brosse semble encore très immature, mais le produit de l'utilisation mixte des résultats après le fait, tout comme la production de systèmes d'intelligence artificielle SketchRNN un peu similaire. Comme présenté Eck et ses collaborateurs au principe David Ha de Google, le travail SketchRNN peut être comprise comme « semblable à la façon dont les humains ne résumer l'abstraction. »

Les exemples précédents pour illustrer le texte, que Google ne veut pas créer une peinture « cochon » de la machine, mais la machine ainsi créée pour identifier et décrire le concept de « porc » ou caractéristique. En un mot, que les êtres humains lors de l'élaboration d'un objet, et le concept SAILLANTS caractéristiques du cerveau qui stocke des informations sur les objets, et faire le lien entre les produits « comment dessiner » et « caractéristiques de stockage. » L'importance est que la machine SketchRNN apprendre à laisser la capacité globale » cet humain».

A cette fin, Google a mis en place un jeu appelé « Quick, Draw! », Comme les humains jouent de la même façon que, Google a fait beaucoup de base de données graphique par l'homme pour le jeu. Le matériel de formation, y compris 75 types de produits, comme les hiboux, les moustiques, le jardin ou la hache, contenant chacun des informations sur au moins 70000 exemple individuel stylos. les données de dessin se fondent sur "Quick, Draw!" Disponible, Google a développé le système SketchRNN AI.

Lorsque l'homme peint sur l'herbe, le monde bruyant coloré ne peut compresser en quelques lignes au crayon. Ces traits simples sont des ensembles de données SketchRNN. Peinture chaque type d'objet, comme les chats, les postures de yoga, de la pluie, etc., vous pouvez utiliser la bibliothèque plate-forme logicielle open-source de Google tensorflow pour former un type particulier de réseau de neurones. Lorsque la machine ou dans un Van Gogh présente de style DeepDream une image originale de l'homme au total se sentent un peu bizarre, parce que le concept de la machine ou les principales caractéristiques de l'objet et non comme flexible ou fondu sans laisser de trace.

Ces projets capables de manière mystérieuse et subjective de se sentir humain, mais intéressants en ce qu'ils sont au courant du monde réel et de l'humanité sont similaires mais pas identiques.

Cependant, la sortie SketchRNN n'a pas de sens bizarre. Eck dit:

« Je ne veux pas dire la façon » très humaine «mais il semble que quelque chose d'autre perception que ceux générés par les pixels de l'image. »

Ceci est également le leader de l'équipe Magenta Eck aperçu de base. « La compréhension du monde et différent de la façon dont les pixels, mais dans le développement de l'abstraction en place des choses que nous avons vu », Eck et Ha pour le cas exprimé dans leur document, « Depuis l'enfance, nous avons développé à travers la peinture de communiquer ce que nous avons vu à la capacité des autres ».

Donc, si les humains peuvent faire, Google estime que les machines peuvent faire la même chose. L'an dernier, le PDG de Google Sundar Pichai a annoncé la stratégie de développement futur « AI d'abord ». Pour les entreprises, AI est une extension naturelle de sa mission d'origine, « organiser l'information du monde, laissez-le devenir commun et utile. » Ainsi, Google tente d'utiliser AI façon d'organiser l'information et permettre aux gens d'accéder et d'utiliser les informations. Le projet Magenta est la vision de Google dans la première tentative.

l'apprentissage de la machine est un système commun de façon Google ces dernières années dans ce qui est d'utiliser des réseaux de neurones d'un apprentissage de la machine particulière de connexion vaguement basé modélisation du cerveau humain. Le réseau de neurones à plusieurs niveaux est particulièrement efficace dans la résolution des problèmes difficiles, notamment en termes de reconnaissance de traduction et de l'image. Google a été reconstruit un certain nombre de services de base sur cette nouvelle architecture.

Prenez Google Translate, par exemple, bien qu'il soit déjà un système complexe construit plus de 10 ans, mais Google en fin de compte par l'apprentissage en profondeur a fallu neuf mois pour le système pour terminer la reconstruction. Donc dans ce cas, et le type de réseaux de neurones au cours des dernières années pour atteindre une croissance explosive.

Basé réseau de neurones, SketchRNN généré en utilisant un réseau de neurones récurrent. Selon Google introduit dans le document, ce type de réseau de neurones peut créer une simple esquisse des objets dans le but de former une peinture peut généraliser et concept abstrait de la machine, et il est comme la façon humaine de penser.

La meilleure façon de décrire la formation doit être utilisé comme un codage. Une fois les données d'entrée (projet), les tentatives de réseaux de neurones pour résumer quelques règles générales dans les données traitées. La règle générale est que le modèle de données est une description mathématique des caractéristiques des neurones du réseau est stocké dans.

Ce processus est appelé un espace potentiel ou « Z » (zed). Il peut absorber le processus de formation a appris quelque chose, comme un cochon, un camion ou une postures de yoga et d'autres caractéristiques qui sont stockées, « Z » et ils sont d'échantillonnage.

Ainsi, SketchRNN peut apprendre quoi que ce soit? Ce qui suit est un réseau de neurones formés pour accepter autopompe génère un exemple d'un nouveau camion de pompiers. Dans ce modèle, il y a une variable « température », les chercheurs peuvent en amont ou en sortie vers le bas aléatoire. Dans l'image suivante, bleu indique « la température » est faible, rougeâtre indique haute « température ».

Ou voulez-vous voir plus chouettes:

Ou le meilleur exemple - postures de yoga:

Du point de vue de ces cas, les résultats ont été sortie SketchRNN et les humains sont de style très similaire, mais ne sont pas eux-mêmes la peinture humaine. Ou qu'ils sont d'une certaine façon de peindre les choses humains pourraient être reconstruits. Bien sûr, une partie de la reconstruction est très bon, et d'autres pas du tout.

Pendant ce temps, SketchRNN peut accepter une entrée sous la forme d'une image artificielle. Quand les humains dans une partie de la distribution de contenu, SketchRNN va essayer de le comprendre. Ce qui suit est le modèle de données est formé chat, image de chat que dans les trois, vous trouverez Quels changements?

Comme on peut le voir sur la figure, les différentes sorties de gauche à droite, a été enlevé un troisième il. Parce que le modèle sait, les chats ont des oreilles triangulaires, la barbe, le visage rond, et seulement deux yeux.

Bien sûr, le modèle ne sait pas ce que la fin est les oreilles, le visage ou quoi. Le monde savait rien montré dans ces croquis. Mais il ne sait comment les humains représentant des chats, des porcs ou la voile.

dit Eck, « Quand commencer à générer des dessins de navigation, les modèles entreront dans les centaines d'autres types de voile, ceux-ci peuvent provenir de la figure. Ceci est important pour nous, parce que le modèle dispose de données de toutes ces formations généré sur le bateau ".

La formation peut dessiner un réseau de pluie, puis entrez un croquis nuage, il le fera:

Raindrops tomberont du nuage que le modèle d'entrée. C'est parce que beaucoup de gens lors de l'élaboration des gouttes de pluie, les nuages d'abord dessiner, puis peindre la pluie qui tombe. Par conséquent, si le réseau de neurones voir un nuage, il pluie tombe au fond de la forme. (Fait intéressant, si la première pluie d'étirage, le modèle ne produit pas de nuages).

Ceci est un travail intéressant, mais dans l'ingénierie inverse de l'esprit humain, ce projet qu'est-ce?

Eck description ci-dessus d'intérêt, parce qu'ils sont riches, mais la connotation contenaient peu d'informations. Dessiner un sourire seulement quelques coups, et même que certains ensemble de pixels, mais toute personne de plus de 3 ans peut faire un visage, ou même de faire la distinction entre le visage heureux ou triste. Eck pense que c'est une compression, il est SketchRNN peut décoder le codage, ou même recodé.

OpenAI chercheur Andrej Karpathy également très intéressé par le travail SketchRNN. OpenAI est également un centre de recherche en intelligence artificielle. Mais il a également souligné que le projet pour répondre à un grand nombre de conditions préalables, ce qui signifie que ses entreprises à développer l'intelligence artificielle ne sera pas beaucoup d'aide.

« Nous avons développé le mode de génération a généralement rien à voir avec les détails de l'ensemble de données autant que possible, peu importe ce que les données saisies, doit être utilisé, y compris les images, audio, texte, ou quoi que ce soit d'autre. En plus de l'image, et non l'composée de coups ".

Eck et Ha se développent plus peuvent jouer aux échecs AI, plutôt que d'une IA peut jouer à un jeu. Donc, pour Karpathy, la portée de leur travail actuel semble être limité.

Mais il y a des raisons de croire qu'un dessin de ligne est le fondement de la voie de la pensée humaine. Google ne sont pas les seuls employés sont attirés par la puissance des chercheurs de croquis. Retour en 2012, James Hays et Mathias Eitz Université Technique de Munich et Marc Alexa de Georgia Tech, sur la coopération pour créer un ensemble de données croquis, ainsi qu'une reconnaissance de leur système d'apprentissage de la machine.

Pour eux, l'esquisse est une forme « d'échange universel », toutes les personnes ont une fonction cognitive standard peut le faire. Ils croient que depuis les temps préhistoriques, les humains ont une façon ou esquissant pétroglyphes peintures rupestres pour décrire le monde, et ce pictograph cent mille ans plus tôt que l'émergence du langage, et maintenant la capacité à dessiner et à la reconnaissance d'esquisse est déjà de base.

Université de Toronto neuroscientifique Dirk Walther a souligné dans un document, un simple croquis abstraits sera un véritable stimulus d'une manière similaire à activer notre cerveau. Walther est prise en charge, des graphiques linéaires représentent l'essence de notre monde naturel, parce que la base de pixels, certains chats de voir comment les lignes ne seront pas comme un chat.

Sketch pourrait être une façon de nous aider à saisir le concept d'objet de stockage hiérarchique d'une façon que nous appelons la « nature ». Autrement dit, ils peuvent nous dire que, dans les 10 millions d'années, lorsque nos ancêtres progressivement les humains modernes ont commencé à penser à comment. Croquis, peintures rupestres peuvent décrire comment de notre expérience de tous les jours à l'abstrait.

La plupart a la vie moderne ce changement: la langue, l'argent, les mathématiques, et lui-même calcul. Par conséquent, si les croquis sont certainement importants dans la création de l'intelligence artificielle pour jouer un rôle important, il est raisonnable.

Bien sûr, pour l'homme, l'esquisse est la représentation de la chose réelle. On peut facilement comprendre la relation entre les lignes abstraites et des questions pratiques. Ce concept est d'une grande importance pour nous.

Pour SketchRNN, la séquence de course est le croquis, la forme formée par le temps. tâche de la machine est d'extraire l'essence des choses décrites dans le dessin, et essayer de les utiliser pour comprendre le monde.

équipe SketchRNN explore plusieurs façons. Ils peuvent mettre en place un système pour essayer d'obtenir de meilleurs résultats grâce à la rétroaction humaine. Ils peuvent utiliser une variété de croquis pour former le modèle. Peut-être qu'ils vont trouver un moyen, pour voir si leur modèle peut être généralisé à des images réalistes. Mais ils admettent eux-mêmes SketchRNN est la première étape, il y a beaucoup de choses à apprendre.

L'histoire n'est pas l'ère de la technologie de l'art humain peut être comparé.

Alors que Eck, plus ils veulent savoir la base de la façon dont les humains pensent, à son avis, une partie essentielle de l'art est qu'il représente l'humanité de base. Pour comprendre la profondeur de l'apprentissage, aussi nous devons comprendre les mécanismes fondamentaux de la vie humaine, qui est la façon dont nous voyons le monde, comment parler, comment reconnaître les visages, comment constituera l'histoire de mot, comment arrangeur. Il ne semble pas être liée à tout un être humain particulier, mais il représente l'abstraction de l'humanité.

Enfin, si vous voulez mieux comprendre SketchRNN le système AI, Lei Feng réseau offre des petits avantages de spécial _ Ce lien peut pousser par Google Document officiel.

Via The Atlantic, Lei Feng réseau compilé

Seize équipes finales SLI Chongqing majeures le mois prochain à la concurrence pour des millions de dollars
Précédent
« Fer de la honte Honte poing » pour rafraîchir les dossiers du box-office de film 2D chinois, l'exposition Making Of
Prochain
Vapeur fou mercredi: « Grand Dieu », « Dragon Ball Z combat » nouveau prix plus bas historique
Il Jieke Su a dit, il ne vient pas jeter la serviette
lecture de nuit | College « grimpant à un arbre » Cours spécialisé | femme divorcée mariée depuis 15 ans se trouve sur le certificat de mariage était en fait son frère mari
Nie Yuan super aéroport fille animal poussé par une famille de trois portant des masques correspondent à la valeur élevée du yen
Vous ne --OpenAI que je commente et DeepMind un nouvel apprentissage de renforcement, un apprentissage efficace en fonction des commentaires humains
Le nouveau film de John Woo « chasse »: laisser les deux hommes se battent, sans aucun doute un bon spectacle!
« Pearl » Seiji Lafayette lingfei public photo occasionnels ont la chirurgie Total
« Appel énorme » 1208 de création clé publique de fichier donné Qi premier anti-fraude des télécommunications est apparu film Secret Inside Story
Zhao Liying est coupé? Feng Shao Feng: Réunion nouvelle étape de travail plus pour la qualité
« Pokémon » nouveaux graphiques de diffusion de la conférence de travail Résumé
premier écran de téléphone mobile de Huawei pour creuser des trous et encore les amis a frappé le visage! Cette fois-ci Samsung
2017 film de science-fiction entièrement manuel | trou du cerveau créatif propre balayage