� partir de seulement r�soudre les probl�mes formels � l'apprentissage en profondeur, une v�ritable intelligence artificielle de l'homme de Comment bien?

Auteur: Ian Goodfellow, Yoshua Bengio, Aaron Courville. Ian Goodfellow, 2014 PhD Apprentissage Universit� de Montr�al, chercheur Google. L'�tude couvre la majeure partie de la profondeur des sujets d'apprentissage, notamment pour g�n�rer un mod�le de s�curit� et de confidentialit�, et l'apprentissage de la machine, la confrontation est un des chercheurs influents dans des recherches ant�rieures sur l'�chantillon, et l'invention de la formule contre le r�seau. Yoshua Bengio, professeur du d�partement de recherche en informatique et des op�rations, co-chef de l'Institut de Montr�al pour l'algorithme d'apprentissage (MILA), la personne responsable, programme de l'ICRA, des algorithmes d'apprentissage statistique de recherche du Canada pr�sident. Le principal objectif est de comprendre les principes de l'apprentissage pour produire des renseignements, il des cours de deuxi�me cycle a �galement enseign� l'apprentissage machine (IFT6266), et form� un grand nombre d'�tudiants dipl�m�s et post-doctorat. Aaron est un membre Courville professeur adjoint des sciences informatiques et des op�rations D�partement de la recherche (DIRO) de l'Universit� de Montr�al, est le laboratoire LISA. int�r�ts de recherche approfondies portent sur l'�laboration de mod�les et de m�thodes d'apprentissage, en particulier le d�veloppement de nouveaux mod�les probabilistes et les m�thodes d'inf�rence. L'objectif principal sur les applications de vision informatique, traitement du langage naturel, le traitement du signal audio, la compr�hension de la parole et d'autres domaines connexes de l'intelligence artificielle de a �galement �t� �tudi�.

Presse: Messages populaire et des t�l�communications de presse

Publi�: Juillet 2017

Au loin, dans la Gr�ce antique, l'inventeur r�vait de cr�er une machine peut penser de fa�on ind�pendante. Mythological Pygmalion (Pygmalion), Daedalus (D�dale) et H�pha�stos (H�pha�stos) peut �tre consid�r� comme l'inventeur l�gendaire, et Galat�e (Galat�e), Talos (Talos) et Pandora (Pandora) peut �tre consid�r� comme la vie artificielle (Ovide et Martin, 2004; Sparkes, 1996, Tandy, 1997).

Quand les humains premier concept d'ordinateur programmable, pensant d�j� � l'ordinateur peut devenir intelligent (Bien qu'il fait le premier ordinateur � partir d'une centaine d'ann�es) (Lovelace, 1842). Aujourd'hui, AI (intelligence artificielle de, AI) est devenue une zone active et de nombreuses applications pratiques de la recherche, et est en plein essor. Nous nous attendons � un travail de routine g�rer automatiquement par un logiciel intelligent, la compr�hension de la voix ou l'image, aide et soutien � la recherche scientifique fondamentale dans le diagnostic m�dical.

Au d�but, ce sont tr�s difficiles pour l'intelligence humaine est l'intelligence artificielle, mais l'ordinateur est un probl�me relativement simple �tre r�solu rapidement, par exemple, ces questions peuvent �tre d�crites par une s�rie de r�gles math�matiques formelles. Le v�ritable d�fi est de r�soudre l'intelligence artificielle de ces personnes, il est facile � r�aliser, mais il est difficile de description formelle des t�ches, telles que l'identification des personnes dit ou les visages dans une image. Pour ces probl�mes, nous les �tres humains peuvent souvent �tre facilement r�solus par l'intuition.

En r�ponse � ces probl�mes plus intuitives, ce livre traite une solution. Le programme permet aux ordinateurs apprendre de l'exp�rience, et de comprendre le monde bas� sur le concept de syst�me hi�rarchique, et chaque concept est d�fini par les relations avec un concept relativement simple. Activer les ordinateurs pour obtenir des connaissances de l'exp�rience, peut �tre �vit� de pr�ciser toutes les connaissances dont il a besoin d'�tre formalis� par un ordinateur humain. Le concept de l'ordinateur hi�rarchique permet de construire concept relativement simple � apprendre des concepts complexes. Si vous dessinez un diagramme montrant comment ces concepts se renforcent mutuellement, nous aurons un � profond � (plusieurs niveaux) sur la figure. Pour cette raison, nous appelons cette m�thode �AI apprentissage profond (apprentissage en profondeur) .

Au d�but AI: t�che d'ex�cution abstraite et formelle

Les premiers succ�s d'un grand nombre AI a eu lieu dans un environnement relativement simple et formel, et ne n�cessite pas d'ordinateur avec beaucoup de connaissances sur le monde. Par exemple, Deep Blue d'IBM syst�me d'�checs (Deep Blue) en 1997, a battu le champion du monde Garry Kasparov (Hsu, 2002). De toute �vidence Chess est un domaine tr�s simple, car il ne contient que 64 positions et seulement de mani�re strictement limit�e � d�placer 32 pi�ces. Concevoir une strat�gie d'�checs r�ussie est une grande r�ussite, mais pour d�crire les morceaux et laissez l'ordinateur et la promenade est pas difficile o� ce d�fi. Echecs peut par un tr�s bref, la liste officielle des r�gles pour d�crire compl�tement, et peut �tre facilement pr�par� � l'avance par le programmeur.

Ironie du sort, la t�che abstraite et formelle de l'�tre humain est l'un des plus difficile t�che mentale, mais pour un ordinateur, il appartient � la plus facile. L'ordinateur a �t� en mesure de temps pour battre les meilleurs joueurs d'�checs humains, mais jusqu'� r�cemment l'ordinateur pour atteindre le niveau moyen de la voix humaine pour identifier l'objet ou de la t�che. la vie quotidienne d'une personne exige une �norme quantit� de connaissances sur le monde. Beaucoup de ces connaissances est subjective, intuitive, ce qui rend difficile d'articuler par voie formelle. L'ordinateur a besoin d'acqu�rir les m�mes connaissances afin de d�montrer l'intelligence. Un d�fi est de savoir comment l'intelligence artificielle ces connaissances non formelle de transmettre � l'ordinateur.

Certains projets d'intelligence artificielle cherche connaissance du monde du codage en dur (hard-code) avec le langage formel. L'ordinateur peut utiliser des r�gles de raisonnement logique pour comprendre automatiquement la langue officielle de ces d�clarations. Ceci est connu comme m�thode de l'intelligence artificielle, la base de connaissances (base de connaissances). Cependant, ces projets n'a finalement pas atteint grand succ�s. Le projet le plus c�l�bre est Cyc (Lenat et Guha, 1989). moteur d'inf�rence Cyc et comprend une base de donn�es de d�claration qui utilise un langage CycL d�crit. Ces d�clarations sont saisies par un superviseur humain. Ce processus est maladroit. Les gens qui essaient de concevoir une des r�gles formelles suffisamment complexes pour d�crire avec pr�cision le monde. Par exemple, Cyc ne peut pas comprendre l'histoire d'un homme du nom de Fred raser le matin (Linde, 1992). Il moteur d'inf�rence de d�tecter des incoh�rences dans l'histoire: il conna�t la constitution du corps ne contient pas de pi�ces �lectriques, mais parce que Fred tenait un rasoir �lectrique, il consid�re l'entit� - � est le rasage Fred � ( � FredWhileShaving � ) contenant les composants �lectriques. , Il produit donc une telle question de savoir si --Fred pendant le rasage est encore une personne.

l'apprentissage de la machine: r�solution de probl�mes li�s � la connaissance du monde r�el

Difficult� se fondant sur les visages des connaissances cod�es en dur montrent, le besoin du syst�me AI d'avoir la capacit� d'acqu�rir des connaissances, le mode de capacit� qui est extrait � partir des donn�es brutes. Cette capacit� est appel�e apprentissage machine (apprentissage automatique). L'introduction de l'apprentissage de la machine permet � un ordinateur pour r�soudre des probl�mes impliquant des connaissances dans le monde r�el, et peut prendre les d�cisions apparemment subjectives. algorithme d'apprentissage machine simple, comme une r�gression logistique appel�e (r�gression logistique) peut d�cider de recommander la c�sarienne (Mor-Yosef et al., 1990). La m�me chose est tout simplement na�f algorithmes d'apprentissage machine Bayes (Naive Bayes) peuvent �tablir une distinction entre email l�gitime et spam.

Les performances de ces algorithmes simples d'apprentissage de la machine repose en grande partie sur la pr�sentation (repr�sentation) des donn�es fournies. Par exemple, lorsque la r�gression logistique pour d�terminer la pertinence de la c�sarienne maternelle, le syst�me AI n'est pas directement examiner le patient. , Les m�decins ont besoin au lieu de dire quelques syst�mes d'information connexes, comme la pr�sence ou l'absence de cicatrice ut�rine. Il indique les patients chaque message est appel� une fonction. Ces caract�ristiques de r�gression logistique pour apprendre comment les patients sont associ�s � une vari�t� de r�sultats. Cependant, il n'a pas d'incidence sur la fa�on dont la d�finition de la fonction. Si l'IRM (r�sonance magn�tique) du patient scan au lieu d'un rapport officiel � un m�decin en entr�e � la r�gression logistique, il ne sera pas faire des pr�dictions utiles. L'IRM et un seul pixel lors de l'accouchement corr�lation entre les complications minimales.

Dans l'ensemble de l'informatique et m�me la vie quotidienne, la d�pendance de la repr�sentation est un ph�nom�ne commun. Dans l'informatique, si les ensembles de donn�es sont l'indice compact et intelligemment structur�, la vitesse de traitement de fonctionnement, comme une recherche ou analogue peut �tre exponentielle acc�l�r�e. Il peut facilement �tre en chiffres arabes repr�sentation arithm�tique, mais dans la repr�sentation en chiffres romains serait plus op�ration de temps. Donc, sans surprise, avoir un impact �norme sur les performances d'un algorithme d'apprentissage automatique choisira la repr�sentation. La figure 1 montre un exemple simple visualisation.

Figure 1: Supposons que nous voulons tracer une ligne pour s�parer les deux types de donn�es dans un diagramme de dispersion. A gauche, nous utilisons les donn�es de coordonn�es cart�siennes indiquant que la t�che est impossible. Dans le panneau de droite, nous avons exprim� les donn�es en coordonn�es polaires, la ligne verticale peut facilement r�soudre cette t�che (coop�ration David Warde-Farley avec le dessin sur cette figure)

apprend

De nombreuses t�ches AI peuvent �tre r�solus de la mani�re suivante: tout d'abord, pour extraire un ensemble appropri� de fonctions, alors ces fonctions pour fournir une machine simple algorithme d'apprentissage. Par exemple, pour la t�che par le haut-parleur pour l'identification vocale, une fonction utile est d'estimer la taille de ses canaux. Selon le juge, le haut-parleur est de fournir un indice important pour les hommes, les femmes et les enfants.

Cependant, pour de nombreuses t�ches, il est difficile de savoir quelles fonctions sont extraites. Par exemple, supposons que nous voulons �crire un programme pour d�tecter les photos de la voiture. Nous savons que la voiture a des roues, donc nous pourrions l'utiliser ou non comme fonctionnalit� existe roue. Malheureusement, nous ne pouvons pas �tre d�crire avec pr�cision ce que les regards roue aiment sur la base des valeurs de pixels. Bien que la roue a une forme g�om�trique simple, mais il peut provoquer des images � des sc�nes diff�rentes, comme une ombre tombe sur la roue, �clair�e par la roue solaire de pi�ces m�talliques d'une aile de voiture ou d'une partie occluse de l'objet de premier plan comme une roue .

Une fa�on de r�soudre ce probl�me est d'utiliser l'apprentissage de la machine pour d�couvrir se repr�senter, non seulement repr�sentant cartographi�s � la sortie. Nous appelons cette approche d'apprentissage (prend connaissance de la repr�sentation).

Apprendre � exprimer plus souvent que la repr�sentation de la conception manuelle de meilleurs r�sultats. Et ils n�cessitent une intervention manuelle minimale, vous pouvez laisser le syst�me AI d'adapter rapidement aux nouvelles t�ches. algorithme d'apprentissage repr�sente seulement quelques t�ches simples qui peuvent trouver un bon ensemble de fonctionnalit�s pour des t�ches complexes dont vous avez besoin de quelques heures � plusieurs mois. la conception manuelle comporte une t�che complexe et n�cessite beaucoup de travail, de temps et d'efforts, et prend m�me une communaut� de chercheurs d�cennies.

Un exemple typique est repr�sent� par l'algorithme d'apprentissage du codeur (autoencoder). Fonction de l'encodeur et un d�codeur (DECODER) fonction d'une combinaison d'un codeur (encodeur) ensemble. La fonction codeur convertit les donn�es d'entr�e en une repr�sentation diff�rente, et le d�codeur ajoutera la nouvelle fonction repr�sent�e arri�re convertie � la forme originale. Nous attendons avec impatience lorsque les donn�es d'entr�e apr�s le codeur et d�codeur pour conserver un maximum d'informations, mais a exprim� l'espoir que la nouvelle vari�t� de bonnes caract�ristiques, ce qui est des objectifs d'auto-formation codeur. Afin d'obtenir des caract�ristiques diff�rentes, nous pouvons concevoir diff�rentes formes de l'encodeur auto.

Lorsque les caract�ristiques de conception de l'algorithme ou fonctionnalit� con�ue pour l'�tude, notre objectif est g�n�ralement facteur de d�gradation isol� peut expliquer les donn�es observ�es (facteurs de variation). Dans ce contexte, l'impact des diff�rentes sources se r�f�rent uniquement � � facteur � est le mot, les facteurs multiplicatifs ne sont g�n�ralement pas combin�s. Souvent, ces facteurs ne peuvent pas �tre observ�es directement la quantit�. , Ils peuvent �tre observ�s � la place dans le r�el des objets du monde ou de force inobservable, mais auront une incidence sur la quantit� de observable. Afin de fournir une simplification utile des raisons d'interpr�tation des donn�es observ�es ou pr�sum�es, ils peuvent aussi �tre pr�sents dans la pens�e humaine sous forme conceptuelle. Ils peuvent �tre consid�r�s comme un concept abstrait ou donn�es pour nous aider � comprendre la riche diversit� de ces donn�es. Lors de l'analyse de l'enregistrement de la voix, les facteurs de variation des haut-parleurs, y compris l'�ge, le sexe, l'accent et leurs mots qu'ils disent. Lors de l'analyse de l'image d'une voiture, les facteurs de variation, y compris l'emplacement de la voiture, la couleur, la luminosit� et l'angle du soleil.

Dans de nombreuses applications dans le monde r�el de l'intelligence artificielle, le plus difficile surtout en raison des facteurs de d�t�rioration affectent chacune des donn�es que nous pouvons observer. Par exemple, dans une image contenant une voiture rouge, qui est un pixel dans la nuit peut �tre tr�s proche du noir. La forme du contour de la voiture d�pend de la perspective. La plupart des applications nous devons r�gler le facteur de d�gradation et d'ignorer les facteurs que nous ne se soucient pas.

De toute �vidence, un tel niveau �lev� est extrait � partir des donn�es brutes, fonction abstraite est tr�s difficile. De nombreux facteurs tels que l'accent pauvres, que par complexe, proche du niveau de la compr�hension humaine des donn�es pour identifier. Ceci est presque aussi difficile que le probl�me d'origine est obtenue indique donc, � premi�re vue, semblent indiquer l'apprentissage ne nous aide pas.

�tude approfondie

apprentissage en profondeur (apprentissage profond) pour exprimer complexe dit que pour r�soudre la question fondamentale de la repr�sentation apprentissage par l'autre repr�sentation plus simple.

l'apprentissage de la profondeur � laisser l'ordinateur pour construire des concepts complexes par concept relativement simple. La figure 2 illustre la fa�on dont le syst�me d'apprentissage de profondeur en combinant un concept relativement simple (par exemple, l'angle et des contours qui, � son tour, est d�fini par le bord) pour repr�senter le concept de l'image de l'homme. Des exemples typiques du mod�le d'apprentissage profondeur r�seau feedforward ou la profondeur ou MLP (perceptron multicouches, MLP). MLP est seulement une cartographie un ensemble de valeurs d'entr�e � des valeurs de sortie de la fonction math�matique. Cette fonction est aggrav�e par un certain nombre de fonctions relativement simple. Nous pouvons consid�rer toutes les applications de fonctions math�matiques diff�rentes fournit une nouvelle repr�sentation pour l'entr�e.

L'id�e des donn�es d'apprentissage est une repr�sentation correcte de l'apprentissage en profondeur interpr�tatif. Une autre perspective est la profondeur du programme d'ordinateur provoque l'ordinateur pour en savoir plus d'une �tape. Chaque couche peut �tre consid�r�e comme repr�sentant un �tat de m�moire de l'ordinateur apr�s l'autre ensemble de l'ex�cution en parall�le d'instructions. Un r�seau plus profond peut effectuer plus d'instructions de fa�on s�quentielle. S�quence d'instructions pour fournir une grande capacit�, � la suite peut se r�f�rer � l'instruction plus t�t apr�s instruction. De ce point de vue, dans une fonction d'activation de la couche o� pas toutes les informations implique des facteurs de d�t�rioration expliquer entr�e. Il repr�sente �galement stocke les informations d'�tat pour aider � comprendre l'entr�e du programme. Voici des informations d'�tat semblable au compteur de programme d'ordinateur classique ou pointeur. Cela n'a rien � voir avec une entr�e sp�cifique, mais elle contribue � mod�liser les processus d'organisation.

Figure 2

Il y a deux fa�ons mod�le de mesure de profondeur. Une fa�on est bas�e sur l'�valuation du nombre d'instructions s�quentielles l'architecture ex�cut�e n�cessaire. mod�le de nous supposons que pour une entr�e donn�e est repr�sent� sous la forme d'un organigramme correspondant au calcul de sortie, ce qui peut �tre consid�r� comme le plus long chemin dans le mod�le de la profondeur de organigramme. Comme l'utilisation de deux programmes �quivalents r�dig�s dans des langues diff�rentes ayant des longueurs diff�rentes, la m�me fonction peut �tre trac�e sous forme d'organigramme ayant des profondeurs diff�rentes, en fonction de la profondeur que l'on peut utiliser en fonction d'une �tape. La figure 3 illustre comment le choix de la langue dans la m�me mesure deux architectures diff�rentes.

Figure 3

Une autre m�thode est l'utilisation de mod�les probabilistes dans la profondeur, il est pas consid�r� comme le mod�le de calcul de la profondeur de la profondeur figure, mais sera d�crit comment un autre mod�le conceptuel connexe de profondeur figure consid�r�e comme la profondeur. Dans ce cas, le calcul du calcul de la profondeur organigramme montrant chaque concept peut �tre plus profond que le concept m�me de la figure. En effet, le syst�me plus simple compr�hension du concept des informations donn�es dans les concepts plus complexes peut �tre affin�. Par exemple, un syst�me AI pour observer l'image du visage d'un il dans l'ombre, il peut d'abord voir que d'un il. Mais lors de la d�tection de la pr�sence d'un visage, le syst�me peut d�duire un deuxi�me oeil peut �galement �tre pr�sent. Dans ce cas, montrant le concept d'inclure seulement deux couches (couche sur l'oeil et une couche sur le visage), mais si nous affinons les estimations de chaque concept n�cessitera n-i�me calcul suppl�mentaire, le calcul comprenant 2n figure. couche.

Comme il est pas toujours clair, et la probabilit� d'un diagramme de mod�le de profondeur de calcul figure qui est le plus important, parce que diff�rentes personnes et diff�rents ensemble minimal s�lectionn� d'�l�ments correspondant � la figure construits de mani�re que la longueur d'un programme informatique n'existe pas comme une seule valeur correcte, la profondeur de l'architecture il n'y a pas de valeur correcte unique. De plus, il n'y avait pas de mod�le de la fa�on dont le consensus profond afin d'�tre modifi� pour � profonde �. Mais par rapport � l'apprentissage de la machine traditionnelle, les �tudes de mod�les d'apprentissage en profondeur impliquant une combinaison de caract�ristiques pour en savoir plus ou apprendre les concepts, sans aucun doute.

En bref, le th�me de ce livre - �l'apprentissage en profondeur est l'une des voies menant � l'intelligence artificielle . Plus pr�cis�ment, il est un apprentissage de la machine, un syst�me informatique capable d'une technologie am�lior�e et � partir de donn�es empiriques. Nous croyons fermement que l'apprentissage de la machine peut construire des syst�mes d'IA fonctionnant dans un environnement physique complexe, et est la seule approche pratique. l'apprentissage en profondeur est un type sp�cifique de l'apprentissage de la machine, avec une forte puissance et la flexibilit�, il repr�sentera le plus large syst�me de conception hi�rarchique imbriqu� monde (concepts complexes d�finis par le contact entre le concept relativement simple, r�sum� g�n�ral de l'abstrait au haut niveau d'abstraction repr�sentation).

La figure 4 illustre la relation entre ces diff�rentes disciplines de AI.

La figure 5 ci-dessous montre les principes de haut niveau de la fa�on dont chaque discipline fonctionne.

Figure 4: diagramme de Venn montre la profondeur de l'apprentissage est non seulement une repr�sentation de l'apprentissage, mais aussi un apprentissage de la machine peut �tre utilis�e dans de nombreux (mais pas toutes) m�thodes AI. Chaque section comprend une instance d'un diagramme de Venn Technologie AI

Figure 5: repr�sente un organigramme de la mani�re dont les diff�rentes parties du syst�me AI li�s les uns aux autres dans diff�rentes disciplines AI. Les cases ombrag�es repr�sentent les composantes de l'apprentissage � partir des donn�es

[Titane Auteur du m�dia: Adapt� de "l'apprentissage en profondeur" un livre, l'auteur Ian Goodfellow, Yoshua Bengio, Aaron Courville]

Plus de contenu passionnant, l'attention des m�dias titane signal de micro (ID: taimeiti), titane ou t�l�charger les m�dias App

Route de la soie

Apprenez � conna�tre la Chine

� partir de seulement r�soudre les probl�mes formels � l'apprentissage en profondeur, une v�ritable intelligence artificielle de l'homme de Comment bien?

Au d�but AI: t�che d'ex�cution abstraite et formelle

l'apprentissage de la machine: r�solution de probl�mes li�s � la connaissance du monde r�el