La machine n'apprend pas: comp�tences d'apprentissage en profondeur la formation m�canisme attention cr�pus 4 apprentissage en profondeur

Les deux derni�res ann�es, le mod�le d'attention (mod�le Attention) est largement utilis� dans le traitement du langage naturel, reconnaissance d'image, reconnaissance vocale, et divers autres types de t�ches d'apprentissage en profondeur, la profondeur de la technologie d'apprentissage est la technologie de base des plus int�ressants et en profondeur la compr�hension des a.

Dans cet article, la traduction automatique, par exemple, les visiteurs d'en apprendre davantage dans l'�tude approfondie des m�canismes attentionnels et principes cl�s du syst�me informatique, mais aussi sa nature abstraite de la pens�e, l'attention et pr�sente les sc�narios d'application typiques du mod�le dans des domaines tels que l'image et la voix.

Ces derni�res ann�es mod�le d'attention est largement utilis� dans divers apprentissage de la profondeur de champs, que ce soit une vari�t� de diff�rents types de traitement d'image de t�che, la reconnaissance vocale ou le traitement du langage naturel, sont vuln�rables � la figure mod�le de l'attention. Par cons�quent, l'attention pour comprendre le fonctionnement du m�canisme est tr�s pr�occup� par la n�cessit� de comp�tences en d�veloppement de la technologie de l'apprentissage en profondeur.

L'attention visuelle humaine

De la d�signation du mod�le d'attention, il est clair que le m�canisme attire l'attention de l'homme, et par cons�quent, nous avons d'abord bri�vement introduire le m�canisme de l'attention s�lective de la vision humaine.

1 L'attention visuelle humaine

m�canisme de l'attention visuelle est unique au m�canisme de traitement du signal du cerveau visuel humain. En balayant l'image globale rapide visuel humain, pour obtenir la zone cible besoin de se concentrer sur, que l'on appelle g�n�ralement l'attention, et consacrer davantage de ressources � se concentrer sur ce domaine pour plus de d�tails sur la n�cessit� de se concentrer sur la cible, et inhiber d'autres informations inutiles.

Ceci est un moyen de ressources humaines avec une attention limit�e filtrer rapidement des informations � partir d'un grand nombre d'informations de grande valeur, est un m�canisme de survie sous la forme humaine de l'�volution � long terme, le m�canisme de l'attention visuelle humaine am�liore consid�rablement l'efficacit� du traitement de l'information visuelle et pr�cision.

La figure 1 montre une visualisation du syst�me visuel humain cible est plus pr�occup� quand ils voient une image de la fa�on dont l'allocation efficace des ressources limit�es de l'attention, ce qui montre que la zone rouge, il est clair que pour le sc�nario illustr� � la figure 1, les gens vont pr�ter attention � forcer plus dans le visage de la personne, le texte du titre de l'article et la premi�re phrase et d'autres endroits.

�tude approfondie du m�canisme de l'attention de l'essence et le m�canisme de l'attention visuelle s�lective l'objectif fondamental de l'homme comme, est de s�lectionner une information plus critique sur les objectifs de la mission en cours d'un certain nombre d'informations.

cadre COdeurDECodeur

Pour comprendre la profondeur de l'apprentissage mod�le d'attention, vous devez commencer avec le cadre du codeur-d�codeur, comme la plus grande attention est attach�e au mod�le dans le cadre du codeur-d�codeur, bien s�r, en fait, le mod�le d'attention peut �tre consid�r�e comme une id�e g�n�rale, lui-m�me ne d�pend pas d'un cadre sp�cifique qui a besoin d'attention.

mod�le de recherche-cadre COdeurDECodeur peut �tre consid�r� comme un des domaines d'apprentissage en profondeur, les sc�narios d'application exceptionnellement large. La figure 2 est un champ de traitement de texte classique cadre COdeurDECodeur repr�sente l'un des plus abstrait.

Figure 2 Cadre COdeurDECodeur champ de traitement abstrait texte

champ de traitement de texte cadre codeur d�codeur pour comprendre intuitivement peut �tre si: ce qui peut �tre consid�r� comme appropri� pour le traitement d'une phrase (ou chapitres) g�n�re en outre une phrase (ou chapitres) du mod�le de traitement g�n�ral. Pour la phrase < Source, cible > Notre objectif est de phrase d'entr�e donn�e Source, attendant pour g�n�rer la phrase cible par cible cadre COdeurDECodeur. Source et cible peut �tre la m�me langue, il peut �tre deux langues diff�rentes. Source et cible, respectivement, et la s�quence de mots respective est compos� de:

Codeur nom Source sugg�re est de coder la phrase d'entr�e, l'entr�e de phrase par la conversion non-lin�aire � une repr�sentation s�mantique de l'interm�diaire C:

D�codeur pour le d�codeur, sa mission et informations sur l'historique C est g�n�r� en fonction de la source phrase s�mantique pr�c�demment interm�diaire

Pour g�n�rer un moment pour g�n�rer mot i

Chaque yi sont s�quentiellement g�n�r�s de mani�re, il semble, est l'objectif de l'ensemble du syst�me g�n�r� en fonction de la phrase d'entr�e phrase cible Source. Si la source est une phrase chinoise, la cible est une phrase en anglais, alors il est de r�soudre le probl�me de la traduction automatique cadre codeur-d�codeur, si la source est un article, Target est une description g�n�rale de quelques d�clarations, alors ceci est un r�sum� de texte du codeur-d�codeur cadre; si la source est une question, la cible est une r�ponse, alors c'est un cadre Q & COdeurDECodeur du syst�me de dialogue ou un robot. Ainsi, dans le domaine du traitement de texte, COdeurDECodeur d'une large gamme d'applications.

Cadre COdeurDECodeur largement utilis� non seulement dans le domaine du texte, il est souvent utilis� dans la reconnaissance vocale, le traitement d'image et d'autres domaines. Par exemple, la reconnaissance vocale, le cadre de la figure 2 est pleinement applicable, est tout simplement la diff�rence entre le flux de la parole d'entr�e est la section du codeur, correspondant aux informations de texte est sortie, alors que pour la t�che � description de l'image �, la section d'entr�e est un codeur vice-image, sortie d�codeur est en mesure de d�crire l'image d'un des descripteurs de contenu s�mantique. En g�n�ral, la reconnaissance vocale et de traitement de texte sont g�n�ralement utilis�s mod�le Encoder RNN, l'image de traitement du codeur CNN mod�le couramment utilis�.

Mod�le de l'attention

Cette premi�re section � la traduction automatique comme un exemple pour expliquer les principes de base de la plus commune doux mod�le de l'attention, apr�s cadre d�pass� COdeurDECodeur abstraire l'essence de l'id�e des m�canismes attentionnels, et introduit l'id�e de base r�cemment largement utilis� auto attention de.

Mod�le Soft Attention

Montr� dans le cadre figure COdeurDECodeur 2 est refl�te pas le � mod�le d'attention �, il peut donc �tre consid�r� comme un mod�le de distraction de l'inattention. Pourquoi nous nous concentrons pas? S'il vous pla�t observer la cible phrase cible chaque mot est g�n�r� comme suit:

O� f est une fonction de transformation non lin�aire du d�codeur. Comme on peut le voir de cela, lors de la g�n�ration du mot cible dans la phrase, quelle que soit la g�n�ration mot, qui utilise le code phrase d'entr�e s�mantique source C est la m�me, aucune diff�rence.

Le codage s�mantique C par chaque mot de la phrase apr�s g�n�rateur du codeur de code source, ce qui signifie que peu importe quel mot est g�n�r�,

En fait, un mot dans une source de phrase pour g�n�rer un mot cible yi d'influence sont les m�mes, ce qui est de dire pourquoi ce mod�le ne refl�te pas la raison de l'attention. Ceci est similaire � un �tre humain regardant l'�cran, mais les yeux ne sont pas les m�mes que le centre d'attention.

Si vous prenez la traduction automatique pour expliquer le mod�le de distraction cadre du codeur-d�codeur pour mieux comprendre, par exemple, entra dans la phrase anglaise: Tom chase Jerry, cadre COdeurDECodeur g�n�rer progressivement mot chinois: � Tom �, � chasse �, � Jerry ".

Dans la traduction de � Jerry � Le mot chinois quand les distractions mod�le � l'int�rieur de chaque mot anglais pour cible de traduction mot � Jerry � contribution est la m�me, il est clair que ce n'est pas raisonnable, il est clair � Jerry � Pour traduire par � Jie suisse � plus important encore, il est un mod�le de distraction ne peut pas tenir compte de ce qui est la raison pour laquelle il n'y a aucune raison pour l'introduction de l'attention.

Mod�le aucune attention au moment de l'introduction de la courte phrase d'entr�e d'un gros probl�me, mais si vous entrez dans une longue phrase, cette fois pour repr�senter tout le enti�rement s�mantique par un vecteur s�mantique interm�diaire, le mot lui-m�me a des informations disparu, on peut imaginer se perdre beaucoup de d�tails, ce qui est une raison importante pour laquelle l'introduction du mod�le d'attention.

Dans l'exemple ci-dessus, si l'introduction du mod�le de l'attention, il devrait �tre traduit par � Jerry � quand le mot anglais pour la traduction refl�te le degr� actuel d'influence de diff�rents mots chinois, comme pour donner une distribution de probabilit� similaire aux valeurs suivantes:

(Tom, 0,3) (Chase, 0,2) (Jerry, 0,5)

La probabilit� de chaque mot anglais au nom de l'attention lorsque la taille du mot courant traduit � Jerry � mod�le d'allocation d'attention attribu�e � un des mots anglais diff�rents. Ceci est la traduction de la langue cible correcte du mot est certainement utile, parce que l'introduction de nouvelles informations.

De m�me, l'objectif de chaque mot dans la phrase devrait apprendre � se concentrer informations sur la distribution de probabilit� des d�clarations de source correspondant dans le sous-mot. Cela signifie que chaque mot est g�n�r�

Lorsque l'original est la m�me repr�sentation s�mantique interm�diaire C est remplac� par le mot bas� sur la g�n�ration actuelle et changeant

. L'attention est la cl� pour comprendre ce mod�le, � savoir, un interm�diaire repr�sent� par une s�mantique fixe mot C remplac� est ajust�e en fonction de la sortie de courant est chang� pour le mod�le d'attention ajout�e

. COdeurDECodeur augment� mod�le d'attention pour comprendre le cadre comme indiqu� sur la figure.

La figure 3 est introduit cadre COdeurDECodeur Mod�le de l'attention

Tel est le processus de g�n�ration du mot cible phrase est devenue la forme suivante:

et chaque

Peut correspondre � une d�claration sous-mot autre source d'allocation d'attention des distributions de probabilit�s, comme pour la traduction ci-chinois, les informations correspondantes peuvent �tre comme suit:

Ce qui, la fonction f2 repr�sente l'encodeur pour entrer un mot d'une fonction de transformation, comme le mod�le RNN si l'encodeur est utilis�, alors le r�sultat est souvent une fonction f2 une entr�e point

Etat valeur de nud cach�; G repr�sente une fonction de conversion interm�diaire synth�tique repr�sentative codeur phrase enti�re repr�sentation s�mantique des mots interm�diaires, dans la pratique g�n�rale, g est une fonction d'une somme pond�r�e des �l�ments constitutifs, � savoir, la formule suivante:

Parmi eux,

dur�e de la peine Source est repr�sentative de l'entr�e,

allocation d'attention Source phrase d'entr�e de coefficient lorsque le mot dans le j-i�me sortie du i-�me mot repr�sentatif de la cible, et

phrase d'entr�e source est dans le codage s�mantique j-mot. hypoth�se

I est un indice exemple mentionn� ci-dessus � Tom �, puis

Est 3, h1 = f ( "Tom"), h2 = f ( "Chase"), h3 = f ( "Jerry") sont la phrase d'entr�e de codage s�mantique de chaque mot, les poids correspondant du mod�le d'attention sont 0.6,0.2,0.2, de sorte que essentiellement la fonction g est une fonction de la somme pond�r�e. Si l'image repr�sente, puis traduit mot chinois � Tom � quand la formule math�matique interm�diaire correspondant repr�sentation s�mantique

La figure 4 est similaire au processus de formation.

4 Proc�d� de formation d'attention de la Fig.

Il y a aussi un probl�me: pour g�n�rer la phrase cible un mot, comme � Tom �, nous savons comment attribuer une distribution de probabilit� de la valeur de la phrase d'entr�e des mod�les d'attention exigent mot attention qu'il? Ce � Tom � probabilit� d'entr�e correspondant � chaque mot dans une phrase distribution Source: (Tom, 0,6) (Chase, 0,2) (Jerry, 0,2) est de savoir comment l'obtenir?

Pour plus de commodit� d'explication, nous supposons un d�codeur utilise �galement non-cadre Attention COdeurDECodeur Mod�le raffinement. La figure 2, RNN en utilisant l'encodeur mod�le, le mod�le RNN, ce mod�le est la configuration de forme plus commune, le cadre 2 est converti Fig. Figure 5.

La figure 5 RNN comme un cadre sp�cifique COdeurDECodeur Mod�le

La figure 6 peut alors plus facilement illustrer le processus d'un usage g�n�ral calculer la distribution de probabilit� de valeurs de la distribution de l'attention.

La figure 6 est calcul�e distribution de probabilit� de l'attention

Pour d�codeur utilisant le RNN, en i temps, si vous voulez g�n�rer des mots yi, nous pouvons conna�tre la g�n�ration cible

I-1 avant le moment o� la valeur de sortie du noeud cach� i-1 fois

Et notre objectif est de g�n�rer l'informatique

Lors de la saisie des mots dans une phrase � Tom �, � Chase �, � Jerry � sur

Il est attribu� une distribution de probabilit�, la phrase peut �tre �mis au moment i-1 statut de noeud de couche cach�e cible

Hj par rapport � onze �tat de noeud de la couche cach�e et RNN phrase d'entr�e source correspondant � chaque mot, � savoir par la fonction F (

) Pour obtenir le mot cible

Et aligner la possibilit� de chaque mot d'entr�e correspondant � la fonction F peut prendre diff�rentes approches dans diff�rents papiers et sorties alors la fonction F Softmax normalis�e obtenir l'attention de la distribution de probabilit� de la distribution de probabilit� conform�ment � la valeur de l'intervalle distribution des valeurs.

Attention, grande majorit� des mod�les prennent le cadre de calcul ci-dessus pour calculer la distribution de probabilit� d'informations d'allocation d'attention, mais la diff�rence peut diff�rer de la d�finition de Fs. La figure 7 montre visuellement en anglais - apr�s avoir ajout� le m�canisme de l'attention du syst�me de traduction allemande, l'allocation d'attention probabilit� source et cible deux phrases chaque mot de distribution correspondant.

7 Anglais - Distribution attention de la traduction allemande de probabilit�

Au-dessus est l'id�e de base du mod�le classique Attention souple, alors comment comprendre la signification physique du mod�le de l'attention de celui-ci? Dans les applications de traitement du langage naturel g�n�ral o� la production est consid�r�e comme un mod�le serait Attention phrase cible dans un mod�le d'alignement de mots et de phrase entr�e Source chaque mot, ce qui est tr�s raisonnable.

Chaque mot de la phrase cible g�n�r�e distribution de probabilit� de la phrase de mots d'entr�e correspondant peut �tre comprise comme une phrase d'entr�e et l'alignement de mots la probabilit� de g�n�ration de cible de la parole, qui, dans le contexte de la traduction automatique est tr�s intuitif: traduction automatique statistique traditionnelle est g�n�ralement effectu�e processus �tape aura une phrase sp�ciale align�, et l'attention du fait que le mod�le est le m�me effet.

Figure 8 Google machine � r�seau de neurones diagramme d'architecture du syst�me de traduction

La figure 8 est le d�ploiement de Google en 2016 au syst�me de traduction automatique bas� sur des lignes de r�seaux de neurones, par rapport au mod�le traditionnel a augment� pour effet consid�rablement la traduction, un taux d'erreur de traduction est diminu� de 60%, sa structure d�crite ci-dessus est repr�sent� sur la figure ainsi que codeur-d�codeur cadre de m�canisme de l'attention, la principale diff�rence est simplement que 8 codeur et d�codeur stratifi�es � l'aide du mod�le ajout� LSTM.

L'id�e essentielle de l'attention de m�canisme

Si l'exemple m�canisme Attention de lib�ration du codeur-d�codeur du cadre, et encore une abstraction, peut �tre plus facile de comprendre l'essence de la pens�e de ce qui pr�c�de sur le m�canisme de l'attention.

L'id�e essentielle du m�canisme de la figure 9 Attention

Nous pouvons faire pour traiter le m�canisme de l'attention (voir la figure 9). Les �l�ments constitutifs de la Source comme une suite de < Cl�, valeur > Les donn�es de configuration, puis donn�s un �l�ment dans la requ�te cible, la requ�te, et en calculant la similitude ou la corr�lation entre la cl� respective, les poids principaux correspondant � chacun du coefficient de pond�ration obtenu la valeur et la valeur de la somme pond�r�e, � savoir, pour obtenir un attention, la valeur finale. Par cons�quent, le m�canisme est essentiellement Attention Source La valeur est une somme pond�r�e des �l�ments, et la cl� de requ�te utilis�e pour calculer le coefficient de pond�ration correspondant � la valeur. Telle est l'essence de la pens�e peut �tre r��crite comme la formule suivante:

Parmi eux,

|| = || Source Source de longueur repr�sentant, � savoir le sens de la formule d�crite ci-dessus. Des exemples de la traduction automatique cit�e ci-dessus, parce que dans le processus de calcul Attention, la source et la valeur de cl� combin�s, pointez sur la m�me chose, � savoir la phrase d'entr�e s�mantique de codage correspondant � chaque mot, il ne peut pas �tre facile de voir que cette id�e peut incarner l'essence m�me de la structure.

Bien s�r, Conceptuellement, l'attention a compris encore �tre de grandes quantit�s d'informations dans une petite quantit� de filtrer de mani�re s�lective des informations importantes et de se concentrer sur ces informations importantes, en ignorant la plupart des informations sans importance, cette id�e tient toujours. mise au point de proc�d�s inclus dans le calcul du coefficient de poids est �lev�, plus le poids de la valeur de mise au point de valeur correspondant � celle-ci, � savoir, les poids repr�sentant l'importance de l'information et l'information correspondante de la valeur.

De la figure 9 peut �tre compris qu'un autre chef de file, l'attention peut �galement �tre consid�r� comme un m�canisme souple d'adressage (Adressage): Source peut �tre consid�r� comme le contenu stock� dans les �l�ments de m�moire par la valeur d'adresse et de la composition de valeur cl�, il y a actuellement une cl� = requ�te objet de requ�te correspondant � une m�moire est de prendre la valeur de la valeur, � savoir la valeur de l'attention. Par des �l�ments cl� de requ�te et l'adresse de la m�moire � l'adresse comparaison de similitude, la raison pour laquelle un Adressage, � la diff�rence se r�f�re uniquement � trouver un contenu de la m�moire adressables par le contenu de l'int�rieur, mais de chacune des adresses possibles cl�s l'importance du contenu sont sorties, prises pour d�terminer la similitude de la requ�te et la cl�, puis somme pond�r�e de la valeur, qui peut �tre la valeur retir�e valeur finale, � savoir la valeur de l'attention. Beaucoup de chercheurs Attention consid�r� comme un cas particulier de m�canisme d'adressage doux, ce qui est tr�s raisonnable.

En ce qui concerne les d�tails du m�canisme de l'attention de calcul, si la majorit� de la m�thode abstraite en cours, alors, peut se r�sumer en deux processus: un premier processus selon Query Key et des coefficients de pond�ration sont calcul�es, le second proc�d� selon les coefficients de pond�ration Valeur somme pond�r�e. Le premier proc�d� peut �tre subdivis� en deux �tapes: la premi�re �tape ou � la fois de calculer une similarit� selon la corr�lation et la cl� de requ�te, la seconde �tape de la premi�re phase des scores bruts ont �t� normalis�s; ainsi, le processus de calcul peut �tre r�sum� comme Attention 10 montrent trois �tapes.

La figure 10 calcule processus en trois �tapes Attention

Dans la premi�re �tape, une autre fonction peut �tre introduit et un syst�me d'ordinateur, et en fonction d'une requ�te

, La similitude ou la pertinence, � la fois la m�thode la plus commune de calcul comprend: la recherche d'un produit scalaire de vecteurs entre les deux, � la fois la recherche de vecteur de similarit� de cosinus ou en introduisant r��valu� suppl�mentaire par le r�seau neuronal, � savoir de la mani�re suivante:

La premi�re valeur de phase g�n�r�e par des proc�d�s sp�cifiques qui produisent plage de valeurs num�riques diff�rentes ne sont pas les m�mes, la mise en place de la deuxi�me �tape est calcul� d'une mani�re similaire � la partition SoftMax premi�re �tape de conversion num�rique, d'une part peut �tre normalis�e, la le score initial est calcul� organis� en poids lourds de tous les �l�ments et pour la distribution de probabilit�, d'autre part, peut aussi �tre important �l�ment plus important du m�canisme interne SoftMax en poids. -�-dire g�n�ralement calcul� selon la formule suivante:

Les r�sultats de la deuxi�me �tape

� savoir

Des coefficients de pond�ration correspondant, et en additionnant les valeurs pond�r�es pour obtenir Attention:

En calculant les trois �tapes d�crites ci-dessus, pour obtenir des valeurs pour Attention requ�te, la m�thode de calcul sp�cifique de la grande majorit� des m�canismes d'attention r�pondre au-dessus de processus de calcul en trois �tapes d'abstraction.

Mod�le auto Attention

Attention, l'essence du genre au-dessus de la pens�e, nous pouvons comprendre plus facilement le mod�le auto Attention d�crit dans cette section. Auto attention est �galement souvent appel� intra attention (attention interne), ann�e la plus r�cente a �galement re�u relativement largement utilis�, comme dans le dernier mod�le de traduction automatique de Google utilise beaucoup de mod�le auto Attention.

Codeur-d�codeur dans le cadre des t�ches g�n�rales, saisissez le contenu de sortie source et cible ne sont pas les m�mes, par exemple pour l'anglais - langue dans la traduction automatique, phrase anglaise Source, Target est la traduction phrase chinoise correspondante, les m�canismes d'attention se produisent dans requ�te cible entre les �l�ments et tous les �l�ments Source. Auto Attention, son nom l'indique, fait r�f�rence au m�canisme de l'attention entre la source et la cible n'est pas, mais le m�canisme de l'attention se produit entre les �l�ments internes cible ou la source entre les �l�ments internes, peut �tre comprise comme cible = attention dans ce cas particulier Source le syst�me informatique. Le processus de calcul sp�cifique est le m�me, mais la cible calcul�e change seulement, il ne se r�p�te pas ici les d�tails de calcul.

Si elle ne correspond pas � l'attention conventionnelle Source cible dans le cas de calcul, la signification physique comme ci-dessus contraintes, telles que pour la traduction automatique, il est essentiellement un m�canisme d'alignement de mots entre le mot de la langue source et la langue cible un mot. Donc, s'il est m�canisme d'auto Attention, une question naturelle est: par auto Attention � la fin appris ce que la loi ou extrait quelles sont les caract�ristiques il? Ou l'introduction du gain auto Attention ou � quoi bon? Nous sommes encore dans la traduction automatique auto attention � expliquer, 11 et 12 sont une repr�sentation visuelle de contact entre soi Attention m�me mot dans une phrase en anglais produit.

Figure 11 Exemple de visualisation auto Attention

Visualisation auto Attention Exemple 12

Comme on peut le voir sur les deux graphiques (figure. 11, fig. 12), auto Attention syntaxiques peuvent �tre captur�es entre le m�me mot dans une phrase (comme le montre la figure. 11 a une distance de la structure de phrase) ou traits s�mantiques (tels que 12 sur la figure. montrer de ses r�f�rents droit).

De toute �vidence, il serait plus facile de capture comporte l'introduction phrase interd�pendant longue distance auto Attention, car si RNN ou LSTM, besoin de calculer, pour l'interd�pendance � distance de fonction, de passer par un certain nombre de pas de temps dans l'ordre, la s�quence des �tapes les informations accumul�es pour relier les deux, et plus la distance, la capture moins probable efficace.

Cependant auto Attention dirigera les deux mots de la phrase dans le processus de calcul par un lien directement li� �tape de calcul, la distance en fonction de la distance entre les caract�ristiques est grandement raccourci, propice � une utilisation efficace de ces caract�ristiques. De plus en plus, l'attention auto pour augmenter le parall�lisme a un calcul direct utile. C'est la principale raison pour laquelle de plus en plus l'attention auto largement utilis�.

Attention, d'application M�canisme

Ce qui pr�c�de sont d�crits, le m�canisme d'Attention �tude approfondie des diverses applications ont un large �ventail de sc�narios d'utilisation. Dans le processus ci-dessus d�crit, nous avons principalement des t�ches de traitement du langage naturel dans la traduction automatique d'exemple, les �l�ments suivants sont des exemples d'application typiques puis s�lectionnez � partir du traitement de l'image et le champ de reconnaissance vocale qui lui est appliqu� pour �tre bri�vement d�crit.

13 images - Description du cadre COdeurDECodeur de la t�che

Description de la photo (image-Caption) est la profondeur d'une application d'apprentissage typique de combinaison graphique, une image d'entr�e, une sortie de la phrase syst�me d'intelligence artificielle d�crite, la description s�mantique montr� dans l'image �quivalente. Il est �vident que ce sc�nario peut �galement utiliser le cadre COdeurDECodeur aux objectifs de la mission d'adresse, puis la section d'entr�e du codeur est une image, l'image typiquement fonctionnalit� extraction avec CNN, d�codeur ou partiellement utilis� RNN LSTM � la sortie phrase en langage naturel (voir fig. 13).

L'attention a �t� ajout� � ce moment si le m�canisme peut am�liorer de mani�re significative les r�sultats de la sortie du syst�me, o� l'attention du mod�le joue un m�canisme similaire d'attention s�lective visuelle humaine, une entit� dans le mot de sortie sera le centre d'attention concentr�e sur une r�gion respective dans l'image. La figure 14 montre la phrase � Une personne est debout sur une plage avec une planche de surf. � Lorsque la proc�dure correspondant � chaque mot dans l'image de mise au point d'attention selon une r�gion de g�n�ration d'image donn�e.

l'attention figure la zone de mise au point 14 lorsque l'image de chaque mot dans la g�n�ration de phrase

La figure 15 montre un autre exemple de quatre illustre bien ce processus, chacun des exemples ci-dessus est laiss� phrase d'entr�e d'origine est d�crit ci-instruction g�n�r�e automatiquement AI, montre la figure en haut � droite du syst�me lorsque l'AI g�n�r� lorsque l'instruction a soulign� mot, la position correspondante dans la zone de l'image mise au point. Par exemple, lorsque la sortie du chien de mot, le syst�me AI se concentrera plus d'images affect�es � une position correspondant au chien.

Description de la t�che 15 dans l'image figure m�canisme une action de focalisation Attention

Attention entre la. Reconnaissance vocale figure 16 et la s�quence de caract�res de sortie audio

t�che de reconnaissance vocale objectif est de convertir les signaux vocaux en flux de texte, il est �galement des sc�narios d'application typique COdeurDECodeur. section d'entr�e Source encodeur est un signal de flux de la parole, section d�codeur sorties du flux de parole correspondant � la cha�ne de caract�res.

La figure 16 montre visuellement apr�s l'addition du m�canisme d'Attention trame codeur-d�codeur, lorsque l'utilisateur en utilisant ladite phrase de parole combien serait un mandrin de marmotte, l'allocation d'attention entre le signal de son et la caract�ristique de sortie de la partie d'entr�e de caract�res d'une distribution de probabilit�, plus la plus la couleur attribu�e � l'attention du repr�sentant de la probabilit�. Comme on le voit sur la figure, dans ce sc�nario, le m�canisme d'Attention joue le r�le d'entr�e de signal de parole et de sortie align�s caract�ristiques.

Ce qui pr�c�de s�lectionn� seulement quelques exemples d'application typiques m�canismes d'attention dans les diff�rents domaines de l'intelligence artificielle, codeur-d�codeur, plus l'architecture de l'attention en raison de leurs excellents r�sultats pratiques obtenus dans le domaine d'�tudes actuel en profondeur une large plage d'utilisation, la compr�hension et l'utilisation qualifi�e ce cadre pour il y aura une grande aide pour r�soudre des probl�mes pratiques.

Route de la soie

Apprenez � conna�tre la Chine

La machine n'apprend pas: comp�tences d'apprentissage en profondeur la formation m�canisme attention cr�pus 4 apprentissage en profondeur