vous a appris � former RNN

Cet article a �t� compil� Lei groupe de technologie blog Feng, le titre original soluce �tape par �tape de formation RNN - Partie I, auteur Eniola Alese: Lei Feng r�seau presse.

Traduction | Zhao Pengfei Cheng Sijie finition | Jiang Fan

RNN de se propager peu � peu avant l'exercice

RNN cellule unique de l'algorithme de propagation de front en

Dans l'article pr�c�dent, nous avons introduit la structure de base de RNN et �largissons dans une s�rie chronologique dans les cellules cha�ne de cycle, les cellules appel�es RNN. Ci-dessous, nous vous d�voilerons la structure interne d'une seule cellule RNN et calcul de la propagation vers l'avant.

Lequel proc�d� est divis� en une pluralit� d'�tapes:

La premi�re �tape: cellule accepte deux entr�es: xt et at-1.

Deuxi�me �tape: Ensuite, calculer le produit de la matrice , W_xh par xt, W_ah par at-1. Ensuite, en ajoutant le produit de deux ou plus, et en ajoutant un d�calage B_H, calcul� ht.

La troisi�me �tape: Ensuite, les �tapes ci-dessus, le h (t) transmis � la fonction d'activation (tanh tel ou RELU) de calcul a (t). fonction d'activation utilis� dans la fonction tanh pr�sente forme de r�alisation.

Quatri�me �tape: sortie de cellule at et il passe � la cellule suivante pour des calculs ult�rieurs.

Cinqui�me �tape: Ensuite, calculer ot, ce qui est toutes les valeurs possibles de la probabilit� de sortie de journal non standard. La m�thode consiste � calculer le produit de la matrice , W_ao par at, avec b_o ajout�.

Sixi�me �tape: Enfin, par ot transmis � la fonction d'activation (par exemple, sigmo�de ou SoftMax), pour obtenir un vecteur probabilit� normalis�e t effectivement sortie. La s�lection d'une fonction d'activation de sortie d�pend g�n�ralement du type de sortie souhait� (pour les sorties binaires du sigmo�de, Softmax pour la sortie multi-classe).

Forward-propagation algorithme

Avant, et non seulement ex�cuter en une seule �tape de l'algorithme de propagation cellulaire RNN est ex�cut� sur l'ensemble du r�seau RNN. A partir de la couche cach�e �tat d'initialisation de a0, la totalit� de la s�quence de temps t = 1 � T, et des poids partag�s d�calage vecteur W_xh, W_ah, W_ao, B_h, b_o, r�p�t� dans chaque s�rie de temps dans chacune des �tapes ci-dessus .

Par exemple, si nous avons une s�quence d'entr�e de 8 x1, x2, ...... x8, ce r�seau avant de calculer le processus de propagation dans les �tapes 1-6 du cycle est r�p�t� 8 fois.

Ce qui pr�c�de est la premi�re �tape de formation RNN, dans la seconde partie de cet article pr�sentera � l'algorithme de propagation (BPTT), et la fa�on de calculer le gradient.

Merci pour votre temps, recevoir des commentaires ou des commentaires.

site Blog https://medium.com/learn-love-ai/step-by-step-walkthrough-of-rnn-training-part-i-7aee5672dea3

Lei Feng Lei Feng net net

Route de la soie

Apprenez � conna�tre la Chine

vous a appris � former RNN | Partie I