Par algorithme �volutionnaire enseigner mod�le biom�caniques apprendre � marcher

Cet article est une compilation de technologie blog AI Yanxishe, le titre original:

Apprendre � marcher avec des algorithmes �volutifs appliqu�s � un mod�le bio-m�canique

Auteur | Norman Di Palo

Traduction | Relecture Hu Yinghao | sauce poire Fan

Finition | soeur ananas

Lien original:

https://towardsdatascience.com/learning-to-walk-with-evolutionary-algorithms-applied-to-a-bio-mechanical-model-1ccc094537ce

mod�le utilise Shaped vraies personnes pour marcher sur le chemin du muscle

Le code source de cet article se trouve dans la biblioth�que GitHub

(Https://github.com/normandipalo/learn-to-walk-with-genetic-algs)

2017 NIPS a un d�fi est � l'apprentissage run �: Comme le titre le montre, cette t�che a besoin de concevoir et de d�velopper un algorithme d'apprentissage pour contr�ler le mod�le biom�canique de la marche humaine. actionneur algorithme (la plupart des robots et des probl�mes de diff�rents) est un groupe de muscles, les muscles des jambes de chaque patte 9 par la composition. Sur la lib�ration des d�fis environnementaux OpenSim r�vis�s, afin de les adapter afin d'am�liorer l'ensemble d'apprentissage, augmentant ainsi un signal de r�compense.

Certaines choses ont vraiment mal (ou tr�s correct).

De nombreux participants � concevoir la fin de la profondeur des algorithmes d'apprentissage de renforcement, qui, ces derni�res ann�es dans l'ex�cution des t�ches de contr�le continu est tout � fait bonne. Mais ces mod�les sont �galement n�cessite g�n�ralement beaucoup de calcul op�rateurs de temps et de force d'apprendre des strat�gies efficaces g�n�ralement mieux en parall�le sur plusieurs machines.

J'ai d�cid� d'utiliser ma m�thode pour essayer ce d�fi. Je me rends compte et de d�velopper une m�thode assez l�g�re, que j'ai r�cemment mis au point un contr�le du robot, en particulier les algorithmes �volutifs et contr�leur de r�seau de neurones. Les avantages de l'utilisation de ces algorithmes sont n�cessaires sans guide, hautement disponible simultan�ment en parall�le avec les r�sultats similaires algorithme profondeur RL, voir l'article sur OpenAI. Le probl�me est que le mouvement est compl�tement al�atoire, et donc plus difficile d'estimer le contenu et les modalit�s de l'apprentissage, mais je veux encore essayer cette approche.

Premiers pas, pas de b�b�.

... Il est important de conserver non seulement le mod�le le plus performant, parce que le mod�le sera coinc� dans certains endroits minimum local (difficile de quitter ces points).

algorithme �volutionnaire est utilis� pour l'algorithme d'optimisation num�rique pour optimiser les param�tres li�s � la fonction objective. Que, dans cette question, ces param�tres et fonctions objectifs et ce qui devrait �tre? A partir de l'exp�rience: la jambe d'une mani�re p�riodique. Sous r�serve de mouvement musculaire p�riodique, la loi sine temps, mais la loi est difficile � r�aliser � la main. Comment construire une fonction p�riodique? Voici l'introduction des s�ries de Fourier. Nous savons que les s�ries de Fourier (en utilisant le cosinus sinus accumul�) de toute fonction p�riodique peuvent �tre estim�s. Mais en th�orie, ils peuvent avoir une dur�e illimit�e. Je con�u une s�rie de Fourier partie (interception) de l'�l�ment utilis� pour construire le mouvement des muscles. Ici, seule la s�rie de cosinus avant quatre, et donc un param�tre 8: 4 La valeur de poids est multipli�e par le cosinus des quatre phases de fr�quences diff�rentes. Cette position chaque muscle construire une fonction p�riodique. 9 chacun des muscles de la jambe, j'ai utilis� un ensemble de fonctions p�riodiques 9, l'autre jambe est suppos� ici qu'un mod�le de mouvement similaire, la m�me fonction peut �tre configuration utilis�e, mais le retard 180�. algorithme g�n�tique, en modifiant le r�glage de ces param�tres (par rapport aux param�tres du r�seau de neurones, le nombre a �t� tr�s moins), afin d'optimiser les r�sultats de la fonction objective, il est �vident que ce sont les ultimes fonctions intenses, comme combien la distance de marche du robot de tomber.

Apr�s motif de marche apr�s une journ�e de formation

Les param�tres obtenus � partir du bruit blanc �chantillonn�, la modification al�atoire. Mais si une direction d'�chantillonnage de la main avec des param�tres de performance va encore aller dans ce sens, sachant qu'il n'y a pas d'am�lioration de la performance. J'ai couru trois mod�le parall�le, parce que pour un ordinateur portable pour le calcul du montant a �t� grande. La meilleure performance des poids lourds sont enregistr�s dans un fichier de param�tres. Lorsqu'il est ex�cut� plusieurs lots, la meilleure performance de la formation et des trois premiers param�tres reprend les calculs. Cela permet � l'algorithme de mieux explorer le comportement diff�rent: Il est important non seulement d'explorer le meilleur mod�le actuel, parce que ce mod�le pourrait �tre coinc� dans un optimum local est difficile d'�chapper, et la mauvaise performance du mod�le sur une p�riode de temps mais vous pouvez affiner la formation par d'autres actes au-del� du meilleur mod�le actuel. En effet, apr�s la marche � travers une s�rie de simulations pour red�marrer le meilleur des trois mod�les est la cl� du succ�s est d'apprendre � marcher en mode. En l'absence de connaissance pr�alable, vous pouvez apprendre comme un mod�le humain de comportement moteur, il est tout � fait simple.

Dans un temps de formation relativement courte et le mauvais �tat du mat�riel (Intel Core 2 Duo CPU), le mod�le peut �tre avec succ�s plusieurs �tapes. D'autres am�liorations mod�le d'apprentissage profondeur est �videmment d'obtenir de meilleurs r�sultats, mais il faut une longue formation � temps et mat�riel puissant. Mon but est pas vraiment de rivaliser avec ces mod�les, mais pour montrer comment utiliser des algorithmes g�n�tiques et param�tres de moins de 100 mod�les, un acc�s rapide au mode de marche sur le bas avec le portable. Lei Feng Lei Feng Lei r�seau de r�seau de r�seau Feng

Je veux continuer � voir les articles liens et r�f�rences connexes?

Appuyez sur et cliquez pour ouvrir un lien ou en cliquant sur [algorithme �volutionnaire biologie d'apprentissage pour apprendre � marcher] mod�le m�canique:

AI Yanxishe contenu passionnant mis � jour tous les jours, pour voir plus de contenu:

CVPR 2018 R�sum�: Partie V

Vous avez lu un texte avec des uvres de traitement d'image

Comment am�liorer consid�rablement la vitesse de votre mod�le d'efficacit� de la formation?

Conscience recommande: 20 semaines � �tudier des autocollants d'exp�rience en sciences informatiques (ressources ci-joints)

En attendant vous interpr�tez:

Route de la soie

Apprenez � conna�tre la Chine

Par algorithme �volutionnaire enseigner mod�le biom�caniques apprendre � marcher

CVPR 2018 R�sum�: Partie V

Vous avez lu un texte avec des uvres de traitement d'image

Comment am�liorer consid�rablement la vitesse de votre mod�le d'efficacit� de la formation?

Conscience recommande: 20 semaines � �tudier des autocollants d'exp�rience en sciences informatiques (ressources ci-joints)

OpenCV / masque de segmentation de l'objet R-CNN

GANGogh: cr�er de l'art en utilisant Gans

Donnez votre ordinateur d'�tre un simple � authentification de reconnaissance faciale �

Xinshoubikan: Qu'est-ce que l'apprentissage profondeur? Qu'est-ce que cela fonctionne?