Peu importe la fa�on dont vous faites tourner saut ne se arr�te pas, mais aussi le cadeau parfait estimation de la pose 3D

Les poissons provenant de la partie inf�rieure de la brebis concave treize non-Temple rapports Qubit | Num�ro public QbitAI

Laissez pr�dit par l'IA, vous attraper � dragon peint � la main gauche, main droite peinture Rainbow � action pour AI comprendre le comportement humain est essentiel.

Vous voulez faire cela, les donn�es de mouvement humain est essentiel, mais en fait, le vrai donn�es de mouvement 3D est pr�cis�ment des ressources rares.

Maintenant, une �tude de l'Institut Max Planck pour les syst�mes intelligents, l'utilisation du cadre d'apprentissage de la confrontation, en l'absence de r�elles �tiquettes 3D, mais aussi de la vid�o en temps r�el dans le mouvement humain, de faire une pr�diction raisonnable sur la cin�matique.

Comme �a, courir, sauter Nope:

Et, par rapport � l'ancienne g�n�ration, ce nom est VIBE les gens savent mieux Way, m�me de lever ses bras plusieurs fois, sont calcul�s clairement.

Ainsi, VIBE � la fin est de savoir comment faire?

Confrontation cadre d'apprentissage

La principale innovation est l'utilisation d'un cadre d'apprentissage de la confrontation.

Dans un aspect, l'utilisation du temps (temporelle) g�n�re le r�seau, les param�tres du mod�le de chaque ch�ssis de carrosserie SMPL estim�e d'une s�quence vid�o.

Note: SMPL, qui est une m�thode de mod�lisation corps humain Une Skinned multi-personne Mod�le lin�aire, propos� Max Planck.

Plus pr�cis�ment, �tant donn� que d'une seule entr�e vid�o, en utilisant une caract�ristique de chaque trame CNN pr�-form� extrait.

La formation des unit�s de cycle de d�clenchement bidirectionnel du codeur temps, la variable de sortie comprend une information pass�e latent et cadre futur.

Ensuite, utilisez ces fonctions sur le mannequin r�gression des param�tres SMPL.

D'autre part, le discriminateur de mouvement capable d'acc�der � un grand nombre de l'action humaine au format SMPL.

Les �chantillons g�n�r�s par le g�n�rateur, et de AMASS Les �chantillons que l'entr�e du discriminateur, l'action r�elle d'identifier et de former son action � pseudo �.

AMASS est un grand open source ensemble de donn�es de capture de mouvement 3D contient 40 heures de donn�es sportives, 344 sujets, plus 11000 actions. (Voir la fin de l'adresse du projet)

�tant donn� que le r�seau de circulation lors du traitement de l'ordre d'entr�e cach�e des mises � jour de son �tat final restera cach� dans les informations de synth�se de s�quence. Les chercheurs ont introduit le discriminateur de m�canisme d'auto-attention � �largir le r�le de l'ultime repr�sentent cadre le plus important.

Un certain nombre d'indicateurs de performance de SOTA

Les anciennes r�gles, premier regard sur l'ensemble de donn�es.

Pour l'ensemble de donn�es de formation, en utilisant un m�lange d'ensembles de donn�es 2D et 3D. PennAction et PoseTrack Est les seuls ensembles de donn�es vid�o 2D sol v�rit�, ensembles de donn�es 3D sont utilis�s MPI-INF3DHP et Human3.6M . De plus, l'utilisation de AMASS �tre aussi une formation conflictuel, l'acc�s � des �chantillons r�els.

Dans l'�valuation, la comparaison, l'utilisation des ensembles de donn�es est principalement 3DPW , MPI-INF3DHP et Human3.6M .

Comparative puis, apr�s la formation, sur les trois ensembles de donn�es, en utilisant les m�thodes les plus avanc�es r�sultent, comme le montre le tableau 1:

TABLEAU 1 : Sur 3DPW, MPI-INF-3DHP, H36M trois ensembles de donn�es, chacun des r�sultats des m�thodes les plus avanc�es de comparaison

Les chercheurs de ces trois ensembles de donn�es, et d'autres VIBE le plus avanc�, bas� sur un mod�le et le calendrier pour faire une comparaison des performances.

Il peut �tre difficile de voir, les performances de VIBE dans 3DPW et MPI-INF-3DHP deux ensembles de donn�es est mieux, que d'autres mod�les sur la performance.

Le jeu de donn�es H36M, �galement relativement proche de la valeur optimale des r�sultats actuels.

En outre, le tableau 1 se rapporte �galement � une erreur d'acc�l�ration (erreur d'acc�l�ration), on peut voir � partir des valeurs, par rapport � l'erreur sur la base de trame-HMR VIBE est plus petite, le r�sultat est plus lisse.

Cependant, compar� avec le mod�le en fonction du temps, sup�rieur � l'erreur d'acc�l�ration, mais il y avait un probl�me, un mod�le bas� sur le temps, avec un traitement de lissage plus � agressif �, telle que la pr�cision diminue la vid�o de mouvement rapide, comme la figure. Fig.

Sur : VIBE, � c�t�: HMR bas� temps.

mod�le VIBE est capable de restaurer la rotation globale correcte, ce qui est un probl�me plus grave soulev�e par la m�thode pr�c�dente dans l'existence, qui figure �galement dans le tableau 1 et les indicateurs PVE MPJPE bonne raison.

De plus, les exp�riences ont �galement d�montr� qu'il existe et il n'y a pas DM discriminateur de mouvement La performance du mod�le a aussi une grande influence, comme le montre le tableau 2.

Tableau 2: Ablation de discriminateur mouvement DM

Aussi essay� plusieurs configuration auto attention, la m�thode VIBE statique des m�thodes combin�es sont compar�es, les r�sultats pr�sent�s dans le tableau 3.

Tableau 3: auto-attention Ablation

GitHub est open source, jeu de d�marrage rapide Demo

En plus de jours suspendus saut�es des r�sultats exp�rimentaux, une autre est que des nouvelles passionnantes code de papier est open source!

Les chercheurs ont utilis� dans le processus de mise en uvre est Pytorch, le besoin d'�quipement de laboratoire pour soutenir � la fois le raisonnement du CPU et le GPU, jusqu'� 30 images / s en RTX2080Ti, et d'obtenir des r�sultats sur 3DPW SOTA et ensemble de donn�es MPI-INF-3DHP.

Les pr�paratifs sont �galement tr�s simples, d'abord � cloner ce projet, entrez simplement:

git clone https://github.com/mkocabas/VIBE.git

Utilisez les exigences de p�pin ou d'installation de Conda:

# Pip bash install_pip.sh # Conda bash install_conda.sh

Ensuite, dans le projet GitHub, t�l�charger un bon jeu de donn�es, vous pouvez ex�cuter:

bash prepare_data.sh

Ensuite, vous pouvez ex�cuter le code de d�monstration a �t� pr�par� (VIBE peut fonctionner sur une vid�o):

# Ex�cuter sur une vid�o locale python demo.py --vid_file sample_video.mp4 --output_folder sortie / --display # Run sur une vid�o YouTube python demo.py --vid_file https://www.youtube.com/watch?v=wPZP8Bwxplo --output_folder sortie / --display

Bien s�r, si vous ne disposez pas de l'�quipement n�cessaire pour les exp�riences ci-dessus, l'environnement, vous pouvez utiliser Google Colab. De m�me, les chercheurs ont �galement pr�ts � vous Colab de la � voie rapide � pour lancer la d�mo, vous pouvez tamponner le lien ci-dessous:

https://colab.research.google.com/drive/1dFfwxZ52MN86FA6uFNypMEdFShd2euQA

Alors, pour commencer rapidement l'essayer!

portail

Adresse Papers: https: //arxiv.org/abs/1912.05656

Adresse GitHub: https: //github.com/mkocabas/VIBE

ensemble de donn�es AMASS: https: //amass.is.tue.mpg.de/

- FIN -

Qubit QbitAI � titres sur contrat

Suivez-nous, la premi�re fois inform� l'avant-garde des d�veloppements scientifiques et technologiques

Route de la soie

Apprenez � conna�tre la Chine

Peu importe la fa�on dont vous faites tourner saut ne se arr�te pas, mais aussi le cadeau parfait estimation de la pose 3D | code open source

Confrontation cadre d'apprentissage

Un certain nombre d'indicateurs de performance de SOTA

GitHub est open source, jeu de d�marrage rapide Demo

portail