CVPR 2019 | 40 dollars avec vous tous les loisirs Manipulateur: syst�mes de contr�le de manipulation bas�e sur la vision � faible co�t

AI Technology Review par: Cet article est le champ sup�rieur des documents s�lectionn�s conf�rence vision par ordinateur CVPR 2019: Lecture � Craves contr�le du bras robotique avec un syst�me �conomique bas� sur la vision � de. Cet article coop�ration men�e par l'Universit� Johns Hopkins, l'Universit� Tsinghua et l'Universit� de P�kin, Wang Yizhou Groupe de travail.

Cet article pr�sente un syst�me de commande du bras robot bas� sur la vision peut �tre appliqu�e � 40 $, il n'y a pas le bras robotis� pas cher sur le capteur. Avec un seul syst�me de cam�ra en utilisant la profondeur de convolution de r�seau de neurones, en temps r�el manipulateur estimation pose en trois dimensions, et form�s par l'agent d'apprentissage de renforcement signal de commande de sortie. En outre, le syst�me de contr�le peut mettre en oeuvre le bras de robot atteint une coordonn�es en trois dimensions de donn�es un espace donn�. Sur cette base, nous nous rendons compte �galement la t�che de saisir automatiquement les d�s. De plus, l'estimation de la pose et de la formation intensive pour apprendre totalement d�pendant des donn�es g�n�r�es dans un environnement virtuel, sans surveillance humaine et �tre �tiquet�s.

Site Web du projet: https://craves.ai (y compris le code et les donn�es)

Documents Adresse: https://arxiv.org/abs/1812.00725

br�ve introduction

Comment donner une vision du robot, a permis de r�aliser des t�ches complexes dans un environnement changeant au cours des derni�res ann�es a attir� l'attention de plus en plus de chercheurs. Cependant, la plupart des �tudes pr�c�dentes en utilisant un robot industriel co�teux (d'une valeur de plus de dix mille dollars), ce qui limite sans doute les chercheurs g�n�raux d'entrer sur le terrain. Par cons�quent, Ce papier vise � construire une plate-forme pour la robotique la recherche et l'�ducation par le mat�riel � faible co�t pour abaisser le seuil de la recherche de mat�riel dans des domaines connexes.

Nous avons choisi le bras robotique OWI-535, parce que:

tr�s pas cher Seulement environ 40 $;
disponibles Sur Taobao ou Amazon peuvent �tre achet�s;
tr�s populaire , Un grand nombre d'utilisateurs � t�l�charger modification corr�lative et l'exploitation de la vid�o sur Youtube.

En m�me temps, ses lacunes sont �videntes: Aucun capteur Et ne peut donc pas obtenir un signal de r�troaction et d'obtenir un contr�le pr�cis. Mais les gens peuvent faire un peu de bras robotique de pointe pour compl�ter la t�che en observant le bras robotique par le contr�le � distance, par exemple, des tamis empil�s. Comment comme un homme d'algorithmes de vision pour contr�ler un capteur de bras robotis� est pas l'objet de cet article.

Nous avons choisi d'utiliser une cam�ra RVB externe comme un capteur de vision, en temps r�el pose manipulateur d'estimation en trois dimensions, et g�n�rer un signal de commande de r�troaction. sch�ma de principe du syst�me tel que repr�sent� ci-dessous:

Le syst�me lit d'abord une entr�e (figure vert) flux vid�o RVB, qui est entr�e dans le r�seau entre la pose estim�e (en bleu) restaure les informations de position en trois dimensions du bras de robot. Enfin, le dispositif de commande est re�u par le renfort (partie orange dans le dessin) constituant l'agent de formation des informations de position tridimensionnelle, g�n�re un signal de commande, commande le mouvement du moteur du bras de robot.

cet article La principale contribution Y compris:

Conception d'un faible co�t, la mise en uvre du syst�me de manipulation sensorless;
Nous avons propos� une combinaison de domaine semi-supervis� g�om�trique a priori adapter les m�thodes pour obtenir module d'estimation de pose manipulateur migr� du virtuel au r�el;
Il fournit trois ensembles de donn�es annot�es et un environnement virtuel pour favoriser le d�veloppement de futures recherches dans ce domaine.

Le code source ouvert et les donn�es connexes ont �t�, disponible � partir de la page d'accueil du projet (https://craves.ai).

Voici la description de l'ensemble des donn�es recueillies, le module d'estimation de pose et les r�sultats exp�rimentaux.

ensembles de donn�es collect�es

�tant donn� que le co�t d'acquisition des donn�es r�elles avec un �tiquetage pr�cis est tr�s �lev�, donc nous avons construit un environnement virtuel pour g�n�rer automatiquement des donn�es d'annotation pour la formation. Afin de v�rifier la performance du mod�le dans la sc�ne r�elle, nous recueillons deux s�ries suppl�mentaires de donn�es r�elles, et l'annotation manuelle. ensembles et environnements virtuels sont disponibles pour t�l�chargement trois donn�es.

Le premier ensemble de donn�es est ensemble de donn�es virtuel (Virtual Dataset) . Nous avons utilis� Unreal 4 moteur et son plug-ins Unrealcv pour le rendu et les sc�narios d'acquisition de donn�es. Lors de la g�n�ration des donn�es de formation, notre position sur la cam�ra, des sc�nes d'�clairage et d'arri�re ont �t� randomis�s pour am�liorer la capacit� de g�n�ralisation du r�seau dans la sc�ne r�elle. Nous avons recueilli un total de 5000 images sous forme de donn�es de formation. �tiquette cube virtuel g�n�r� automatiquement, comprenant une information de position en trois dimensions.

Le deuxi�me ensemble de donn�es est ensemble de donn�es Laboratory (Laboratoire du jeu de donn�es) . Nous avons pris des photos du bras robotique dans un environnement de laboratoire, les param�tres d'�talonnage en trois dimensions et l'attitude � l'int�rieur et � l'ext�rieur de l'appareil photo de bras robotis�. ensemble de donn�es de laboratoire se compose de quelque 500 images, uniquement pour les tests.

Le troisi�me ensemble de donn�es est ensemble de donn�es YouTube . Nous explorons les vid�os similaires sur YouTube bras robotique OWI-535, et une main marqu�e, en raison des param�tres de la cam�ra interne et externe sont inconnus, alors nous avons marqu� la position en deux dimensions des points cl�s. ensemble de donn�es YouTube se compose d'environ 500 images, uniquement pour les tests.

jeux de donn�es Exemple d'image ci-dessous:

Sur deux lignes: les donn�es virtuelles, troisi�me ligne: donn�es de laboratoire, la derni�re ligne: donn�es YouTube

La migration en trois dimensions peut poser une estimation

Manipulateur module d'estimation de pose en trois dimensions est le composant principal du syst�me. Qui est une entr�e d'image RGB, et la sortie est une position en trois dimensions du bras de robot, � savoir, l'angle de chaque arbre. Plus pr�cis�ment, il se compose de deux sous-modules: Le premier sous-module il est Deux dimensions estimation du point critique r�seau de neurones, pour restaurer les coordonn�es bidimensionnelles des points cl�s de l'image d'entr�e; Le deuxi�me sous-module Sur la base de deux dimensions point critique Restaurer la position en trois dimensions .

Le point cl� estimer r�seau de neurones � deux dimensions en utilisant le r�seau Stacked Hourglass , le r�seau avec une structure compl�te de convolution. Nous cl� 17 pr�d�finies sur le bras robot de bon, le r�seau de sortie de la figure 17 qui lui correspond chaud canaux. Dans la pr�vision, nous prenons la position de mise au point de la r�ponse figure la plus �vidente que le r�sultat de pr�diction.

Apr�s l'obtention de la position � deux dimensions, le deuxi�me sous-module de r�duction � trois dimensions. Nous bras robotique mod�lis� comme un mod�le de corps rigide sur quatre degr�s de libert�, la position de 17 points cl�s � respecter certaines contraintes. Nous avons une solution d'�quation d'optimisation en ligne, � savoir en minimisant l'erreur entre la position pr�dite et le mod�le � trois dimensions d'une position de cl� de reprojection en deux dimensions afin d'obtenir une solution optimale de l'angle de l'arbre de chaque bras de robot.

De plus, nous vous proposons un nouveau algorithme de migration de domaine semi-supervis� . Utilisez uniquement le r�seau de donn�es virtuel pour la formation, la performance dans l'image r�elle est pas assez bon, mais apr�s avoir utilis� notre algorithme, la performance de g�n�ralisation est nettement am�lior�e. La figure ci-dessous montre le sch�ma synoptique de l'algorithme de migration de domaine. Nous utilisons d'abord des images virtuelles pour �tre r�seau de neurones pr�-form�s. Apr�s cela, nous ne marquera pas sur la vraie image dans le r�seau, pour g�n�rer la pr�vision initiale. En raison des diff�rences entre les domaines, les pr�visions initiales peuvent g�n�rer des erreurs. Nous pr�disons les r�sultats bas�s sur la reconstruction initiale, et ce retour de r�sultat � une projection � deux dimensions, ont obtenu le points cl�s de la pr�vision optimis�e. Depuis l'introduction de la structure rigide du robot solide armer une information a priori dans le processus, de sorte que le r�sultat pr�dit de l'optimisation sera mieux que la pr�vision initiale. Enfin, nous devons affiner le r�seau de neurones avec l'image r�elle g�n�r�e par cette m�thode et faux �tiquetage.

Nous utilisons d'abord des images virtuelles pour �tre r�seau de neurones pr�-formation (ligne en pointill� vert). Ensuite, nous ne l'avons annot� l'image r�elle dans le r�seau, pour g�n�rer la pr�vision initiale. Ensuite, la reconstruction en trois dimensions bas�e sur les pr�visions initiales et les r�sultats de ce retour de projection � deux dimensions pour obtenir les points cl�s de la pr�vision optimis�e. Enfin, le r�seau peaufinage (bleu sur la figure).

Les r�sultats exp�rimentaux

Le point cl� de la pr�diction � deux dimensions:

Comme indiqu� ci-dessous, nous montrons que l'algorithme de migration de domaine semi-supervis� (derni�re ligne) dans un environnement de laboratoire, nous proposons, contre seulement utiliser le r�seau de donn�es de formation virtuelle (premi�re ligne) la performance est tellement am�lior�e. Et la m�thode est sup�rieure aux autres la migration de domaine algorithme non supervis�, y compris CycleGAN et similaires. Plusieurs domaines comparatifs sont impliqu�s dans la m�thode de migration vers l'ensemble de donn�es que le domaine cible Lab. La pr�cision de ses donn�es sur YouTube jamais vu par rapport � d'autres m�thodes ont consid�rablement am�lior�, ce qui indique que le r�seau comme une g�n�ralisation toute la promotion.

Le tableau ci-dessus est le mod�le obtenu sous diff�rents modes de migration des deux dimensions la pr�cision de d�tection du point critique. Les donn�es de test sont d�finies dans les donn�es virtuelles, des ensembles de donn�es de laboratoire, ensemble de donn�es YouTube, en fait, YouTube-vis du calcul est visible aux points cl�s des r�sultats.

R�sultats de la reconstruction en trois dimensions:

La figure suivante montre les r�sultats qualitatifs de la reconstruction en trois dimensions. La figure est l'image d'origine, la figure suivante est le r�sultat de rendre la reconstruction en trois dimensions et la visualisation des images. �tre vu, le syst�me peut �tre la reconstruction en trois dimensions du bras du robot dans un contexte complexe. Les r�sultats quantitatifs montrent que les ensembles de donn�es de laboratoire, l'erreur de reconstruction de l'angle de bras de robot est d'environ 4,8 degr�s.

R�sultats de contr�le: Manipulator

Nous utilisons l'algorithme d'apprentissage de renforcement de l'agent GPDD form�s pour interagir dans un environnement virtuel. Entrez le corps de prise de d�cision intelligente est l'�tat actuel, l'�tat cible et un moment. Un signal de commande est d�livr� en sortie vers le moteur 4 du moteur. Nous avons test� sur deux t�ches.

La premi�re t�che est port�e, � savoir faire l'extr�mit� avant d'un bras de robot juste au-dessus de la cible sp�cifique de port�e. Ceci est un manipulateur de � comp�tences de base �. Pour �valuer la qualit� des r�sultats en mesurant la distance horizontale entre la position finale et la position cible. La figure est une vue sch�matique de notre dispositif exp�rimental, la plaque de r�f�rence inf�rieure 9 point noir devient la position cible. Dans cette t�che, nous pouvons obtenir une pr�cision et un contr�le analogue � l'homme.

Il peut bien travailler dans des perspectives diff�rentes, arri�re-plans.

La deuxi�me t�che est d�s assurant une prise, la position en trois dimensions des matrices de l'�tage de mesure donn�e manuellement.

Plus de r�sultats Veuillez visiter la maison du projet et des documents.

page d'accueil du projet: https://craves.ai (y compris le code et les donn�es)

Vid�o de d�monstration: https://www.bilibili.com/video/av47292064/

Documents Adresse: https://arxiv.org/abs/1812.00725

r�f�rences:

Alejandro Newell, Kaiyu Yang et Jia Deng. R�seaux Hourglass Stacked pour l'estimation de pose humaine. Dans Conf�rence europ�enne sur l'ordinateur Vision 2016.

Weichao Qiu, Fangwei Zhong, Yi Zhang, Siyuan Qiao, Zihao Xiao, Tae Soo Kim, Yizhou Wang, et Alan Yuille Unrealcv: .. mondes virtuels pour la vision par ordinateur Dans Actes de la 25e ACM Conf�rence internationale sur le multim�dia, 2017.

Jun-Yan Zhu, Taesung Park, Phillip Isola et Alexei A.Efros. Image � l'image de traduction appari� en utilisant les r�seaux accusatoires cycleconsistent. Dans Conf�rence internationale sur l'ordinateur Vision 2017.

2019 Sommet mondial sur l'intelligence artificielle et robotique

2019 Nian 12 Juillet � 14 , Organis� par la F�d�ration chinoise Computer (CCF), Lei Feng r�seau et l'Universit� chinoise (Shenzhen) co-parrain� par Hong Kong, Shenzhen, Institut de recherche sur l'intelligence artificielle et robotique de Co 2019 Sommet mondial sur l'intelligence artificielle et robotique (D�sign� par CCF-GAIR 2019) Shenzhen sera le rideau officiel.

D'ici l�, le laur�at du prix Nobel JamesJ. Heckman, acad�micien �tranger, pr�sident du haut du monde, bien connu Fellow, un certain nombre d'invit�s poids lourds seront personnellement Zuozhen , Pour discuter de l'intelligence artificielle et sur le terrain complexe de situation de survie de la robotique, la production, l'investissement et ainsi de suite.

Limit�e a pr�sent� aujourd'hui trois billets code promotionnel 850 yuans, des billets pour le prix initial de 1999 yuans, ouvrez l'un des liens suivants peuvent �tre utilis�s, apr�s seulement coupons 1149 yuans, limit�e 3, premier servi, jusqu'� �puisement du stock.

https://gair.leiphone.com/gair/coupon/s/5cff23c18a14c

https://gair.leiphone.com/gair/coupon/s/5cff23c189e2c

https://gair.leiphone.com/gair/coupon/s/5cff23c189b2d

Cliquez sur Lire l'original Dans le groupe d'�change top CVPR verra CVPR plus dynamique 2019

Route de la soie

Apprenez � conna�tre la Chine

CVPR 2019 | 40 dollars avec vous tous les loisirs Manipulateur: syst�mes de contr�le de manipulation bas�e sur la vision � faible co�t