CVPR 2019 | PointConv: nuage de points pour obtenir un fonctionnement efficace de convolution

CVPR 2019 | PointConv: r�aliser un nuage de points convolution efficace 21/04/2019

nuage de points 3D est un type de donn�es irr�guli�res et al�atoires, r�seau de neurones classique convolutionnel est difficile aux donn�es de nuages de points de processus. Des chercheurs de l'Oregon State University robotique et syst�mes intelligents (CoRIS) Institut pr�sente PointConv, peuvent �tre tr�s efficaces pour les donn�es de nuages de points 3D de l'op�ration de convolution d'�chantillonnage non uniforme, qui a obtenu d'excellents sur plusieurs ensembles de donn�es la performance. Comme ICRA-10 convertit les donn�es en un point de trouble, par exemple pour l'utilisation du r�seau PointConv AlexNet VGG et la structure peut �tre obtenue avec des performances similaires classique CNN.

I. Contexte

Dans le robot, le pilote automatique et les applications de r�alit� virtuelle / augment�e, un acc�s direct aux capteurs de donn�es 3D sont de plus en plus communs. �tant donn� que les informations de profondeur peut �liminer une grande partie de la division d'incertitude (ambigu�t� de segmentation) image 2D, et de fournir des informations importantes sur la g�om�trie, par cons�quent, ont la capacit� de traiter directement les donn�es 3D est inestimable dans ces applications. Cependant, les donn�es 3D est g�n�ralement sous la forme d'un nuage de points. nuage de points 3D repr�sent� g�n�ralement par un ensemble de points de commande de pas d'agencement, ayant chacun un point ou sans fonctionnalit�s suppl�mentaires (par exemple des informations RGB). Etant donn� que le point de trouble des caract�ristiques de trouble et qui est diff�rent de l'agencement en treillis classique des pixels dans l'image 2D, l'entr�e classique CNN ce trouble difficile � manipuler.

Cet article propose une m�thode peut �tre r�alis�e de mani�re efficace sur une convolution des donn�es de nuages de points 3D de l'�chantillonnage non uniforme. Nous appelons cette op�ration est PointConv. PointConv multicouche r�seau convolutif de profondeur peut �tre construit sur un nuage de points 3D, les fonctions 2D CNN qui fonctionne sur une image de grille similaire. Cependant, la structure 2D peut �tre r�alis�e avec la m�me traduction invariance r�seau de convolution, et le nuage de points de la substitution invariance de point s�quentiel. Dans l'exp�rience, PointConv effet possible sur la classification des courant atteint le niveau optimal, alors que, sur la segmentation s�mantique du nuage de points 3D peut donner les meilleurs r�sultats lors de la segmentation beaucoup plus que la soumission de papier. Pour illustrer PointConv peut parvenir � un v�ritable op�ration de convolution, nous avons �galement test� la base de donn�es de classification d'images 10-ICRA. Les exp�riences montrent que, PointConv peut atteindre similaire � la pr�cision de la classification traditionnelle de CNN.

La principale contribution de l'�tude:

Densit� convolution pond�r�e propos�e PointConv, il est possible de d�finir des points 3D 3D approximativement totalement arbitraire sur un ensemble de convolution successives.

En changeant l'ordre de sommation, PointConv mise en uvre efficace du projet.

Le PointConv �tendu � d�convolution (PointDeconv), pour obtenir un meilleur r�sultat de segmentation.

Deux, PointConv

Deux fonction continue f (x) et g (x) sur une convolution de dimension d des x du vecteur peut �tre repr�sent� par la formule suivante:

�tant donn� que l'image est en g�n�ral une forme de matrice en forme de grille fixe est stock�, de sorte que l'image, le noyau de convolution est g�n�ralement mis en oeuvre sur un 3x3,5x5 de grille fixe. Dans le CNN, emploi diff�rent quartier est convolution avec un noyau de convolution pour obtenir invariance. Ainsi, l'op�ration de convolution de l'image est une repr�sentation discr�te particuli�re de la convolution continue.

Expression des donn�es de nuages de points 3D et l'image est tout � fait diff�rente. Comme le montre. La figure 1, diff�rente de l'image, le plus souvent par un certain nombre de points 3D nuage de points 3D. Aucune heure avant et apr�s la s�quence entre les points 3D, par cons�quent, une op�ration de convolution sur le nuage de points 3D aurait arrang� invariance, � savoir les changements de point de consigne de points 3D ne devrait pas affecter le r�sultat de la s�quence de convolution. En outre, une op�ration de convolution sur le point de trouble doit �tre adapt� aux diff�rentes formes du quartier.

Pour r�pondre � ces besoins, dans l'espace 3D, l'op�rateur de convolution peut traiter en continu en tant que fonction continue des poids sur une des coordonn�es locales des points de r�f�rence 3D. La formule suivante:

Dans laquelle, W et F sont des fonctions continues, (x, y, z) sont les coordonn�es du point de r�f�rence 3D (Ax, Ay, Az) G repr�sente un rapport de coordonn�es voisinage de points 3D. (2) peut �tre discr�tis� en un nuage de points 3D discret. Pendant ce temps, compte tenu du nuage de points 3D du capteur peut �tre un �chantillonnage non uniforme, afin de compenser pour l'�chantillonnage non uniforme, nous proposons d'utiliser l'inverse de poids pond�r� de densit� du poids appris. PointConv peut �tre repr�sent� par la formule suivante,

Dans lequel, S d�signe une fonction inverse du facteur de densit�. fonctions continues W peuvent �tre approch�es par un perceptron multicouche (MLP). W est une fonction de l'entr�e (x, y, z) de points 3D 3D coordonn�es relatives du centre de la r�gion avoisinante, la sortie est le poids de chaque caract�ristique correspondant au point F de poids. S est une fonction de la densit�, la densit� en chaque point est entr�e, la sortie de chaque point correspond au facteur de densit� inverse. La fonction non-lin�aire peut �galement �tre �valu�e par un perceptron � couches multiples.

La figure 3 montre un flux PointConv dans un quartier des K points 3D. FIG, C_in C_out et caract�ristiques dimensionnelles repr�sentent l'entr�e et la sortie, k, c_in, c_out repr�sente l'indice. Pour PointConv, l'entr�e se compose de trois parties: une coordonn�e relative PLOCAL points 3D, et dans lequel Densit� Densit� F_in. Les coordonn�es relatives PLOCAL point 3D apr�s la fonction continue MLP1 peut �tre obtenue pour chaque point de la caract�ristique correspondant au poids W est, et la densit� de la masse volumique apr�s mlp2 obtenu facteur de densit� inverse S; W de poids r�sultant, le coefficient de densit� inverse S, et dans lequel l'entr�e F Par la suite, l'�quation suivante peut �tre convolu�e pour obtenir une caract�ristique de sortie F_SOR:

PointConv par l'apprentissage de noyau de convolution continu, adapt�e aux caract�ristiques irr�guli�res du nuage de points 3D, pour r�aliser la permutation d'invariance, l'op�ration de convolution de telle sorte que l'image d�velopp�e � partir de la technique classique dans le nuage de points 3D.

Troisi�mement, PointConv efficace

La version originale de PointConv mettre en uvre la consommation de m�moire, une faible efficacit�. Pour r�soudre ces probl�mes, nous proposons une nouvelle m�thode de reconstruction, le standard fonctionnement PointConv r�duit � deux: la multiplication de matrices 2D et convolution. Cette nouvelle technique non seulement prendre avantage des avantages de calcul parall�le du GPU, le principal cadre pour l'apprentissage en profondeur facile peut aussi. Etant donn� que les densit�s caract�ristiques inverses pas de tels probl�mes de m�moire, de sorte que la discussion qui suit se concentre principalement sur la fonction de poids W.

1. cr�er des probl�mes de m�moire

Plus pr�cis�ment, comme le mini-lot B pour rendre la taille de la phase d'apprentissage, N est le nombre de points du nuage de points, K est le nombre de points pour chaque r�gion locale, le nombre de canaux d'entr�e C_IN, C_out du nombre de canaux de sortie. Pour le point de nuage, chaque r�gion locale partagent la m�me fonction de pond�ration, qui peut �tre obtenu par l'apprentissage MLP. Les coefficients de pond�ration de la fonction de pond�ration � diff�rents points dans les poids calcul�s sont diff�rents. MLP g�n�r� par le param�tre de pond�ration taille tensoriel B � N � K � (C_in � C_out). Supposons que B = 32, N = 512, K = 32, C_in = 64, C_out = 64, et les param�tres de poids stock�s en simple pr�cision, une couche de r�seau est requis 8 Go de m�moire. Une telle consommation de m�moire haute rendra le r�seau de formation tr�s difficile. l'utilisation d'un petit nombre de tr�s petits r�seaux et les filtres, ce qui r�duit consid�rablement ses performances.

2. efficace PointConv

Afin de r�soudre les probl�mes de m�moire mentionn�s ci-dessus, nous vous proposons une Lemme la version efficace � base de m�moire PointConv 1, qui est la plus importante contribution � cet article.

Des preuves sp�cifiques peuvent se r�f�rer aux documents originaux. La re-mettre en uvre Lemme 1 PointConv, peut �tre r�alis� une op�ration de convolution exactement, mais r�duire consid�rablement la consommation de m�moire. 1 en utilisant la m�me configuration, une empreinte unique de convolution se r�tr�cira environ 0,1 g 8G, devient 1/64 de l'original.. La figure 5 montre l'effet de convolution PointConv.

Quatri�mement, l'op�ration de d�convolution

Dans la division des t�ches, la possibilit� de transmettre des informations de la couche finement d�polie � la couche est tr�s importante. �tant donn� que la norme convolution PointConv peut �tre mis en uvre, de mani�re � �tendre PointConv PointDeconv est logique. PointDeconv se compose de deux parties: interpolation et PointConv. Tout d'abord, en utilisant un algorithme d'interpolation lin�aire pour obtenir une valeur initiale de la couche de fines caract�ristique, puis une fonction d'optimisation PointConv sur la couche fine, en obtenant ainsi des valeurs de caract�ristiques plus grande pr�cision. La figure 4 montre les processus de la sp�cifiques de l'op�ration de d�convolution.

cinq exp�riences

Pour illustrer l'efficacit� de PointConv, nous avons effectu� sur les tests de base de donn�es de nuages de points 3D standard, y compris ModelNet40, ShapeNet et ScanNet. En m�me temps, afin d'illustrer PointConv et les images peuvent �tre �quivalentes � CNN, nous avons effectu� des tests sur CIFAR10. Ici nous nous concentrons sur les r�sultats des tests sur ScanNet, plus de r�sultats, s'il vous pla�t se r�f�rer � l'article original. Comme le montre le tableau 3, seul r�seau PointConv les quatre couches, peut �tre atteint beaucoup mieux que les autres algorithmes de segmentation effet s�mantique des sc�narios de test, les courant atteint le niveau optimal. La figure 7 montre des r�sultats de la s�mantique visuelle segmentation int�rieure de la sc�ne.

Pour illustrer PointConv peut �tre �quivalent � CNN sur l'image, nous avons effectu� des tests sur CIFAR10. Tout d'abord, les pixels d'image nuage de points de transition CIFAR10 rev�tus dans une grille, puis en utilisant la classification PointConv. Le tableau 4 donne PointConv autre algorithme de nuage de points 3D comparative et classification des images de pr�cision CNN. Peut �tre vu, les couches PointConv 5 peuvent �tre atteints et AlexNet (5 couche CNN) pr�cision similaire, tandis que, PointConv (VGG) peut atteindre VGG similaire et la pr�cision de la classification. Pendant ce temps, le point 3D nuage autres algorithmes, tels que PointCNN etc., pour obtenir une pr�cision de classification est seulement d'environ 80%. Cette exp�rience illustre PointConv peut atteindre les r�sultats d'apprentissage avec le m�me niveau de l'image CNN.

Papier: PointConv: Deep Convolutif R�seaux sur nuages de points 3D

Adresse Papers: https: //arxiv.org/pdf/1811.07246.pdf

Adresse Code: https: //github.com/DylanWusee/pointconv

R�sum�: Les diff�rentes images � l'aide d'une repr�sentation par maillage classique dense de nuage de points 3D est irr�guli�re et d�sordonn�e, r�alisant ainsi une convolution de celui-ci difficile. Dans cet article, nous �tendons le filtre dynamique est une nouvelle convolution PointConv nom. PointConv r�seau profondeur convolutionnel peut �tre construit sur le point de trouble. Nous avons consid�r� la convolution d'une fonction non lin�aire coordonn�es locales 3D, la fonction et la fonction de pond�ration de la densit� de la composition. Pour un point donn�, l'utilisation de Multilayer fonction de poids apprentissage Perceptron, estimation de la densit� du noyau par l'apprentissage fonction de densit�. Pour fonctionner efficacement recalculera le poids, nous avons propos� une nouvelle m�thode de calcul, le r�seau a consid�rablement �largi l'�chelle, la performance est nettement am�lior�e. Heke apprendre le calcul de convolution pour la traduction sur un ensemble de points dans l'espace 3D et le remplacement Bubian Bubian convolution de convolution. En outre, PointConv peut �galement �tre utilis� comme un op�rateur de d�convolution, � partir du sous-�chantillonnage du nuage de point caract�ristique extrait r�percut�es sur la r�solution d'origine. Des exp�riences sur ModelNet40, ShapeNet ScanNet et de montrer les meilleurs r�sultats peuvent �tre obtenus sur la r�f�rence actuelle de segmentation s�mantique difficiles lors de la construction de profondeur PointConv convolutionnel r�seau de neurones pour effectuer des op�rations � partir d'un nuage de points 3D. De plus, le 10 est ICRA transform� en exp�riences de nuages de points montraient, en fonction des performances du r�seau comparable PointConv construit pour effectuer des op�rations structure similaire r�seau de convolution d'image 2D.

Route de la soie

Apprenez � conna�tre la Chine

CVPR 2019 | PointConv: nuage de points pour obtenir un fonctionnement efficace de convolution