la recherche � acad�mique � bas�e sur la reconnaissance des veines du doigt r�seau Capsule

r�sum�

Pour des questions d'information des veines du doigt est perdu dans l'espace sur le r�seau de neurones convolutionnel (CNN), nous vous proposons un doigt veine capsule � base algorithme de reconnaissance de r�seau (r�seau Capsule, CapsNets) de. CapsNets forment � capsule � est transmis dans tout le cours du bas vers le haut, de sorte que la veine doigt paquet fonction multidimensionnelle sous la forme d'un vecteur, dans lequel le r�seau est enregistr�, et la reprise ne soit pas perdu. Avec 60000 images que la formation selectionn�es 10000 L'image montre l'ensemble de test par l'am�lioration de l'image, apr�s avoir appris recadr�e. Les exp�riences montrent que, par rapport aux caract�ristiques structurelles CapsNets r�seau CNN lors de la manipulation de l'effet de la zone de ligne de cr�te est plus �vidente, le contraste VGG une pr�cision accrue de 13,6%, converge de perte � la valeur 0,01.

am�lioration Narrow maison: fait r�f�rence � la d�coration d'int�rieur, l'am�nagement paysager est du point de vue de sorte que l'espace int�rieur plus beau;

am�lioration de l'habitat G�n�ralis�e comprennent: la transformation de l'espace int�rieur, d�coration, nous parlons aujourd'hui am�lioration de l'habitat et plus largement � l'am�lioration de la maison est une d�coration int�rieure compl�te et la d�coration.

format de citation chinois: Yucheng Bo, gr�ce Xiong mains. La reconnaissance des veines de la capsule base fait r�f�rence au r�seau Technologie �lectronique, 2018,44 (10): 15-18.

Anglais format de citation: Yu Chengbo, Xiong Dien. La recherche sur la reconnaissance des veines du doigt bas� sur le r�seau de la capsule . Application de la technique �lectronique, 2018,44 (10): 15-18.

0 introduction

Ces derni�res ann�es, le d�veloppement de la journ�e d'apprentissage automatique des mises � jour par jour, l'algorithme d'apprentissage en profondeur a �galement �t� mise � jour du progr�s. Depuis sa cr�ation en 2012 AlexNet , jusqu'en 2017 VGG , GoogleNet , optimize ResNet et d'autres r�seaux, version am�lior�e d'apparence pour faire en sorte que la profondeur de l'algorithme d'apprentissage ImagNet d�fi dans la classification d'images beaucoup mieux que les autres algorithmes de classification. r�seau neuronal convolutif (CNN) extrait par les caract�ristiques de convolution, la cartographie du bas vers le haut, pour mettre en oeuvre approximation de fonction complexe, capacit� d�montr�e � l'apprentissage de l'intelligence. Document pr�sente l'am�lioration de l'image des veines du doigt de AlexNet de formation du r�seau, le 3 � 3 noyau de convolution � 1 � 1 et r�duit le nombre de cartes de fonction, apr�s le cycle de 50.000 fois, le taux de reconnaissance de 99,1%. Document de formation de r�seau VGG utilisant l'image de la veine de doigt, le contraste de faible qualit�, la formation des r�sultats en mati�re de qualit�, et une couche de r�seau couche d'image de haute qualit� de 16 r�seaux de VGG de VGG 19, la couche 16, dans lequel le taux d'erreur est aussi faible que 0.396 r�seaux VGG ( image de haute qualit�).

Selon les normes de formation des images de haute qualit�, CNN utilis� pour la reconnaissance du doigt veine, mais il a aussi quelques probl�mes pratiques. Collected par collection d'images de collection a une tr�s grande chance � l'image des veines du doigt de faible profondeur, tandis que le traitement d'image est bas�e sur une matrice � deux dimensions, CNN image globale des veines du doigt lorsque la fonction d'apprentissage ne fonctionne pas bien, cach� dans Table cortex vers l'arri�re IV n'est pas appris, donc va s�rieusement affecter la pr�cision de la reconnaissance.

Comme on le voit, l'image de la veine qui pr�sente une plus petite veineuse locale peu profonde, de couleur plus claire, la r�partition in�gale ne se termine pas, conduit � la raison principale est que la comparaison par cette veine, la cam�ra infrarouge ne peut pas �tre clairement � travers les tissus tir. Cependant, une image normale de l'�paisseur de la veine, une mani�re significative la distribution de couleur uniforme.

D�cembre 2017, GE a propos� HINTON CapsNets structure de r�seau et la formation sur la pr�cision multiMINIST de 99,23%, pour obtenir une pr�cision sur l'ensemble de test affinist 79%, d�passant de loin les 66% CNN, alors que CapsNets moins de temps, il est actuellement le r�seau de la plus haute pr�cision . l'image de la veine de doigt existent souvent chevauchant la veine, ce qui entra�ne un processus d'acquisition d'image de la veine de chevauchement se produit souvent. CNN apprentissage pauvre de position dans l'espace, de sorte que lors de la capture de l'acquisition de l'image une pluralit� de fois ont le m�me doigt, tel que la fonction d'apprentissage sur la carte chaque veine et CapsNets position dans l'espace de l'image de la veine de traitement beaucoup plus CNN, le processus d'apprentissage sous la forme de � capsule � est transmise depuis le bas vers le haut, un ensemble de caract�ristiques multidimensionnel, r�duisant ainsi le nombre d'�chantillons de formation, tout en conservant la faible probabilit� de caract�ristique de la veine de l'�v�nement. Pour cette raison, la m�thode propos�e de reconnaissance ici veine doigt de CapsNets est appliqu�e.

1 CapsNets

l'architecture r�seau 1.1

Certaines des principales t�ches dans la vision informatique n�cessite une architecture diff�rente CNN, la classification de l'image de l'effet CNN a �t� reconnu par des chercheurs de tout le monde, mais les probl�mes suivants:

(1) CNN d'accepter un grand nombre d'images de formation, ce qui rend l'obtention d'�chantillons de formation pour passer beaucoup de temps, mais CapsNets utiliser moins de donn�es de formation pour la formation.

(2) CNN ne peut pas traiter bien avec l'ambigu�t�. CapsNets m�me dans les sc�nes denses, peuvent �galement bien.

(3) CNN manque beaucoup d'informations dans la couche de mise en commun. couche prenant le maximum Mise en commun de conserver l'apparence d'une probabilit� de fonctionnalit�s plus, alors que l'arrondi les caract�ristiques apparaissent moins de probabilit�, nous avons souvent besoin de cette information importante. Ces couches r�duisent la r�solution spatiale, de sorte que leur entr�e ne peut pas �tre sortie de petits changements pour r�pondre. Lorsqu'il est n�cessaire de conserver des informations d�taill�es sur le r�seau, ce qui est un probl�me. Aujourd'hui, la solution � ce probl�me est de restaurer une partie de l'information perdue par la mise en place d'une architecture complexe autour de CNN. Pour plus d'informations CapsNets propri�t� est conserv�e dans tout le r�seau plut�t que vers le bas apr�s la r�cup�ration des pertes. Entrez les petits changements conduisent � des changements subtils dans la production, l'information est conserv�e, on appelle cela la d�naturation et ainsi de suite. Par cons�quent, CapsNets peuvent utiliser le m�me simple et une architecture coh�rente dans diff�rentes t�ches visuelles.

(4) CNN n�cessite des composants suppl�mentaires pour identifier automatiquement un composant auquel appartient l'objet. membre de la hi�rarchie CapsNets peut �tre pr�vue.

CapsNet r�seau est tr�s peu profond, et la convolution des couches enti�rement connect�es, plus la couche totale de 3 couches. CNN fonction de bas niveau des performances d'extraction est tr�s bonne, contrairement CapsNets est utilis� pour caract�riser la � instance � d'un objet, il est donc plus appropri� pour caract�riser des exemples avanc�s. Par cons�quent, convolution caract�ristique classique CNN ajout�e couche sous-jacente dans les CapsNets sous-jacentes font l'extraction.

Comme repr�sent�, les caract�ristiques de bas niveau de la capsule primaire, dimension seconde couche de convolution est de 6 x 6 x 8 x 322, comprenant les �tapes 32 DO 8 pour le rouleau 9 x 9 x 256 du filtre 2 le fonctionnement du produit, CNN, les dimensions des couches 6 � 6 � 1 � 32 est avec un 6 x 6 x 32 �l�ments, chaque �l�ment est un scalaire, la capsule, les dimensions des couches 6 � 6 � 8 � 32 est l� 6 x 6 x 32 �l�ments, chaque �l�ment est un vecteur 1 � 8, le magasin principal vecteurs de caract�ristiques de bas niveau.

De Capsule primaire � chiffres Capsule, PrimaryCaps et DigitCaps est enti�rement connect�, mais pas comme un scalaires traditionnel CNN et scalaire connect� � cette couche pleine de liaison est connect� � un vecteur et le vecteur, sortie 584 vj de l'it�ration 3 calculs algorithme de routage de dynamique.

Capsule chiffres � la sortie finale, ce qui repr�sente la longueur du contenu d'une probabilit� d'occurrence caract�ris�, class�, ce faisant, de prendre la sortie L2 norme d'un vecteur. probabilit� de somme la diff�rence CapsNets sortie du r�seau de neurones classique est de 1, parce que CapsNets ayant la capacit� d'identifier une pluralit� d'objets.

1.2 Capsules

Premier r�seau de neurones repose sur l'utilisation d'une seule sortie scalaire � un d�tecteur de caract�ristique r�sum� de l'activit� piscine locale r�p�t�e, CNN aura une seule image de d�placement d'image trait�, rotation, deux voir sur la figure. Cependant, le r�seau de neurones doit �tre utilis� sous la forme d'une caract�ristique multidimensionnelle est � capsule �, ces capsules ses entr�es effectuent des calculs internes tr�s complexes, les r�sultats de ces calculs sont ensuite emball�s dans une mine d'informations comprenant une sortie de vecteur. Chaque capsule reconna�tra �tat d'apprentissage et une plage de d�formation partielle d�finie implicitement dans l'entit� visuelle efficace, et d�livre en sortie la gamme limit�e au sein de laquelle le param�tre de probabilit� et un ensemble d'entit�s, l'ensemble des conditions d'�clairage, y compris les param�tres physiques par rapport � cette entit� visuel, la modification et la position pr�cise et d'orientation. Lorsque la capsule fonctionne correctement, la probabilit� de la pr�sence de l'entit� visuelle a une invariance locale, � savoir lorsque le couvercle du collecteur mobile apparence entit� au sein d'une gamme limit�e de la capsule, la probabilit� ne change pas. param�tre entit� est � rampe � et les changements avec les conditions d'observation, des exemples du param�tre sera un changement correspondant en apparence lorsque le collecteur d'entit� mobile, montrant les coordonn�es internes comme les param�tres d'instance d'entit� dans le collecteur d'apparence, la figure 3 Fig.

Supposons qu'une capsule, caract�ris� en ce que la veine doigt images est d�tect�, et d�livre le vecteur de longueur fixe en trois dimensions. commence alors � se d�placer dans l'image de la veine. Pendant ce temps, la rotation espace vectoriel repr�sentant la d�tection de changement d'�tat de la veine, mais restera longueur fixe, �tant donn� que les capsules restent convaincus qu'il d�tecte une veine. L'activit� neuronale va changer l'objet des images en mouvement, cependant, la probabilit� de d�tection reste constante, qui est bas� sur la plus grande piscine d'invariance CapsNets poursuite de l'invariance, plut�t que fourni par CNN.

1,3 fonction Squash

CNN fonction d'activation commune comprend RELU, sigmo�de, etc, pour parvenir � la superposition lin�aire seulement comprim� entre 0 et 1 ou 1 et -1. En CapsNets, depuis le premier r�seau de transport de la couche sous la forme d'un vecteur, ce faisant, la n�cessit� d'activer la � capsule � do direction de traitement. CapsNets de fonction d'activation du nom de squash, comme le montre l'expression (2):

1,4 routage dynamique

Mesurer la similarit� du produit scalaire de l'entr�e et la sortie de l'entr�e et la sortie de la capsule, puis mettre � jour le facteur de calcul d'itin�raire. Le nombre optimal d'it�rations pratique trois fois. l'�tape de routage dynamique est la suivante:

(1) d�livre en sortie l'image d'entr�e apr�s avoir encapsul� Uj | i, le num�ro de routage R & lt d'it�rations;

(2) est d�finie comme �tant la probabilit� de la couche inf�rieure l bij couche de connexion VNI VNJ, la valeur initiale de 0;

(3) effectuer la boucle de l'�tape (4) � travers l'�tape (7) vue sur R;

(4) VNI couche l, avec le Softmax de la cij peut �tre convertie en une probabilit�;

(5) l VNJ + 1 couche, sommation pond�r�e SJ;

(6) l VNJ + 1 couche, obtenue � l'aide de l'activation de sj fonction d'activation VJ;

(7) Selon Uj | relation de mises � jour de i et vj.

Avec Uj | i et vj les points sur les mises � jour de produits Bij lorsque les deux sont semblables, le produit scalaire est grande BIJ augmente �galement la possibilit� de connecter le VNJ sup�rieur vni inf�rieur devient grand, bien au contraire, quand un grand �cart entre les deux , le produit scalaire est petit, plus petit aussi bij, possibilit� de faible hauteur vni de connexion � haut niveau VNJ devient faible.

1.5 fonction de perte

CapsNets SVM de fonction de perte similaire � la fonction de perte, tel que la formule (3);

De formule (3) repr�sente les m�mes �chantillons positifs et n�gatifs afin de maximiser l'hyperplan � distance. points d'�talonnage donn�e ici 2 et m + 0,9 = 0,1 = m-, la perte de m souhait�e + �chantillons positifs dans le pr�dit 0,9, sup�rieur � 0,9 il n'y a aucune n�cessit� de continuer � am�liorer; pr�dictive n�gative 0,1 mode de r�alisation m-, �galement pas moins de 0,1 la n�cessit� de poursuivre et a ensuite diminu�. La valeur est fix� � 0,5, des valeurs pour la stabilit� au cours de la formation, afin d'�viter une perte trop importante de commencer, entra�nant le retrait de toutes les valeurs de sortie. �l�ment de formule a deux carr�s, parce que la fonction de perte avec la norme L2 est la somme de la perte totale de toutes les pertes de classes.

exp�rience 2

2.1 Dataset

L'ensemble de donn�es d'essai 584 est de 6 doigts individuels (� l'exception du pouce et le petit doigt) acquisition d'image est r�p�t�e pour chaque doigt 20, � savoir la taille de l'ensemble de donn�es est 584 x 6 x 20. La formation de 60000 fix�, 10000 ensemble de test.

2.2 R�sultats exp�rimentaux

Tensorflow utiliser framework open source con�u pour atteindre la profondeur et les r�seaux de neurones. 3 fois par des boucles de routage, la formation it�rative 31.000 fois. Taux de reconnaissance et les valeurs de perte pr�sent�s dans le tableau 1.

Sur l'ensemble de l'exp�rience NVIDIA Titanxp, le temps de formation CapsNet il faut environ 6 heures, on peut le voir dans la figure 4, l'abscisse est le nombre d'it�rations CapsNets ordonn�e de la pr�cision et la perte de valeur CapsNets, lorsque it�r�e 2000 fois quand commencer � approcher une pr�cision de 90%, tandis que la perte est aussi faible que 0,2, en tant que le nombre d'it�rations augmente, pour atteindre une diminution des vibrations en douceur, et enfin converger � 98,6%, tandis que la valeur �tonnamment perte converge vers 0,0107. La figure 5 est une VGG-16 La formation peut �tre vu relativement stable, ce dernier n'a pas appris comment am�liorer la pr�cision lorsque l'it�ration � 200 fois la pr�cision de r�seau approchant 84%, et enfin une pr�cision de 85%, tandis que la perte la valeur diminue lentement, et enfin la perte totale de la valeur de 0,21. Comme le montre le tableau 2, comme VGG-16, CapsNets des avantages �vidents par rapport (en utilisant le m�me ensemble de donn�es exp�rimentales).

3 Conclusion

Exp�rimentalement confirm� CapsNets mieux que la reconnaissance des veines du doigt CNN, en raison de la structure simple du r�seau, de sorte que la vitesse de formation grandement am�lior�e. Pendant ce temps, parce que les caract�ristiques spatiales telles que les caract�ristiques de CapsNets de la veine sont extraient davantage, ce qui augmente la pr�cision de la reconnaissance. Mais CapsNets souvent enchev�tr�s avec le fond ensemble, CapsNets encore � ses d�buts, dans les travaux futurs d'entre eux, peut-�tre dans le cas de grands ensembles de donn�es quand il y aura d'autres questions, mais nous sommes entr�s dans CapsNets fait l'�mergence de la recherche en intelligence artificielle un grand pas.

r�f�rences

KRIZHEVSKY A, SUTSKEVER I, HINTON G classement E.ImageNet avec convolutionnel profonde .International Conf�rence sur Neural Information Processing Systems, 2012,60 (2): 1097-1105.

Simonyan K, Zisserman A.Very r�seaux profonde pour convolutifs reconnaissance d'images � grande �chelle .Computer Science, arXiv: 1409.1556,2014.

Szegedy C, LIU W, Y JIA, et al.Going plus profonde avec convolutions Conf�rence sur .IEEE Vision par ordinateur et reconnaissance de formes, 2015: 1-9.

Il Kaiming, Zhang Xiangyu, Ren Shaoqing, et al.Deep apprentissage r�siduel pour la reconnaissance d'image .IEEE Computer Society, 2015.

Wu Chao Shao Xi. La reconnaissance du doigt veine bas�e sur la profondeur de l'apprentissage Computer Technology et le d�veloppement, 2018 (2): 200-204.

HONG H G, B LEE M, PARK K.Convolutional reconnaissance doigt veine en r�seau de neurones en utilisant des capteurs d'image NIR .Sensors, 2017,17 (6): 1-21.

Yucheng Bo, Qin Huafeng. Caract�ristique d'image des veines du doigt Algorithme extraction G�nie informatique et applications, 2008, 44 (24): 175-177.

GONZALEZ R C, R Woodz E. Traitement de l'image num�rique . Ruanqiu Qi, et ainsi de suite, P�kin: Electronic Industry Press, 2007.

Wen Yandong, Zhang Kaipeng, Li Zhifeng, et al.A approche d'apprentissage caract�ristique discriminante pour la reconnaissance profonde du visage .Lecture Notes dans l'informatique, Springer, 2016,47 (9): 499-515.

HINTON G E, KRIZHEVSKY A, auto-codeurs WANG S D.Transforming Conf�rence sur .International r�seaux de neurones artificiels, 2011,6791: 44-51.

S�bo�r S, FROSST N, G routage HINTON E.Dynamic entre Capsules .NIPS2017,2017.

Yang Liu, Guo Shuxu, Zhangfeng Chun, etc. sur la base des moyens de d�composition parcimonieuse veine d�bruitage Traitement du signal, 2012,28 (2): 179-185.

Rosdi B A, CHAI W S, S SUANDI A.Finger reconnaissance veineuse en utilisant la ligne locale motif binaire .Sensors, 2011,11 (12): 11357-71.

AREL I, ROSE D C, T Karnowski apprentissage d'une nouvelle fronti�re machine � P.Deep dans la recherche sur l'intelligence artificielle .Computational Intelligence Magazine IEEE, 20105 (4): 13-18.

Informations sur l'auteur:

Yucheng Bo, l'ours gr�ce handed

(�cole de g�nie �lectrique et �lectronique, l'Universit� de Chongqing, Chongqing 400050, Chine)

Route de la soie

Apprenez � conna�tre la Chine

la recherche � acad�mique � bas�e sur la reconnaissance des veines du doigt r�seau Capsule