Fruits et l�gumes de reconnaissance d'images r�frig�rateur intelligent r�seau de neurones � convolution

Zeng Liang 1, 1 Lin Zhixian, Chen Saupoudrez 2

(�cole de physique Information Engineering, Universit� de Fuzhou, Fuzhou 350116, 2.TCL Industrial Technology Research Institute Group, Shenzhen 518055, Chine)

: La reconnaissance intelligente de l'objet r�frig�rateur principalement li�e � la reconnaissance des fruits et l�gumes, la grande quantit� de fruits et l�gumes dans le r�frig�rateur, un �clairage in�gal, environnement complexe, ce r�seau de neurones convolutionnel propos� pour traiter ce type d'identification des probl�mes. RELU r�seau en utilisant comme fonction d'activation, il a une capacit� plus grande et des valeurs de gradient creuses sup�rieures � fonction classique sigmo�de, peut grandement acc�l�rer la convergence du r�seau. Dropout introduit au hasard couche cach�e, de sorte que certains nuds ne fonctionnent pas, r�duire la � coaptation � entre les nuds, apte � r�duire le r�seau gr�ce � une fonction locale peut r�duire la complexit� de calcul du r�seau et d'am�liorer efficacement le taux de reconnaissance. quantit� d'entra�nement avec l'entr�e du r�seau sur la base de l'algorithme de r�tro-propagation de gradient descente �viter des minima locaux r�seau, d'am�liorer le taux de reconnaissance. Enfin, des exp�riences avec des donn�es d'image r�frig�rateur l�gumes analogiques mis Supermarket Produire Dataset, d�montrent l'efficacit� de la m�thode.

: Convolutif du r�seau de neurones, les fruits et l�gumes d'identification; abandon scolaire; descente de gradient

: TP391.4 Code du document: ADOI: 10,19358 / j.issn.1674-7720.2017.08.018

Format de r�f�rence : Zeng Liang, Lin Zhixian, Chen asperg� son application de reconnaissance d'image intelligent r�frig�rateur v�g�tale convolutifs r�seaux de neurones [J], 2017,36 (8):. 56-59.

0 introduction

* Fonds pour les projets: programme de R & D ax�s sur le sujet (2016YFB0401503), la province du Fujian grande science et la technologie (2014HZ00031), les grands enjeux scientifiques et de la technologie dans la province du Guangdong (2016B090906001), Fujian financ� sujet sp�cial (JK2014002) des universit�s de la province r�frig�rateur intelligent peut identifier les fruits et l�gumes Collect consommation des utilisateurs de produits de fruits et de l�gumes, d'analyser les pr�f�rences des utilisateurs en utilisant ces donn�es, les entreprises peuvent faire des fruits en temps opportun et l�gumes recommand�s par APP au terminal d'utilisateur, ou est sur le point d'expirer pour rappeler � l'utilisateur de manger des aliments le plus t�t possible. m�thodes de reconnaissance intelligente de l'objet r�frig�rateur sont: un utilisateur type d'entr�e manuelle ou entr�e voix de l'alimentation, de balayage RFID [1], un code � barres ou d'un scanner de code � deux dimensions [2] techniques. Fruits et l�gumes pour la reconnaissance d'images, BOLLE R M et al [3] et similaires en extrayant une image couleur, la texture caract�ristiques statistiques, la premi�re fois mis � l'identification al�atoire et la classification des produits agricoles. ROCHA A et al. [4] et comparer la diff�rence d'histogramme (Unser), le vecteur de coh�rence de couleur (Color coh�rence vectorielle, CCV), un histogramme de couleurs de point (pixel fronti�re / int�rieur Classfication, BIC) et de la texture analogue, les caract�ristiques de couleur, en utilisant K means et regroupement m�thode ascendante (Clustering proc�dure Bottomup) pour identifier ces types de caract�ristiques, en notant que l'utilisation de l'approche de fusion de fonctionnalit� peut obtenir de meilleurs r�sultats, mais cette m�thode ne sont pas bien les diff�rences de performance texture des fruits et l�gumes le sexe, et plus sensibles � la lumi�re externe. Zhang Yudong et al a propos� l'utilisation de Unser, histogramme de couleur RVB, la forme et d'autres caract�ristiques que l'identification, SVM multi-curs pour les fruits et l'identification des produits v�g�taux [5] pour obtenir de bons r�sultats de reconnaissance, mais la formation de SVM polynucl�aires pendant longtemps, le co�t de la plus grande . ROCHA A et al. [6] de fruits et l�gumes continuent fin optimis�s m�thode de fusion de la fonction de reconnaissance. Tao Huawei et al [7] a propos� une m�thode bas�e sur une couleur de motif binaire locale texture compl�tement extraite caract�ristiques de l'objet, les fruits et les l�gumes afin d'am�liorer la reconnaissance du syst�me intelligent. Fruits et l�gumes ci-dessus appartiennent � la cat�gorie de la reconnaissance d'image caract�ristique d'extraction manuelle.

LeCun Y et al. [8] convolution LeNet5 r�seau de neurones a propos� et obtenu un grand succ�s dans l'identification num�rique, suivi par le mod�le repr�sent� par une convolution r�seau de neurones est appliqu� � la reconnaissance de plaque d'immatriculation, la reconnaissance de l'�criture manuscrite num�rique, vid�o mouvement humain identification [9], les points caract�ristiques du visage d�tect�es [10], et d'autres domaines. KRIZHEVSKY A et al [11] sur le mod�le de r�seau propos� dans l'ensemble de donn�es IMAGEnet a atteint le taux de reconnaissance de 83,6%, attire une grande attention. Identifier le type de fruit r�frig�rateur intelligente de r�seau neuronal convolutif et l�gumes Lisi Wen et al [12] � l'aide int�gr�e, mais plus le mod�le de fusion est plus complexe, de nombreux param�tres, sujettes � des � over-raccord. � Cet article propose un r�frig�rateur identifiant le type de fruits et l�gumes pour le r�seau de neurones convolutionnel, que le r�seau utilise la fonction d'activation Relu pour �viter la saturation, afin d'acc�l�rer la convergence du r�seau. Dans la couche cach�e ajoute un d�crocheur au hasard, de sorte que la structure du r�seau plus de � rares �, r�duit les neurones d'interd�pendance. r�seau de neurones convolutionnel pour un bloc particulier, illumination, translation, rotation, mise � l'�chelle et d'autres formes de distorsions ont une bonne robustesse, il est tr�s appropri� pour les fruits et l�gumes traitement de ces probl�mes d'identification, ces derni�res ann�es un axe de recherche dans ce sens.

1 convolution r�seau de neurones

r�seau neuronal convolutif est une image 2D peut �tre entr�e en tant que la profondeur du r�seau de neurones directement, qui se compose principalement de deux extraction de caract�ristiques partielles et classification. Le module d'extraction de caract�ristiques et la couche de convolution �chantillonn� compos�e de couches altern�es, dans lequel la couche de convolution afin d'obtenir des images utiles � titre de filtrage par convolution, sous-�chantillonnage de la couche de r�duction de la dimension des donn�es d'�chantillonnage est form� par une couche de convolution, ce qui r�duit la quantit� de traitement de donn�es. Cette autonomie est choisi dans la couche cach�e du c�t� de l'image, les angles de couleur � basse altitude, caract�ris� en haut de mani�re de forme, en �vitant les caract�ristiques d'extraction manuelles fastidieuses et unilat�rales, caract�ris� en ce que le r�seau doit s�lectionner et personnaliser l'apprentissage et la reconnaissance capacit�. Enfin classificateur extrait de reconnaissance de caract�ristique, le classificateur utilisent g�n�ralement une ou deux couches enti�rement connect�es r�seau de neurones.

1.1LeNet-5 Mod�le r�seau

LeNet5 couche d'entr�e du mod�le classique, la convolution de deux couches, deux couches de sous-�chantillonnage, deux couches enti�rement connect�es du r�seau et une sortie, le mod�le de r�seau LeNet5 repr�sent� sur la figure 1.

couche de convolution, l'image d'entr�e par convolution j diff�rent du noyau de convolution, j pour g�n�rer diff�rentes cartes de caract�ristiques, un processus de fonctionnement comme repr�sent� dans l'�quation (1).

Dans lequel, XLJ l repr�sente la couche (convolution Layer) du j-i�me carte de fonction, f (�) repr�sente un ensemble de fonctions d'activation, Mj repr�sentant l'image d'entr�e, b repr�sentatif d'un facteur de polarisation.

Proc�d� d'op�ration de sous-�chantillonnage comme indiqu� dans la couche (2).

Dans lequel: le bas (�) repr�sente le sous-�chantillonnage de mise en commun moyenne, � savoir, l'image d'entr�e de chacun des n � n r�gion diff�rente et ensuite chercher un moyen de point de sommation en tant qu'image de sortie, l'image de sortie de telle sorte que diff�rentes dimensions sont r�duites au 1 original / n. Chacun de l'image de sortie a un autre facteur de multiplication , et un facteur de polarisation b.

La premi�re couche est un classificateur de convolution couche sup�rieure figure et toutes les caract�ristiques couche de sous-�chantillonnage enti�rement connect�, parce que la taille d'entr�e de 5 x 5, et la taille du noyau de convolution est aussi 5 � 5, il peut �tre consid�r� comme reli� pleinement couche. Le second classificateur de couche calcule le produit scalaire entre le vecteur d'entr�e et les poids du poids, puis la g�n�ration d'un �tat final de la couche de sortie par la fonction d'activation d�termine le r�sultat de la reconnaissance.

1.2 fonctions d'activation � base de r�seaux de neurones convolutionnels RELU

r�seau neuronal convolutif comprend une fonction fonction d'activation commun sigmo�de f (x) = (1 + ex) -1 et la fonction de tangente hyperbolique f (x) = tanh (x), ces deux fonctions sont fonction non lin�aire dans un cycle satur�, convergence lente. Dans cet article, l'unit� de correction lin�aire insatur� (Rectified unit�s lin�aires, RELU), � savoir, f (x) = max (x), la fonction est modifi�e par un mode lin�aire, certaines donn�es obligatoires est �gal � z�ro, de sorte que le mod�le comporte une repr�sentation clairsem�e mod�r�e. RELU valeur de gradient de fonction est importante, la phase de r�tro-propagation, la diffusion peut �tre emp�ch�e de se propager au gradient dispara�t avant que les couches du r�seau, d'excellentes performances de la fonction d'activation classique, et l'inhibition plus coh�rente RELU Point biologique unilat�rale de vue, connect� au r�seau le proc�d� repr�sent� sur la Fig.

DropOut de 1.3 bas� sur le r�seau al�atoire CNN

Convolution mod�le de r�seau neuronal par la capacit� de stockage de l'�chantillon � fort impact, le nombre limit� d'�chantillons dans le bo�tier pour �viter le mod�le dans la phase de formation est apparu � over-fitting �. Cet article introduit la structure de r�seau al�atoire Dropout, � savoir � gel � au hasard certains neurones conservent leurs poids actuels dans le processus de formation du r�seau, alors que la sortie est r�gl� sur 0, et ces neurones a �t� s�lectionn� dans le prochain processus de formation la valeur sera restaur�e � retenir avant, et la partie � nouveau s�lectionn� au hasard du neurone r�p�ter le processus. Renvoi al�atoire tous les deux neurones peuvent �tre �vit�s, tout en g�n�rant effet, mettant ainsi � jour les coefficients de pond�ration ne d�pend plus un courant de relation de mappage fixe noeud cach� 3 est ajout� d�crochage

Une vue sch�matique d'une couche cach�e, � savoir, la structure du r�seau de neurones sont modifi�s dans chaque processus de formation. Cette approche r�duit la d�pendance entre les neurones, d'am�liorer la capacit� de g�n�ralisation du r�seau de neurones, il est possible d'apprendre des fonctionnalit�s plus robustes. Ici mis en convolution au hasard deux couches 30% des neurones de sortie � z�ro, comme repr�sent� sur la Fig.

1,4 gradient conduit � diminuer la quantit� de facteur r�tropropagation

La valeur de poids du processus de formation de r�seau ici mis � jour en fonction d'un facteur de gradient diminue la quantit� de commande d'algorithme de propagation arri�re, telle que la r�gle de mise � jour de poids de la formule (3), (4).

vi + 1 = vi-i- (Li) Di (3)

i + 1 = i + vi + 1 (4)

O�: i est le nombre d'it�rations; [eta] est un taux d'apprentissage; [lambda] est un facteur d'att�nuation de pond�ration; [omega] repr�sente un vecteur de pond�ration; [alpha] est la quantit� de mouvement, dans le but d'impulsion croissante est d'�viter la formation de r�seau pris au pi�ge dans un point de minimum local de faible profondeur, � acc�l�rer la vitesse de convergence du r�seau; (Li) Di pour le i-i�me �chantillon d'apprentissage lot Di fonction de perte i est la moyenne en poids de la d�rivation .

Convolution mod�le de r�seau neuronal de l'article 1.5

Ici la structure de r�seau neuronal convolutif repr�sent� sur la figure 4, sont la couche d'entr�e, la convolution de deux couches, deux couches de sous-�chantillonnage, des couches enti�rement connect�es, la couche de sortie. Convolution: une image d'entr�e par le biais d'une convolution d'un filtre capable d'�tre form�e, dans lequel la couche de convolution obtenir la Fig. Le sous-�chantillonnage: la figure convolution des fonctions dans le voisinage de chaque couche est de 2 x 2 en moyenne pour obtenir une valeur couche sous-�chantillonn�, le sous-�chantillonnage ainsi figure couche est caract�ris�e dans les dimensions respectives sont r�duites � la figure 1, la couche de convolution caract�ris� / 2. Enti�rement connect�: la derni�re couche de la figure �chantillonn� couche se dilate dans un vecteur de caract�ristiques, et multipli�e par la pond�ration obtenue par la couche de sortie fonction d'activation des neurones.

les param�tres du mod�le de r�seau utilis�s dans chaque couche, comme indiqu� dans le tableau 1.

2 r�sultats et analyse exp�rimentale

2.1 Dataset

Esp�ces de fruits et l�gumes dans le r�frig�rateur, le nombre de beaucoup, mettent pas de r�gles, en changeant la perspective des fruits et l�gumes, un �clairage in�gal, la situation est tr�s compliqu�e. Supermarch� Produce jeu de donn�es en utilisant l'image [10] de l'ensemble de donn�es acquis exp�rience du r�frig�rateur analogique, un total de 15 ensembles du type de donn�es, deux fruits et l�gumes communes dans le r�frig�rateur 633 dans l'image, le nombre de chaque type de fruit et la gamme de l'image v�g�tale de 75-264 gamme, la taille de l'image est 1024 � 768. Afin de nettoyer toutes sortes de donn�es d'image et relativement �quilibr�e, prenant de mani�re al�atoire de telle sorte que les types ensemble de donn�es copi�s de fruits et l�gumes ont augment� l'image 167, et a ajout� un bruit blanc gaussien dans les images. Ainsi, un total de 15 ensembles du type de donn�es de correction, deux images de l�gumes 800, respectivement, la pomme de terre (jaune), pomme de terre (rouge), noix de cajou, les petites p�ches, les pommes Fuji, la pomme verte, les melons, kiwi, la nectarine, l'oignon, l'orange, la prune , poire, orange, de la past�que.

2.2 M�thodes

Papier construit mod�le de r�seau neuronal convolutif repr�sent� sur la. figure 4, les couches des param�tres indiqu�s dans le tableau 1. La taille de l'image d'entr�e est de 28 � 28, il convient tout d'abord les dimensions rognage d'image et de largeur r�duite � 1: 1 Heights, la largeur est r�duite pour emp�cher la distorsion de l'image Heights et perte d'information caract�ristique importante. Avec Batch m�thode stochastique de descente de gradient (gradient stochastique Minibatch descendre, Minibatch SGD) 200200 it�rations (�poques), pour chaque �poque, 10 �chantillons de chaque entr�e d'apprentissage, et inverser la propagation de poids mises � jour. mise ici la valeur initiale du taux d'apprentissage 0,1, le taux de reconnaissance � �tre augment�e sans tendance significative l'augmentation ou la vitesse d'apprentissage lent va devenir un facteur de 2; 0,6 �lan terme est fourni; facteur de pond�ration d'att�nuation de disponible 0,0005; donn�es d'exp�rience cong�-out (holdout) partitionnement, 2240 images choisis au hasard que l'ensemble d'apprentissage, le 560 restant comme un ensemble de test.

2.3 R�sultats et analyse exp�rimentale

2.3.1 identifier diff�rents types de fruits et l�gumes matrice de confusion

5 tester toutes sortes de fruits et l�gumes confusion taux de reconnaissance de la matrice de la m�thode propos�e. Matrice positions diagonales des donn�es correspondant � la zone plus fonc�e dans le taux de reconnaissance des fruits et l�gumes comme un axe Y, que le reste du bloc de donn�es correspondant aux fruits de couleur claire et de l�gumes est faussement identifi�s comme correspondant au taux de reconnaissance de l'axe X de fruits et l�gumes comme un axe Y. Comme on peut le voir � partir de la matrice de confusion Kiwi facilement reconnu par erreur comme pomme verte, poire facilement mal identifi� comme les pommes de terre (jaune). A partir de l'ensemble de donn�es d'image se trouve dans ces fruits �taient la forme m�me objectif, �lev� restant de noix de cajou, oignons, pomme Fuji, melon, oignon, orange, prune, orange, etc. taux de reconnaissance verte, en particulier orange et cantaloup peut �tre jusqu'� 100% le taux correct. � savoir convolutif mod�le de r�seau neuronal et probl�me de l'identification des param�tres du fruit et l�gume ici peuvent obtenir un meilleur r�sultat de reconnaissance.

2.3.2 RELU employ�s comme le taux de reconnaissance et la fonction d'activation sigmo�de de comparaison figure

La figure 6 est un r�seau en utilisant la fonction RELU sigmo�de et la fonction de comparaison de la vitesse de convergence it�rative 200 fois FIG, o� la ligne continue repr�sente le taux de reconnaissance courbe de fonction d'activation RELU, pour identifier un point de la courbe en trait plein de la fonction d'activation sigmo�de. De la figure peut �tre trouv�e en utilisant la pr�-fonction convergence plus rapide RELU; r�seau stable, le taux global de reconnaissance fonction d'activation RELU est d'environ 83,4%, beaucoup plus �lev� que le taux de reconnaissance de 67,7% fonction sigmo�de, peut �tre emp�ch�e efficacement parce le r�seau est � plus apte �, il est possible d'am�liorer le taux de reconnaissance des fruits et l�gumes dans une grande mesure.

2.3.3 tableau de comparaison Ajouter taux de reconnaissance du r�seau ou non Dropout al�atoire

7 sont ajout�s au graphe de r�seau illustrant les taux de reconnaissance apr�s 200 it�rations Renvoi al�atoires ou non, o� la ligne continue est ajout� au taux d'abandon al�atoire de 30% de la reconnaissance de la courbe obtenue, la reconnaissance de point n'a pas �t� ajout� � la courbe en trait plein de d�crochage . R�seau stabilis� en ajoutant le taux de reconnaissance globale Dropout al�atoire d'environ 83,4%, et non ajout� taux de reconnaissance globale Dropout al�atoire d'environ 79,3%, le taux de reconnaissance hausse de 4,1%. L'introduction d'un certain pourcentage du r�seau peut �tre rendu plus al�atoire clairsem�e Dropout, ce qui r�duit l'interaction entre les neurones, dans une certaine mesure du possible, d'am�liorer le taux de reconnaissance des fruits et l�gumes, et le r�seau � gigue � plus petit, plus robuste.

3 Conclusion

reconnaissance d'image de papier de fruits et l�gumes en construisant un mod�le de r�seau de neurones � convolution, r�seau utilise une fonction lin�aire de la fonction d'activation des neurones Relu, acc�l�rer la convergence du r�seau, d'am�liorer le taux d'efficacit� de la formation et la reconnaissance. Dropout introduit dans une proportion de couche cach�e, que le r�seau a une meilleure g�n�ralisation. Les recherches futures entrera dans une taille de l'image plus grande, de sorte qu'une information de caract�ristique plus riche, et des informations de couleur est ajout�e au r�seau, sur les effets de la reconnaissance d'image couleur et de fruits continuer � am�liorer la structure du r�seau existant pour obtenir l'effet d'am�liorer le taux de reconnaissance, de sorte que traiter efficacement ce probl�me d'identification.

r�f�rences

. [1] Gu Hanshen, Wang Dong Un r�frig�rateur sensible au contenu bas� sur la technologie RFID dans la maison intelligente pour homehealthcare [C] .Proceedings de la 11e Conf�rence internationale sur les communications des technologies de pointe, P�kin, IEEE, 2009: 987-990.

[2] Dai Yang, Lin Sheng dans le codage et le d�codage du bidimensionnelle ordinateur de codes � barres mis en uvre [J] de l'acquisition et de traitement de donn�es, 2003,18 (3): .. 356360 [3] BOLLE RM, CONNELL JH, HASS. N, et al Veggievison :. un produit syst�me de reconnaissance [P] .United Unis: 5546475A, 199608-13.

[4]. ROCHA A, HAUAGGE DC, WAINER J, et al automatique des produits classification � partir d'images en utilisant la couleur, la texture et les indices d'apparence [C] 21�me Symposium br�silien sur l'infographie et de l'image, CAMPOGRANDE, Br�sil, IEEE 2008 :. 3 -10.

. [5] Zhang Yudong, Wu Lenan Classification des fruits � l'aide de la vision par ordinateur et le support multiclassent machine vecteur [J] .Sensors, 2012,12 (9): 1248912505.

[6] FARIA F A, dos SANTOS J A, ROCHA A, et al automatique fusion de classificateur pour produire reconnaissance [C] .25th SIBGRAPI sur des graphiques, de mod�les et d'images, Ouro Preto, Br�sil, IEEE, 2012 :. 20-25.

[7] Taohua Wei, Zhao Li, Xi Ji, et d'autres types de fruits et l�gumes � base de la m�thode de reconnaissance fonction de la couleur et de texture [J] Journal of Agricultural Engineering, 2014,30 (16):. 305-311.

[8] LeCun Y, Bottou L, Bengio Y, et al.Gradientbased apprentissage appliqu� � la reconnaissance de documents [C] .Proceedings de l'IEEE 86,1998: 2278-2324.

[9] Ji Shuiwang, Xu Wei, Yang Ming, et al.3D r�seaux de neurones convolutionnels pour la reconnaissance de l'action humaine [J] .IEEE Transactions sur le mod�le d'analyse et de renseignement automatique, 2013,35 (1): 221-231.

. [10] Sun Yi, Wang Xiaogang, Tang Xiaoou profonde cascade r�seau convolutionnel pour la d�tection de points du visage [C] 0,2013 Conf�rence IEEE sur l'ordinateur Vision et Patten reconnaissance (CVPR), IEEE 2013: 3467-3483.

[11] KRIZHEVSKY A, SUTSKEVER I, HINTON G E.ImageNet classification avec les r�seaux de neurones profonds convolutifs [C] .Advances dans le syst�me Neural Information Processing 25: Actes de la 26e Conf�rence annuelle sur Neural Information Processing Systems, Lake Tahoe, �tats-Unis, 2012 : 1097-1105.

[12] Li Siwen, Lv Jiancheng, Ni gagne l'int�gration d'applications intelligent convolutionnel identification du r�seau de neurones r�frig�rateur intelligent de fruits et l�gumes [J] Acquisition et traitement de donn�es, 2016,18 (3): 205-212.

Route de la soie

Apprenez � conna�tre la Chine

Fruits et l�gumes de reconnaissance d'images r�frig�rateur intelligent r�seau de neurones � convolution