Fruits et légumes de reconnaissance d'images réfrigérateur intelligent réseau de neurones à convolution

Zeng Liang 1, 1 Lin Zhixian, Chen Saupoudrez 2

(École de physique Information Engineering, Université de Fuzhou, Fuzhou 350116, 2.TCL Industrial Technology Research Institute Group, Shenzhen 518055, Chine)

: La reconnaissance intelligente de l'objet réfrigérateur principalement liée à la reconnaissance des fruits et légumes, la grande quantité de fruits et légumes dans le réfrigérateur, un éclairage inégal, environnement complexe, ce réseau de neurones convolutionnel proposé pour traiter ce type d'identification des problèmes. RELU réseau en utilisant comme fonction d'activation, il a une capacité plus grande et des valeurs de gradient creuses supérieures à fonction classique sigmoïde, peut grandement accélérer la convergence du réseau. Dropout introduit au hasard couche cachée, de sorte que certains nuds ne fonctionnent pas, réduire la « coaptation » entre les nuds, apte à réduire le réseau grâce à une fonction locale peut réduire la complexité de calcul du réseau et d'améliorer efficacement le taux de reconnaissance. quantité d'entraînement avec l'entrée du réseau sur la base de l'algorithme de rétro-propagation de gradient descente éviter des minima locaux réseau, d'améliorer le taux de reconnaissance. Enfin, des expériences avec des données d'image réfrigérateur légumes analogiques mis Supermarket Produire Dataset, démontrent l'efficacité de la méthode.

: Convolutif du réseau de neurones, les fruits et légumes d'identification; abandon scolaire; descente de gradient

: TP391.4 Code du document: ADOI: 10,19358 / j.issn.1674-7720.2017.08.018

Format de référence : Zeng Liang, Lin Zhixian, Chen aspergé son application de reconnaissance d'image intelligent réfrigérateur végétale convolutifs réseaux de neurones [J], 2017,36 (8):. 56-59.

0 introduction

* Fonds pour les projets: programme de R & D axés sur le sujet (2016YFB0401503), la province du Fujian grande science et la technologie (2014HZ00031), les grands enjeux scientifiques et de la technologie dans la province du Guangdong (2016B090906001), Fujian financé sujet spécial (JK2014002) des universités de la province réfrigérateur intelligent peut identifier les fruits et légumes Collect consommation des utilisateurs de produits de fruits et de légumes, d'analyser les préférences des utilisateurs en utilisant ces données, les entreprises peuvent faire des fruits en temps opportun et légumes recommandés par APP au terminal d'utilisateur, ou est sur le point d'expirer pour rappeler à l'utilisateur de manger des aliments le plus tôt possible. méthodes de reconnaissance intelligente de l'objet réfrigérateur sont: un utilisateur type d'entrée manuelle ou entrée voix de l'alimentation, de balayage RFID [1], un code à barres ou d'un scanner de code à deux dimensions [2] techniques. Fruits et légumes pour la reconnaissance d'images, BOLLE R M et al [3] et similaires en extrayant une image couleur, la texture caractéristiques statistiques, la première fois mis à l'identification aléatoire et la classification des produits agricoles. ROCHA A et al. [4] et comparer la différence d'histogramme (Unser), le vecteur de cohérence de couleur (Color cohérence vectorielle, CCV), un histogramme de couleurs de point (pixel frontière / intérieur Classfication, BIC) et de la texture analogue, les caractéristiques de couleur, en utilisant K means et regroupement méthode ascendante (Clustering procédure Bottomup) pour identifier ces types de caractéristiques, en notant que l'utilisation de l'approche de fusion de fonctionnalité peut obtenir de meilleurs résultats, mais cette méthode ne sont pas bien les différences de performance texture des fruits et légumes le sexe, et plus sensibles à la lumière externe. Zhang Yudong et al a proposé l'utilisation de Unser, histogramme de couleur RVB, la forme et d'autres caractéristiques que l'identification, SVM multi-curs pour les fruits et l'identification des produits végétaux [5] pour obtenir de bons résultats de reconnaissance, mais la formation de SVM polynucléaires pendant longtemps, le coût de la plus grande . ROCHA A et al. [6] de fruits et légumes continuent fin optimisés méthode de fusion de la fonction de reconnaissance. Tao Huawei et al [7] a proposé une méthode basée sur une couleur de motif binaire locale texture complètement extraite caractéristiques de l'objet, les fruits et les légumes afin d'améliorer la reconnaissance du système intelligent. Fruits et légumes ci-dessus appartiennent à la catégorie de la reconnaissance d'image caractéristique d'extraction manuelle.

LeCun Y et al. [8] convolution LeNet5 réseau de neurones a proposé et obtenu un grand succès dans l'identification numérique, suivi par le modèle représenté par une convolution réseau de neurones est appliqué à la reconnaissance de plaque d'immatriculation, la reconnaissance de l'écriture manuscrite numérique, vidéo mouvement humain identification [9], les points caractéristiques du visage détectées [10], et d'autres domaines. KRIZHEVSKY A et al [11] sur le modèle de réseau proposé dans l'ensemble de données IMAGEnet a atteint le taux de reconnaissance de 83,6%, attire une grande attention. Identifier le type de fruit réfrigérateur intelligente de réseau neuronal convolutif et légumes Lisi Wen et al [12] à l'aide intégrée, mais plus le modèle de fusion est plus complexe, de nombreux paramètres, sujettes à des « over-raccord. » Cet article propose un réfrigérateur identifiant le type de fruits et légumes pour le réseau de neurones convolutionnel, que le réseau utilise la fonction d'activation Relu pour éviter la saturation, afin d'accélérer la convergence du réseau. Dans la couche cachée ajoute un décrocheur au hasard, de sorte que la structure du réseau plus de « rares », réduit les neurones d'interdépendance. réseau de neurones convolutionnel pour un bloc particulier, illumination, translation, rotation, mise à l'échelle et d'autres formes de distorsions ont une bonne robustesse, il est très approprié pour les fruits et légumes traitement de ces problèmes d'identification, ces dernières années un axe de recherche dans ce sens.

1 convolution réseau de neurones

réseau neuronal convolutif est une image 2D peut être entrée en tant que la profondeur du réseau de neurones directement, qui se compose principalement de deux extraction de caractéristiques partielles et classification. Le module d'extraction de caractéristiques et la couche de convolution échantillonné composée de couches alternées, dans lequel la couche de convolution afin d'obtenir des images utiles à titre de filtrage par convolution, sous-échantillonnage de la couche de réduction de la dimension des données d'échantillonnage est formé par une couche de convolution, ce qui réduit la quantité de traitement de données. Cette autonomie est choisi dans la couche cachée du côté de l'image, les angles de couleur à basse altitude, caractérisé en haut de manière de forme, en évitant les caractéristiques d'extraction manuelles fastidieuses et unilatérales, caractérisé en ce que le réseau doit sélectionner et personnaliser l'apprentissage et la reconnaissance capacité. Enfin classificateur extrait de reconnaissance de caractéristique, le classificateur utilisent généralement une ou deux couches entièrement connectées réseau de neurones.

1.1LeNet-5 Modèle réseau

LeNet5 couche d'entrée du modèle classique, la convolution de deux couches, deux couches de sous-échantillonnage, deux couches entièrement connectées du réseau et une sortie, le modèle de réseau LeNet5 représenté sur la figure 1.

couche de convolution, l'image d'entrée par convolution j différent du noyau de convolution, j pour générer différentes cartes de caractéristiques, un processus de fonctionnement comme représenté dans l'équation (1).

Dans lequel, XLJ l représente la couche (convolution Layer) du j-ième carte de fonction, f (·) représente un ensemble de fonctions d'activation, Mj représentant l'image d'entrée, b représentatif d'un facteur de polarisation.

Procédé d'opération de sous-échantillonnage comme indiqué dans la couche (2).

Dans lequel: le bas (·) représente le sous-échantillonnage de mise en commun moyenne, à savoir, l'image d'entrée de chacun des n × n région différente et ensuite chercher un moyen de point de sommation en tant qu'image de sortie, l'image de sortie de telle sorte que différentes dimensions sont réduites au 1 original / n. Chacun de l'image de sortie a un autre facteur de multiplication , et un facteur de polarisation b.

La première couche est un classificateur de convolution couche supérieure figure et toutes les caractéristiques couche de sous-échantillonnage entièrement connecté, parce que la taille d'entrée de 5 x 5, et la taille du noyau de convolution est aussi 5 × 5, il peut être considéré comme relié pleinement couche. Le second classificateur de couche calcule le produit scalaire entre le vecteur d'entrée et les poids du poids, puis la génération d'un état final de la couche de sortie par la fonction d'activation détermine le résultat de la reconnaissance.

1.2 fonctions d'activation à base de réseaux de neurones convolutionnels RELU

réseau neuronal convolutif comprend une fonction fonction d'activation commun sigmoïde f (x) = (1 + ex) -1 et la fonction de tangente hyperbolique f (x) = tanh (x), ces deux fonctions sont fonction non linéaire dans un cycle saturé, convergence lente. Dans cet article, l'unité de correction linéaire insaturé (Rectified unités linéaires, RELU), à savoir, f (x) = max (x), la fonction est modifiée par un mode linéaire, certaines données obligatoires est égal à zéro, de sorte que le modèle comporte une représentation clairsemée modérée. RELU valeur de gradient de fonction est importante, la phase de rétro-propagation, la diffusion peut être empêchée de se propager au gradient disparaît avant que les couches du réseau, d'excellentes performances de la fonction d'activation classique, et l'inhibition plus cohérente RELU Point biologique unilatérale de vue, connecté au réseau le procédé représenté sur la Fig.

DropOut de 1.3 basé sur le réseau aléatoire CNN

Convolution modèle de réseau neuronal par la capacité de stockage de l'échantillon à fort impact, le nombre limité d'échantillons dans le boîtier pour éviter le modèle dans la phase de formation est apparu « over-fitting ». Cet article introduit la structure de réseau aléatoire Dropout, à savoir « gel » au hasard certains neurones conservent leurs poids actuels dans le processus de formation du réseau, alors que la sortie est réglé sur 0, et ces neurones a été sélectionné dans le prochain processus de formation la valeur sera restaurée à retenir avant, et la partie à nouveau sélectionné au hasard du neurone répéter le processus. Renvoi aléatoire tous les deux neurones peuvent être évités, tout en générant effet, mettant ainsi à jour les coefficients de pondération ne dépend plus un courant de relation de mappage fixe noeud caché 3 est ajouté décrochage

Une vue schématique d'une couche cachée, à savoir, la structure du réseau de neurones sont modifiés dans chaque processus de formation. Cette approche réduit la dépendance entre les neurones, d'améliorer la capacité de généralisation du réseau de neurones, il est possible d'apprendre des fonctionnalités plus robustes. Ici mis en convolution au hasard deux couches 30% des neurones de sortie à zéro, comme représenté sur la Fig.

1,4 gradient conduit à diminuer la quantité de facteur rétropropagation

La valeur de poids du processus de formation de réseau ici mis à jour en fonction d'un facteur de gradient diminue la quantité de commande d'algorithme de propagation arrière, telle que la règle de mise à jour de poids de la formule (3), (4).

vi + 1 = vi-i- (Li) Di (3)

i + 1 = i + vi + 1 (4)

Où: i est le nombre d'itérations; [eta] est un taux d'apprentissage; [lambda] est un facteur d'atténuation de pondération; [omega] représente un vecteur de pondération; [alpha] est la quantité de mouvement, dans le but d'impulsion croissante est d'éviter la formation de réseau pris au piège dans un point de minimum local de faible profondeur, à accélérer la vitesse de convergence du réseau; (Li) Di pour le i-ième échantillon d'apprentissage lot Di fonction de perte i est la moyenne en poids de la dérivation .

Convolution modèle de réseau neuronal de l'article 1.5

Ici la structure de réseau neuronal convolutif représenté sur la figure 4, sont la couche d'entrée, la convolution de deux couches, deux couches de sous-échantillonnage, des couches entièrement connectées, la couche de sortie. Convolution: une image d'entrée par le biais d'une convolution d'un filtre capable d'être formée, dans lequel la couche de convolution obtenir la Fig. Le sous-échantillonnage: la figure convolution des fonctions dans le voisinage de chaque couche est de 2 x 2 en moyenne pour obtenir une valeur couche sous-échantillonné, le sous-échantillonnage ainsi figure couche est caractérisée dans les dimensions respectives sont réduites à la figure 1, la couche de convolution caractérisé / 2. Entièrement connecté: la dernière couche de la figure échantillonné couche se dilate dans un vecteur de caractéristiques, et multipliée par la pondération obtenue par la couche de sortie fonction d'activation des neurones.

les paramètres du modèle de réseau utilisés dans chaque couche, comme indiqué dans le tableau 1.

2 résultats et analyse expérimentale

2.1 Dataset

Espèces de fruits et légumes dans le réfrigérateur, le nombre de beaucoup, mettent pas de règles, en changeant la perspective des fruits et légumes, un éclairage inégal, la situation est très compliquée. Supermarché Produce jeu de données en utilisant l'image [10] de l'ensemble de données acquis expérience du réfrigérateur analogique, un total de 15 ensembles du type de données, deux fruits et légumes communes dans le réfrigérateur 633 dans l'image, le nombre de chaque type de fruit et la gamme de l'image végétale de 75-264 gamme, la taille de l'image est 1024 × 768. Afin de nettoyer toutes sortes de données d'image et relativement équilibrée, prenant de manière aléatoire de telle sorte que les types ensemble de données copiés de fruits et légumes ont augmenté l'image 167, et a ajouté un bruit blanc gaussien dans les images. Ainsi, un total de 15 ensembles du type de données de correction, deux images de légumes 800, respectivement, la pomme de terre (jaune), pomme de terre (rouge), noix de cajou, les petites pêches, les pommes Fuji, la pomme verte, les melons, kiwi, la nectarine, l'oignon, l'orange, la prune , poire, orange, de la pastèque.

2.2 Méthodes

Papier construit modèle de réseau neuronal convolutif représenté sur la. figure 4, les couches des paramètres indiqués dans le tableau 1. La taille de l'image d'entrée est de 28 × 28, il convient tout d'abord les dimensions rognage d'image et de largeur réduite à 1: 1 Heights, la largeur est réduite pour empêcher la distorsion de l'image Heights et perte d'information caractéristique importante. Avec Batch méthode stochastique de descente de gradient (gradient stochastique Minibatch descendre, Minibatch SGD) 200200 itérations (époques), pour chaque époque, 10 échantillons de chaque entrée d'apprentissage, et inverser la propagation de poids mises à jour. mise ici la valeur initiale du taux d'apprentissage 0,1, le taux de reconnaissance à être augmentée sans tendance significative l'augmentation ou la vitesse d'apprentissage lent va devenir un facteur de 2; 0,6 élan terme est fourni; facteur de pondération d'atténuation de disponible 0,0005; données d'expérience congé-out (holdout) partitionnement, 2240 images choisis au hasard que l'ensemble d'apprentissage, le 560 restant comme un ensemble de test.

2.3 Résultats et analyse expérimentale

2.3.1 identifier différents types de fruits et légumes matrice de confusion

5 tester toutes sortes de fruits et légumes confusion taux de reconnaissance de la matrice de la méthode proposée. Matrice positions diagonales des données correspondant à la zone plus foncée dans le taux de reconnaissance des fruits et légumes comme un axe Y, que le reste du bloc de données correspondant aux fruits de couleur claire et de légumes est faussement identifiés comme correspondant au taux de reconnaissance de l'axe X de fruits et légumes comme un axe Y. Comme on peut le voir à partir de la matrice de confusion Kiwi facilement reconnu par erreur comme pomme verte, poire facilement mal identifié comme les pommes de terre (jaune). A partir de l'ensemble de données d'image se trouve dans ces fruits étaient la forme même objectif, élevé restant de noix de cajou, oignons, pomme Fuji, melon, oignon, orange, prune, orange, etc. taux de reconnaissance verte, en particulier orange et cantaloup peut être jusqu'à 100% le taux correct. À savoir convolutif modèle de réseau neuronal et problème de l'identification des paramètres du fruit et légume ici peuvent obtenir un meilleur résultat de reconnaissance.

2.3.2 RELU employés comme le taux de reconnaissance et la fonction d'activation sigmoïde de comparaison figure

La figure 6 est un réseau en utilisant la fonction RELU sigmoïde et la fonction de comparaison de la vitesse de convergence itérative 200 fois FIG, où la ligne continue représente le taux de reconnaissance courbe de fonction d'activation RELU, pour identifier un point de la courbe en trait plein de la fonction d'activation sigmoïde. De la figure peut être trouvée en utilisant la pré-fonction convergence plus rapide RELU; réseau stable, le taux global de reconnaissance fonction d'activation RELU est d'environ 83,4%, beaucoup plus élevé que le taux de reconnaissance de 67,7% fonction sigmoïde, peut être empêchée efficacement parce le réseau est « plus apte », il est possible d'améliorer le taux de reconnaissance des fruits et légumes dans une grande mesure.

2.3.3 tableau de comparaison Ajouter taux de reconnaissance du réseau ou non Dropout aléatoire

7 sont ajoutés au graphe de réseau illustrant les taux de reconnaissance après 200 itérations Renvoi aléatoires ou non, où la ligne continue est ajouté au taux d'abandon aléatoire de 30% de la reconnaissance de la courbe obtenue, la reconnaissance de point n'a pas été ajouté à la courbe en trait plein de décrochage . Réseau stabilisé en ajoutant le taux de reconnaissance globale Dropout aléatoire d'environ 83,4%, et non ajouté taux de reconnaissance globale Dropout aléatoire d'environ 79,3%, le taux de reconnaissance hausse de 4,1%. L'introduction d'un certain pourcentage du réseau peut être rendu plus aléatoire clairsemée Dropout, ce qui réduit l'interaction entre les neurones, dans une certaine mesure du possible, d'améliorer le taux de reconnaissance des fruits et légumes, et le réseau « gigue » plus petit, plus robuste.

3 Conclusion

reconnaissance d'image de papier de fruits et légumes en construisant un modèle de réseau de neurones à convolution, réseau utilise une fonction linéaire de la fonction d'activation des neurones Relu, accélérer la convergence du réseau, d'améliorer le taux d'efficacité de la formation et la reconnaissance. Dropout introduit dans une proportion de couche cachée, que le réseau a une meilleure généralisation. Les recherches futures entrera dans une taille de l'image plus grande, de sorte qu'une information de caractéristique plus riche, et des informations de couleur est ajoutée au réseau, sur les effets de la reconnaissance d'image couleur et de fruits continuer à améliorer la structure du réseau existant pour obtenir l'effet d'améliorer le taux de reconnaissance, de sorte que traiter efficacement ce problème d'identification.

références

. [1] Gu Hanshen, Wang Dong Un réfrigérateur sensible au contenu basé sur la technologie RFID dans la maison intelligente pour homehealthcare [C] .Proceedings de la 11e Conférence internationale sur les communications des technologies de pointe, Pékin, IEEE, 2009: 987-990.

[2] Dai Yang, Lin Sheng dans le codage et le décodage du bidimensionnelle ordinateur de codes à barres mis en uvre [J] de l'acquisition et de traitement de données, 2003,18 (3): .. 356360 [3] BOLLE RM, CONNELL JH, HASS. N, et al Veggievison :. un produit système de reconnaissance [P] .United Unis: 5546475A, 199608-13.

[4]. ROCHA A, HAUAGGE DC, WAINER J, et al automatique des produits classification à partir d'images en utilisant la couleur, la texture et les indices d'apparence [C] 21ème Symposium brésilien sur l'infographie et de l'image, CAMPOGRANDE, Brésil, IEEE 2008 :. 3 -10.

. [5] Zhang Yudong, Wu Lenan Classification des fruits à l'aide de la vision par ordinateur et le support multiclassent machine vecteur [J] .Sensors, 2012,12 (9): 1248912505.

[6] FARIA F A, dos SANTOS J A, ROCHA A, et al automatique fusion de classificateur pour produire reconnaissance [C] .25th SIBGRAPI sur des graphiques, de modèles et d'images, Ouro Preto, Brésil, IEEE, 2012 :. 20-25.

[7] Taohua Wei, Zhao Li, Xi Ji, et d'autres types de fruits et légumes à base de la méthode de reconnaissance fonction de la couleur et de texture [J] Journal of Agricultural Engineering, 2014,30 (16):. 305-311.

[8] LeCun Y, Bottou L, Bengio Y, et al.Gradientbased apprentissage appliqué à la reconnaissance de documents [C] .Proceedings de l'IEEE 86,1998: 2278-2324.

[9] Ji Shuiwang, Xu Wei, Yang Ming, et al.3D réseaux de neurones convolutionnels pour la reconnaissance de l'action humaine [J] .IEEE Transactions sur le modèle d'analyse et de renseignement automatique, 2013,35 (1): 221-231.

. [10] Sun Yi, Wang Xiaogang, Tang Xiaoou profonde cascade réseau convolutionnel pour la détection de points du visage [C] 0,2013 Conférence IEEE sur l'ordinateur Vision et Patten reconnaissance (CVPR), IEEE 2013: 3467-3483.

[11] KRIZHEVSKY A, SUTSKEVER I, HINTON G E.ImageNet classification avec les réseaux de neurones profonds convolutifs [C] .Advances dans le système Neural Information Processing 25: Actes de la 26e Conférence annuelle sur Neural Information Processing Systems, Lake Tahoe, États-Unis, 2012 : 1097-1105.

[12] Li Siwen, Lv Jiancheng, Ni gagne l'intégration d'applications intelligent convolutionnel identification du réseau de neurones réfrigérateur intelligent de fruits et légumes [J] Acquisition et traitement de données, 2016,18 (3): 205-212.

L'an dernier, les pays champion du box-office national sont à long sciés?
Précédent
Secret | Quête enveloppes micro lettre groupe de jeu, une nouvelle ère de joueurs de jeux!
Prochain
Cinquante-et-un jours faux huit? universités classe double feu préavis de vacances! Les utilisateurs possèdent l'école ......
week-end prochain à Wuhan ce jeu télévisé! Des centaines de jeux, plus grands noms de l'industrie, une cuisine gastronomique ......
La recherche et la batterie quantique d'étude SoC méthode d'estimation de la profondeur basée sur l'algorithme génétique
L'an dernier, le cresson obtenir les meilleures notes productions nationales, la suite devrait accolade?
le développement de haute qualité dans la voie rapide avec la reine, puis accélérer l'innovation ouverte
« Ours Paddington 2 » est OW Meng, la lecture est flattée
Matériel intelligent, le contenu mobile en deux moteurs écologiques, Baidu de son examen annuel de diversification
Sylvia "amour aveugle" affiche ultime 7 nominations aux Golden Horse Awards sentimentale
Captures d'écran "Kingdom Hearts 3" fuite débuts "Wreck-It Ralph"
Déchiquetée Yuan « acteur est né, » Je vais vous donner planifier accent
Une conférence, « forte » et « faible » d'Apple un coup d'oeil
Dix ans après que l'homme a été arrêté à nouveau voler la police immédiatement reconnaissable: le pays appelleriez-vous ce nom