Apprenez � vous de construire le syst�me de d�tection d'objet en Python (avec le code, les mat�riaux d'apprentissage)

Auteur: FAIZANSHAIKH

Traduction: Yan Xiao Yu

Comment� par: Zhang Ling

Cet article sur 3200 Word, lecture recommand�e 10 minutes.

Cet article d�crit la technologie de d�tection d'objet et de plusieurs fa�ons diff�rentes de r�soudre avec vous ces domaines probl�matiques �tude approfondie de la fa�on de construire notre propre syst�me de d�tection d'objet en Python.

introduction

Lorsqu'une image est affich�e en face de notre cerveau reconna�tra instantan�ment les objets qu'il contient. D'autre part, la machine mais il faut beaucoup de temps et des donn�es de formation pour identifier ces objets. Mais avec la r�cente mise � niveau du mat�riel et de la profondeur de l'apprentissage, la vision informatique plus facile et plus intuitive.

Voir l'image exemple suivant, le syst�me est capable de reconna�tre l'incroyable pr�cision des diff�rents objets dans l'image:

La technologie de d�tection de l'objet a �t� une application rapide dans tous les domaines de la vie, en aidant � escorter les v�hicules autonomes dans le trafic dans les zones congestionn�es violence identifi�es, les �quipes sportives d'aide et d'analyse pour �tablir le rapport de scouting, afin d'assurer que le secteur de la fabrication le lien pour obtenir le contr�le de la qualit� appropri�e, et bien d'autres choses. Et ce ne sont que la surface de la technologie de d�tection d'objet peut faire des choses!

Dans cet article, nous apprendrons ce que la technologie de d�tection d'objet et de plusieurs fa�ons diff�rentes pour r�soudre ce probl�me, les zones suivies par l'�tude approfondie de la fa�on de construire notre propre syst�me de d�tection d'objet en Python. A la fin de cet article, vous aurez suffisamment de connaissances pour relever les d�fis d'une d�tection d'objet diff�rent seul!

Remarque: Ce tutoriel vous pr�d�fini comprendre les bases de l'apprentissage en profondeur, et jusqu'� ce que cela a �t� r�solu des probl�mes simples de traitement d'image. Si vous ne le faites pas, ou besoin d'un rappel, je vous recommande de lire les articles suivants:

profondeur Fondation de l'apprentissage - � partir du r�seau de neurones artificiels
https://www.analyticsvidhya.com/blog/2016/03/introduction-deep-learning-fundamentals-neural-networks/
Computer Vision apprentissage en profondeur - Introduction � convolution R�seaux de Neurones
https://www.analyticsvidhya.com/blog/2016/04/deep-learning-computer-vision-introduction-convolution-neural-networks/
Tutoriel: (reconnaissance d'images avec des �tudes de cas) en utilisant une optimisation du r�seau de neurones Keras
https://www.analyticsvidhya.com/blog/2016/10/tutorial-optimizing-neural-networks-using-keras-with-image-recognition-case-study/

annuaire

Quelle est la d�tection d'objet?
Nous pouvons utiliser diff�rentes m�thodes pour r�soudre le probl�me de la d�tection d'objet
M�thode 1: mani�re primitive (diviser pour r�gner)
M�thode 2: augmenter le nombre de scission
M�thode 3: effectuer une division structur�e
M�thode 4: Am�lioration de l'efficacit�
M�thode 5: apprentissage en profondeur en utilisant la m�thode de s�lection de fonction � la fin de la construction
Pour technique: comment utiliser la biblioth�que pour construire un mod�le de d�tection d'objet ImageAI

Quelle est la d�tection d'objet?

Avant de construire le mod�le le plus avanc�, essayons d'abord de comprendre ce que oui de d�tection d'objet. Si nous devons cr�er un syst�me de d�tection des pi�tons de v�hicule autonome, v�hicule image captur�e comme illustr� sur la figure. Comment d�cririez-vous cette image?

La voiture d'affichage d'image � proximit� d'un carr�, quelques personnes traversent la route devant notre voiture. Impossible d'identifier avec pr�cision les panneaux de signalisation, syst�me de d�tection des pi�tons du v�hicule doit identifier avec pr�cision l'emplacement des personnes � pied, afin de les �viter.

Alors, comment assurer que le syst�me de voiture parfaite pour l'�viter? Il peut faire est de cr�er une bo�te englobante autour de ces personnes, de sorte que le syst�me bas� sur l'emplacement des gens dans l'image, d�cider quel chemin prendre, pour �viter tout accident.

La d�tection de l'objet cible a deux aspects:

Tous les objets pr�sents dans l'image et l'identification de la position
Filtrer les objets d'int�r�t

Diff�rentes m�thodes pour r�soudre le probl�me de la d�tection d'objet

Maintenant, nous savons quel est le probl�me, alors que la m�thode (ou m�thodes) qui peuvent �tre utilis�s pour le r�soudre? Dans cette section, nous allons d�crire certaines techniques peuvent �tre utilis�es pour d�tecter l'image de l'objet. Commencez par la meilleure fa�on de commencer, et de l� pour trouver notre chemin. Si vous avez des suggestions sur les m�thodes mentionn�es ci-dessous ou une autre m�thode correspondante, s'il vous pla�t nous dire dans la section commentaire!

M�thode 1: mani�re primitive (diviser pour r�gner)

La meilleure fa�on est � l'image divis�e en quatre parties:

Le coin sup�rieur gauche

coin sup�rieur droit

coin inf�rieur gauche

coin inf�rieur droit

Maintenant, la prochaine �tape est d'avoir chaque partie de l'image au classificateur d'image pour la reconnaissance. De cette fa�on, nous allons y arriver si la sortie de chaque partie de l'image pi�tonne. Si oui, marquez la zone dans l'image originale. Sortie comme ceci:

Ceci est une bonne fa�on de commencer � essayer, mais nous sommes � la recherche d'un syst�me plus pr�cis et pr�cis. Il est n�cessaire d'identifier l'objet entier (ou d'une personne dans cet exemple), puisque seule une partie de la reconnaissance d'objets peut entra�ner des cons�quences d�sastreuses.

M�thode 2: augmenter le nombre de scission

syst�me pr�c�dent a bien fonctionn�, mais comment pouvons-nous am�liorer? Nous pouvons augmenter le nombre de bo�tes que nous entrons dans le syst�me gr�ce � l'index pour am�liorer la pr�cision. La sortie devrait ressembler � ceci:

Cette m�thode avantages et les inconv�nients. Bien que notre solution semble un peu mieux que la m�thode originale, mais une grande partie est bo�te de gros tamis, les r�sultats r�els sont fondamentalement les m�mes. Ceci est un probl�me, nous avons besoin d'une m�thode plus structur�e pour r�soudre ce probl�me de probl�me.

M�thode 3: repr�sente une structure partitions strictes

Pour construire notre syst�me de d�tection d'objet dans une approche plus structur�e, nous pouvons suivre les �tapes suivantes:

�tape 1: L'image est divis�e en 10x10 treillis, comme indiqu�:

�tape 2: La d�finition de chaque r�gion du centre de gravit�.

�tape 3: Pour chaque barycentre s�lectionner trois rapports d'aspect diff�rents de hauteur et la surface est la suivante:

�tape 4: Tous ces domaines va cr�er l'image entrants classificateurs pour obtenir des pr�dictions.

Par cons�quent, la sortie finale est comme? Un des r�sultats plus d�termin�s et stricte et ordonn�e - voir ci-dessous:

Cependant, nous pouvons am�liorer encore! Poursuivez votre lecture pour trouver une autre fa�on de produire de meilleurs r�sultats.

M�thode 4: Am�lioration de l'efficacit�

Auparavant, nous voyons la m�thode dans une large mesure est acceptable, mais nous pouvons �galement construire un syst�me plus efficace qu'auparavant. Pouvez-vous recommander comment le faire? Dans mon esprit, je peux faire un programme d'optimisation. Si nous pensons � m�thode 3 , Vous pouvez faire deux choses pour am�liorer le mod�le:

Augmenter la taille de la grille: La taille des mailles de 20 � la place de la 10 originale:

Dans une vari�t� de taille et rapport d'aspect pour s�lectionner d'autres zones au lieu de seulement trois domaines: Ici, on peut entourer la zone de chaque ancre barycentre s�lectionner neuf sortes de formes, � savoir, trois hauteurs diff�rentes r�gion carr�e et six diff�rentes hauteurs verticales et horizontales de la zone rectangulaire, qui nous fournit des r�gions de diff�rents rapports d'aspect.

Encore une fois, c'est des avantages et des inconv�nients. Bien que ces m�thodes peuvent nous aider � atteindre un niveau plus d�taill�, mais parce que nous devions passer � tous les domaines du mod�le de classification d'image, ce qui entra�nera l'explosion de recalcul.

Ce que nous pouvons faire est de zone s�lective plut�t que Choisit tous s�lectionn�s. Par exemple, nous pouvons construire un mod�le de classification du milieu, qui tente de pr�dire si la s�lection est vraiment que l'arri�re-plan, ou contient potentiellement un objet, ce qui peut r�duire de fa�on exponentielle la zone du mod�le de classification d'image du jugement.

Il y a un autre sch�ma d'optimisation est La r�duction de la pr�dit � le m�me objet � . Rappelons M�thode 3 fois:

Comme vous pouvez le voir, essentiellement toutes les pr�dictions bo�tes sont la m�me personne, nous pouvons choisir un. Ainsi, on peut consid�rer toute la coche dans la � m�me objet �, par �ventuellement un plus un probable du mod�le de classification de zone de saisie d'image d�tect�e, � pr�dire.

� l'heure actuelle, tous ces optimisation nous a donn� des pr�visions tout � fait appropri�es. Nous sommes � peu pr�s certain de gagner, mais vous pouvez deviner ce qui manque il? apprentissage en profondeur!

M�thode 5: apprentissage en profondeur en utilisant la m�thode de s�lection de fonction � la fin de la construction

l'apprentissage de profondeur a un grand potentiel dans le domaine de la d�tection d'objet. Pouvez-vous sugg�rer o� et comment utiliser notre apprentissage en profondeur pour r�soudre notre probl�me? J'ai �num�r� quelques-unes des fa�ons, comme suit:

par entr�e du r�seau de neurones afin de r�duire les dimensions de l'image originale Au lieu d'entrer dans tous les domaines de l'image originale.
peut �galement Utilisation de r�seaux de neurones pour d�finir une s�lection de zone d'image .
pouvoir Renforcer l'algorithme d'apprentissage en profondeur Si proche de l'original que possible de pr�dire la zone de d�limitation des objets dans l'image, qui veillera � ce que l'algorithme peut �tre plus strictement, plus finement pr�dire la zone de d�limitation.

Maintenant, nous pouvons utiliser un seul mod�le de r�seau de neurones de profondeur, pour tenter de r�soudre tous les probl�mes lui-m�me, plut�t que la formation diff�rents r�seaux de neurones pour r�soudre tous les probl�mes. L'avantage est que le r�seau de neurones Chacun des composants plus petits contribueront � optimiser d'autres parties du r�seau de neurones Pour faciliter notre coop�ration et de formation commune dans le mod�le profond.

Jusqu'� pr�sent, toutes les m�thodes que nous avons vu, nous sommes en mesure de fournir le meilleur rendement de la performance, un peu semblable � la figure ci-dessous. Nous verrons dans la section suivante sur la fa�on d'utiliser Python pour le cr�er.

Pour technique: comment la biblioth�que ImageAI Mod�le d�tection d'objets de construction

Maintenant que nous savons quelle est la d�tection d'objet et la meilleure fa�on de r�soudre ce probl�me, nous allons construire votre propre syst�me de d�tection d'objets! ImageAI nous allons utiliser la biblioth�que, qui est une biblioth�que Python qui prend en charge tous les algorithmes d'apprentissage machine la plus avanc�e dans les t�ches de vision par ordinateur.

mod�le de pr�diction de d�tection d'objet Run est tr�s simple � obtenir. Nous n'avons pas le script d'installation complexe pour commencer, ou m�me exiger que le GPU pour g�n�rer une pr�diction! Nous allons utiliser cette biblioth�que pour obtenir une sortie ImageAI dans la m�thode 5 voir. Il est fortement recommand� que vous entrez le code suivant sur votre machine, car il vous aide � tirer le meilleur parti des connaissances de cette section.

S'il vous pla�t noter que vous devez mettre en place le syst�me avant de cr�er le mod�le de d�tection d'objet. Anaconda apr�s l'installation dans un syst�me local, pour commencer la proc�dure suivante.

�tape 1: Utilisez python version 3.6 build environnement Anaconda.

Conda cr�er -nretinanet python = 3,6 Anaconda

�tape 2: Activez l'environnement et installer les logiciels n�cessaires.

la source activateretinanetconda installtensorflow numpy scipy OpenCV oreiller matplotlib h5py keras

�tape 3: Installation biblioth�que ImageAI

pip installer https://github.com/OlafenwaMoses /ImageAI/releases/download/2.0.1/imageai-2.0.1-py3-none-any.whl

�tape 4: T�l�charger obtenir les pr�visions des mod�les pr�-formation requis. Le mod�le est bas� RetinaNet (futur sujet de l'article). Acc�s le lien pour t�l�charger le mod�le pr�-formation --RetinaNet:

https://github.com/OlafenwaMoses/ImageAI/releases/download/1.0/resnet50_coco_best_v2.0.1.h5

�tape 5: Copiez les fichiers t�l�charg�s dans ce dossier.

�tape 6: � partir du lien ci-dessous pour t�l�charger l'image, l'image nomm�e image.png:

https://s3-ap-south-1.amazonaws.com/av-blog-media/wp-content/uploads/2018/06/I1_2009_09_08_drive_0012_001351-768x223.png

�tape 7: bloc-notes Open jupyter (bloc-notes de type jupyter dans le terminal) et ex�cutez le code suivant:

de d�tecteur imageai.Detection import ObjectDetectionimport os execution_path = os.getcwd () = d�tection d'objet () detector.setModelTypeAsRetinaNet () detector.setModelPath (os.path.join (execution_path de "resnet50_coco_best_v2.0.1.h5")) detector.loadModel () custom_objects = detector.CustomObjects (personne = True, voiture = False) = detector.detectCustomObjectsFromImage d�tection (input_image = os.path.join (execution_path, "image.png"), output_image_path = os.path.join (execution_path, � image_new. .png "), custom_objects = custom_objects, minimum_percentage_probability = 65) pour eachObject en d�tections: print (eachObject +": "+ eachObject ) print (" ---------- ---------------------- � )

Cela va cr�er un fichier image nomm� image_new.png apr�s une modification, qui contient la zone de d�limitation de l'objet.

�tape 8: Si vous avez besoin d'imprimer l'image, utilisez le code suivant:

de ImageImage d'importation IPython.display ( "image_new.png")

F�licitations! Leur mod�le de d�tection d'objets que vous avez cr�� pour la d�tection des pi�tons. Ce grand amis!

�pilogue

Dans cet article, nous avons appris ce que la d�tection d'objet et mod�le de d�tection d'objet cr�� l'id�e, mais aussi apprendre comment utiliser la biblioth�que pour construire la ligne ImageAI mod�le de d�tection des pi�tons.

Par code peaufinage, vous pouvez facilement convertir le mod�le pour r�soudre leurs propres probl�mes de d�tection d'objets. Si vous avez utilis� la m�thode ci-dessus pour r�soudre ces probl�mes, en particulier les aspects sociaux, s'il vous pla�t nous dire dans les commentaires ci-dessous!

Titre original:

Understandingand Construction d'un mod�le de d�tection d'objet � partir de z�ro en Python

Lien original:

https://www.analyticsvidhya.com/blog/2018/06/understanding-building-object-detection-model-python/

Introduction Traducteur

Yan Xiaoyu, dipl�m� de Universit� foresti�re de Beijing, a �tudi� � l'Universit� de Californie du Sud sur le point d'appliquer biostatistique et le programme d'�pid�miologie Ma�tre. Continuer sur la route des statistiques de la sant� se sont battus, les donn�es d'amour, regard vers l'avenir.

attention Tsinghua - donn�es Acad�mie des sciences de Qingdao plate-forme publique micro-canal officiel " donn�es d'envoi THU � Sisters et n � � Les donn�es envoy�es THU � Pour plus de conf�rences et de bien-�tre contenu de qualit�.

Route de la soie

Apprenez � conna�tre la Chine

Apprenez � vous de construire le syst�me de d�tection d'objet en Python (avec le code, les mat�riaux d'apprentissage)