Vous avez lu un article avec Computer Vision

Cet article est une compilation de technologie blog AI Yanxishe, le titre original:

vision par ordinateur d'apprentissage

Auteur | Romain Beaumont

Traduction | Huang Weicong, chesc

Relecture | sauce poire finale Fan | soeur d'ananas

Lien original:

https://towardsdatascience.com/learning-computer-vision-41398ad9941f

R�cemment, j'ai lu beaucoup d'informations relatives � la vision par ordinateur et fait beaucoup d'exp�riences, d�crit le contenu int�ressant dans le domaine de l'apprentissage et l'utilisation du processus ici.

segmentation d'images Autopilot

Ces derni�res ann�es, la vision par ordinateur a fait de grands progr�s. Ce sont les sujets que je mentionnerai ici:

technologie :

D�tection des visages: Haar, HOG, MTCNN, MobileNet
Reconnaissance des visages: CNN, Facenet
reconnaissance de la cible: alexnet, inceptionnet, ResNet
l'apprentissage de transfert: avec tr�s peu de nouveau sur la sc�ne d'une des ressources � grande �chelle pour reconvertir le r�seau de neurones
segmentation de l'image: RCNN
Formule r�seau de confrontation
Vision par ordinateur mat�riel n�cessaire: ce choix, la cl� est GPU
applications de l'interface utilisateur visuelle int�gr�e: ownphotos

application :

photos personnelles, commander
v�hicules autonomes
UAV automatique
Codes d'identification / OCR
Photos sur le site / app filtre
L'image est automatiquement �tiquet� l'application
Informations Extrait des vid�os (des �missions de t�l�vision, films) en
Q & Vision
art

Les gens sont pr�occup�s :

Il est important de fondateur de l'apprentissage en profondeur: andrew ng, yann LeCun, Bengio yoshua, hinton joffrey
Page adam Accueil geitgey a beaucoup d'articles int�ressants vision par ordinateur, tels que les liens ont une d�tection compl�te visage / alignement / processus d'identification

cours :

site Coursera dans les cours d'apprentissage en profondeur
site Coursera o� les cours d'apprentissage de la machine

domaines connexes :

l'apprentissage de renforcement profondeur: CNN inclus la PPO et DPN trait� comme couche d'entr�e
Interaction avec le traitement du langage naturel: LSTM 2 cnn

D�tection des visages

bloc de d�tection de visage est marqu� autour de la face

La d�tection des visages est de d�tecter le visage de la t�che. Il y a plusieurs algorithmes peuvent le faire.

https://github.com/nodefluxio/face-detector-benchmark fournit ces m�thodes r�f�rence de vitesse, et la r�utilisation facile de code de mise en uvre.

classificateur Haar

Ce sont les vieilles m�thodes de vision par ordinateur depuis 2000 est apparu dans OpenCV en. Fait un //wearables.cc.gatech.edu/paper_of_week/viola01rapid.pdf de pr�sentation: Dans cet article: http.

Ceci est un mod�le d'apprentissage machine, con�u pour l'extraction de caract�ristiques de d�tection de cible. la vitesse du classificateur Haar, mais une faible pr�cision.

Voir: https: //docs.opencv.org/3.4.3/d7/d8b/tutorial_py_face_detection.html expliqu� plus en d�tail et des exemples sur la fa�on de l'utiliser.

HOG: Histogramme de D�grad�s Oriented

HOG est une nouvelle m�thode d'extraction de caract�ristiques de d�tection d'objets: l'utilisation de celui-ci depuis 2005. Le proc�d� est bas� le calcul de gradient de pixel d'image. Ces caract�ristiques sont ensuite introduites dans les algorithmes d'apprentissage machine, par exemple SVM. Cette m�thode a une meilleure pr�cision que les classificateurs Haar.

Dlib dans la mise en oeuvre d'un tel proc�d� en ce que la lib face_recognition (https://github.com/ageitgey/face_recognition) de.

MTCNN

Une nouvelle m�thode pour d�tecter une image en utilisant un CNNs variable. Plus lent mais plus pr�cis. Voir: https: //kpzhang93.github.io/MTCNN_face_detection_alignment/index.html

MobileNet

La meilleure et la plus rapide pour la d�tection des visages actuellement utilis�, bas� sur une architecture r�seau mobile commun. Voir: https: //arxiv.org/abs/1704.04861

D�tection cible

D�tection cible et d�tection de visage peuvent �tre utilis�es des m�thodes similaires pour atteindre

Il y a deux document pr�sente la mise en uvre de sa nouvelle approche. Ces m�thodes sont parfois fournit �galement une cat�gorie pour cible (reconnaissance de la cible):

https://towardsdatascience.com/review-r-fcn-positive-sensitive-score-maps-object-detection-91cd2389345c r-fcn
https://towardsdatascience.com/r-cnn-fast-r-cnn-faster-r-cnn-yolo-object-detection-algorithms-36d53571365e une comparaison de r-cnn, rapide r-cnn, plus rapide r-cnn et Yolo

Convolution r�seau de neurones

Le d�veloppement r�cent rapide de l'apprentissage en profondeur, nous pouvons voir beaucoup de la nouvelle architecture a obtenu un grand succ�s.

Beaucoup convolution en utilisant une couche de r�seau de neurones est l'un d'entre eux. Une image 2D en utilisant une structure de couche de convolution afin de produire des informations utiles dans la couche suivante du r�seau de neurones.

Quelle est la convolution des d�tails pertinents, voir: https://towardsdatascience.com/intuitively-understanding-convolutions-for-deep-learning-1f6f42faee1

reconnaissance cible

objet de reconnaissance cible est class�e comme une cat�gorie sp�cifique (comme les chats, les chiens, ......) questions g�n�rales.

Sur la base de la profondeur de convolution de r�seau de neurones obtenu de tr�s bons r�sultats dans la t�che de reconnaissance d'objets. r�union ILSVR a �t� concours IMAGEnet ( Il y a beaucoup de photos d'un ensemble de donn�es, y compris les chats, les chiens et autres articles �tiquette) tenue le.

Le plus de succ�s le nombre de couches du r�seau de neurones utilis� de plus en plus.

l'architecture ResNet est de loin la meilleure architecture r�seau pour la classification cible.

Pour former correctement ResNet, il n�cessite l'utilisation de millions d'images, et m�me avec des dizaines de GPU cher, ont �galement besoin de passer beaucoup de temps.

Afin d'�viter � chaque fois dans ces grands ensembles de donn�es de recyclage, trouver une autre m�thode en place, il est tr�s important, et l'apprentissage de transfert et l'int�gration plongement est une telle m�thode.

A propos de mod�le de pr�-formation ResNet, visitez s'il vous pla�t: https://github.com/tensorflow/tensor2tensor#image-classification

reconnaissance des visages

La reconnaissance faciale est de savoir qui est un visage.

M�thode historique

Approche historique de cette t�che est de travaux de fonction utilis�s dans l'apprentissage de la machine standard (par exemple svm), ou la profondeur de l'apprentissage pour la reconnaissance cible.

Le probl�me avec ces m�thodes est qu'ils ont besoin d'une grande quantit� de donn�es pour chaque personne. En fait, les donn�es ne sont pas toujours disponibles.

Facenet

Google chercheurs en 2015 ont lanc� Facenet https://arxiv.org/abs/1503.03832. Il pr�sente une m�thode d'identification d'un visage humain, sans la n�cessit� de fournir un grand nombre d'�chantillons de visage pour tout le monde.

Cette m�thode est efficace pour le travail � travers un grand nombre d'images de visage ensembles de donn�es captur�es (par exemple

Ensuite, en utilisant des architectures de vision par ordinateur classiques, par exemple le d�but (ou ResNet), puis en rempla�ant la derni�re couche de reconnaissance de cible calcul�e r�seau neuronal face de couche enterr�e.

Pour chaque ensemble de donn�es, (en utilisant des heuristiques) s�lectionner trois faces (�chantillons n�gatifs, les �chantillons positifs, un second �chantillons positifs) et introduit dans le r�seau neuronal. Il en r�sulte trois incorporations int�gration. Utilisation de la perte de trois triplet informatique embarqu�e, ce qui rend la distance entre les �chantillons positifs et l'autre pour r�duire au minimum tout �chantillon positif, et de maximiser la distance entre la position de l'�chantillon avec d'autres �chantillons n�gatifs.

Le r�sultat final est chaque face (m�me si pas pr�sent dans l'ensemble de la formation originale du visage) peut maintenant �tre exprim�e en un plongement int�gr� (vecteur 128 dimensions), qui est int�gr� dans le visage de l'autre personne embarqu�e avec une grande distance.

Ensuite, l'insert peut �tre utilis� pour identifier une personne avec des mod�les d'apprentissage de la machine (comme knn m�me simples).

Chose � propos facenet et incorporations visage tr�s int�ressant est que vous pouvez l'utiliser pour identifier seulement quelques photos ou tout simplement une photo de personnes.

Reportez-vous � r�aliser son lib: https://github.com/ageitgey/face_recognition

C'est l'une de sa r�alisation tensorflow: https://github.com/davidsandberg/facenet

Ceci est une application de reconnaissance de visage processus de pens�e derri�re un endroit frais, est d'identifier le visage d'ours: https: //hypraptive.github.io/2017/01/21/facenet-for-bears.html

l'apprentissage de transfert

une nouvelle formation rapide et pr�cis du r�seau de neurones sur des ensembles de donn�es personnalis�s

La formation des r�seaux de neurones tr�s profond (comme ResNet) est tr�s gourmand en ressources, et exige �galement beaucoup de donn�es.

Vision par ordinateur est tr�s intensive informatiquement (pendant plusieurs semaines sur une pluralit� de GPU de formation) et n�cessitent de grandes quantit�s de donn�es. Pour r�soudre ce probl�me, nous avons d�j� discut� d'un visage humain pour calculer les incorporations encastrements universelles. Une autre approche consiste � utiliser re-formation du r�seau existant et d'autres ensembles de donn�es, dans lequel seules les couches de formation de formation.

Ceci est un tutoriel: codelab tutoriel. Il est recommand� de former un nouveau mod�le initial, afin de former les fleurs inconnues.

Au cours de l'�tude de la migration, le choix dont un � se recycler, � l'adresse suivante fournit un bon guide: https: //medium.com/@14prakash/transfer-learning-using-keras-d804b2e04ef8

La segmentation d'images

Pour le pilote automatique de segmentation d'images

Ces derni�res ann�es, la segmentation d'images peut �tre une t�che impressionnante. Comprenant l'identification de chaque pixel de l'image.

La t�che de d�tection cible li�e. Un algorithme est son masque r-cnn, pour plus d'informations, consultez cet article: https://medium.com/@jonathan_hui/image-segmentation-with-mask-r-cnn-ebe6d793272

GAN

Contre la formule r�seau, propos�e par Ian Goodfellow, l'architecture du r�seau est divis� en deux parties: la d�termination et le g�n�rateur.

Discriminateur pour d�tecter si une image appartient � une classe, il est pr�-form� habituellement sur un ensemble cible de classification des donn�es.
G�n�rateur pour une cat�gorie donn�e pour g�n�rer une image.

l'objectif est de rendre l'image avec l'image r�elle g�n�r�e par la classe aussi proche que possible, de sorte que le jugement ne peut �tre distingu� r�gler lors de l'�tude du poids du g�n�rateur,.

Ce qui suit est un exemple d'une GAN maximale d'image (https://arxiv.org/abs/1809.11096) g�n�r�.

A propos de GAN mis en uvre sur keras, voir: https://github.com/eriklindernoren/Keras-GAN

Vision par ordinateur mat�riel n�cessaire

Former un mod�le � grande �chelle, nous avons besoin d'utiliser beaucoup de ressources. Il y a deux fa�ons d'atteindre cet objectif. La premi�re est l'utilisation des services de cloud, tels que Google Cloud ou aws. La deuxi�me m�thode consiste � assembler leur propre ordinateur avec le GPU.

Seulement 1000 $, vous pouvez assembler une tr�s bonne machine pour former le mod�le d'apprentissage en profondeur.

Pour plus de d�tails, s'il vous pla�t se r�f�rer �: https://hypraptive.github.io/2017/02/13/dl-computer-build.html

interface utilisateur Computer Vision

ownphotos le tableau de bord du visage

Ownphotos est une interface �tonnante utilisateur qui vous permet de importer des photos et calcule automatiquement l'insert frontal, pour l'identification des cibles et la reconnaissance faciale.

Il utilise des algorithmes:

Reconnaissance des visages: face_recognition
D�tection cible: densecap, places365

application

Il existe de nombreuses applications de vision par ordinateur:

photos personnelles, commander
v�hicules autonomes
UAV automatique
Codes d'identification / OCR
Photos sur le site / app filtre
L'image est automatiquement �tiquet� l'application
Informations Extrait des vid�os (des �missions de t�l�vision, films) en
Visuel Q & R: traitement du langage naturel et vision par ordinateur
Art: r�seau contre g�n�rative

conclusion

Comme nous l'avons vu ici, la mise en uvre divers aspects du champ visuel de la naissance de nombreuses m�thodes nouvelles et int�ressantes et des applications.

Je pense que le plus l'intelligence artificielle d'int�ressant, dans tous les domaines, en particulier dans le champ visuel, algorithmes d'apprentissage est r�utilisable. Alors que ces m�thodes sont applicables pour g�rer de plus en plus de t�ches sans avoir besoin de ressources de puissance de calcul et des donn�es suppl�mentaires:

l'apprentissage de transfert: le pr�traitement de recyclage rapide du r�seau de neurones � grande �chelle possible
Int�gration (par exemple facenet): l'identification d'un certain nombre de classes sans avoir � faire ces cours de formation possible

Je veux continuer � voir les articles liens et r�f�rences connexes?

Appuyez sur et cliquez pour ouvrir un lien ou cliquez sur le fond pour vous prendre lire l'article [Computer Vision]:

https://ai.yanxishe.com/page/TextTranslation/1286

AI Yanxishe contenu passionnant mis � jour quotidiennement, la visualisation de contenu plus excitant: Lei Feng Lei Feng Lei r�seau de r�seau de r�seau Feng

Mot du point de vue linguistique le mod�le int�gr�

r�seau profondeur math�matique derri�re le secret de Deep Web

Comment l'apprentissage profond appliqu� � l'image de drone de d�tection cible

Python pointe avanc�e: coup� en deux avec une seule ligne de l'empreinte m�moire de code

En attendant vous interpr�tez:

Route de la soie

Apprenez � conna�tre la Chine