AI entre 4,0 et industrielle, ainsi que dans quelle mesure l'�cart?

Cet article est une compilation de technologie blog AI Yanxishe, le titre original:

Couvrant l'�cart entre la r�alit� de l'IA et de l'Industrie 4.0

Auteur | Philip Montsho

Traduction | ciky �trange, Ophria

Relecture | examen Jeff Demps | �ternel comme la nouvelle finition quotidienne | soeur d'ananas

Lien original:

https://medium.com/@p.k.montsho/a-summary-of-industry-ready-state-of-the-art-computer-vision-techniques-a7f2b893de2f

niveau le plus avanc� de la synth�se de la technologie de vision par ordinateur de l'industrie

Aujourd'hui, Amnesty International a une tendance en plein essor dans l'industrie, car l'automatisation et l'optimisation est toujours l'objectif principal de la r�volution num�rique. Dans cet article, nous allons passer en revue les passionnante au cours des derni�res ann�es, la technologie de vision par ordinateur la plus avanc�e dans la communaut� AI, ces techniques sont consid�r�s comme pr�ts � l'industrie, et ont un impact significatif sur l'industrie, mais les cas d'utilisation r�elle. Certaines de ces techniques pour l'am�lioration des performances dans la mesure incroyable, au-del� des niveaux de performance de la port�e de l'homme, qui a d�pass� les attentes des normes de l'industrie la plupart de pr�cision et de fiabilit�. progr�s Astonishing fait dans les t�ches de vision informatique de base (par exemple la classification de l'image), ce qui rend la combinaison fiable de technologies pour cr�er un nouveau cas d'utilisation n'a jamais �t� explor�e auparavant dans un environnement industriel avant une nouvelle technologie composite afin d'obtenir possible. Cela dit, ces nouvelles technologies se sont av�r�es des r�sultats comparables � ceux de l'exactitude et de la fiabilit� des r�sultats que par un syst�me tr�s dense mat�riel d�di� � entrer. Bien qu'il y ait des difficult�s et des limites pratiques � la r�alisation de ces syst�mes propri�taires et mat�riel connexe install�, mais l'appareil photo est tr�s facile d'acheter, ce qui a grandement �largi la gamme de cas d'utilisation. syst�me de vision par ordinateur a permis AI permet entr� dans un nouveau domaine, l'acc�l�ration de l'industrie 4.0, la r�alit� num�rique et physique vraiment am�lior� le processus.

Avant de comprendre les derniers d�veloppements dans la vision par ordinateur, laissez-nous introduisons tout d'abord quelques concepts de base des �v�nements historiques et la vision de l'apprentissage en profondeur et l'ordinateur � cet �gard.

Introduction � l'informatique Vision

vision informatique est une science, con�u pour permettre aux ordinateurs de comprendre et d'informations � partir discernable graphiques et vid�o. capacit� de vision informatique qui effectuent automatiquement des t�ches visuelles, telles que l'extraction et l'analyse des informations utiles � partir de graphiques ou vid�o.

Introduction � l'apprentissage de la machine et l'apprentissage en profondeur

l'apprentissage de la machine est un des algorithmes scientifiques et des mod�les statistiques, cela d�pend de l'approche ax�e sur les donn�es pour prendre des d�cisions plut�t que l'approche bas�e sur des r�gles. Compte tenu de la quantit� et la qualit� des donn�es et en am�liorant les algorithmes, les syst�mes d'apprentissage de la machine pour am�liorer progressivement ses performances sur des t�ches sp�cifiques. l'apprentissage en profondeur est une sous-classe de l'apprentissage machine, ax�e exclusivement sur un ensemble d'algorithmes math�matiques peut �tre d�crit comme un r�seau. Ils ont inspir� d'abord par les r�seaux de neurones biologiques du cerveau trouve, �galement, r�seau de neurones artificiels avec des millions de synapses artificiels, repr�sent� math�matiquement par des millions de simples �quations lin�aires alg�briques.

Conduire la vision par ordinateur d'apprentissage profond

Depuis 2012, la profondeur de l'apprentissage r�seau de neurones a �t� une pr�occupation majeure de la vision par ordinateur est justifi�e. Pouss� par la profondeur des avantages de l'apprentissage des syst�mes de vision par ordinateur est qu'ils ont une plus grande pr�cision, une plus grande flexibilit�, et un grand nombre de changements dans des conditions d'�clairage, vue, dimensions, orientation, fusion avec l'arri�re-plan, le type de situation, la diff�rence, la d�formation et comme ayant une occlusion visuelle plus tol�rant. Mais surtout, ils ont inspir� un nouveau cas d'utilisation.

D�but mod�le de vision par ordinateur d�pend des donn�es de pixels d'origine en tant qu'entr�e � des mod�les d'apprentissage de la machine. Cependant, les donn�es brutes des pixels individuels suffisante pour contenir l'objet en constante �volution de l'image.

�tude approfondie du r�seau de neurones de profondeur du pilote bas�e sur la vision par ordinateur peut extraire automatiquement et cr�er des t�ches sp�cifiques dans les caract�ristiques de phase de formation, qui est ensuite utilis� pour effectuer des t�ches de vision par ordinateur.

La figure ci-dessous met en lumi�re certains d'apprentissage de la profondeur et la vision informatique pr�s de six ans d'histoire des �v�nements les plus importants.

La profondeur du r�seau de neurones introduit en 2012 provoqu� une perc�e fait une erreur de classification d'image est r�duite d'environ 10% (de 25,8% en 2011 jusqu'� 16,4% en 2012).

2015 les meilleures performances de l'algorithme avanc� en termes de classification d'image d�passe le niveau humain (5,1%, Russakovsky et al.), Le taux exact de 3,57%.

En g�n�ral, la profondeur de l'introduction de l'erreur de classification du r�seau de neurones, l'image r�duction de 10 fois (de 25,8% 20112017 approchant 2,3%).

En particulier, les r�sultats ci-dessus sont obtenus sur le jeu de donn�es IMAGEnet, dans lequel une cat�gorie 20.000 typique de cat�gories, telles que � ballon � ou � fraise �, une r�solution d'image de pixels 469x387 de centaines de composants. syst�me de vision informatique appliqu�e � une petite cat�gorie, une t�che particuli�re et une image haute r�solution plus grand nombre de petits changements, et sa pr�cision peut �tre aussi �lev� que 99,9%. Cela fait fonctionner compl�tement avec confiance un syst�me ind�pendant possible.

Maintenant que nous avons couvert les bases, nous pouvons comprendre ces technologies de fa�on plus d�taill�e.

Classification des images

Dans cette section, nous allons introduire la classification d'image, il est une t�che �tiquetterait un ensemble fixe de cat�gories affect�es � l'image. Ceci est l'une des questions fondamentales dans la vision informatique, malgr� sa simplicit�, il dispose d'une large gamme d'applications pratiques. De nombreuses autres t�ches de vision par ordinateur apparemment disparates (tels que des l�gendes d'image, d�tection de cible, la d�tection de point de cl� et segmentation) peuvent �tre simplifi�es que la classification d'image, d'autres t�ches � l'aide de la nouvelle architecture de r�seau de neurones. Les clips vid�o suivants illustrent un cas de classification tr�s simple.

Classification des images simple � l'aide Convolutif Neural Network (Venkatesh Tata d�cembre 2017)

mot-cl� d'image et la l�gende

L'intersection de ces deux technologies AI dans les zones les plus int�ressantes de la vision informatique et le traitement du langage naturel (PNL). Un mot cl� est un mot utilis� pour d�crire un des �l�ments de photographie ou image. Mots-cl�s sont ajouter des termes descriptifs pour photographier le processus.

Il fait r�f�rence au processus bas� sur la description des objets d'image de sous-titres image et le texte de l'action g�n�r�e par image ou vid�o. Dans la figure ci-dessous, nous pouvons voir un exemple � cet �gard.

Image Sous-titrage bas� sur l'apprentissage profond renforcement (Shi et al. Ao�t 2018)

D�tection cible

la d�tection des cibles est une technique de vision par ordinateur pour identifier et localiser un objet dans une image ou de vid�o. Ceci est g�n�ralement r�alis� en enfermant un objet marqu� avec un cadre de bordure. d�tection automatique de la cible est la technologie cl� de conduire la voiture derri�re, afin qu'ils puissent identifier ou distinguer les pi�tons et les autres voitures lampadaire. Il peut �galement �tre utilis� pour diverses applications, telles que l'inspection industrielle et la vision du robot. Parce que la concurrence IMAGEnet, seulement de 2010 � 2014, des erreurs de positionnement (de 42,5% � 25,3%) r�duit de 1,7 fois. Le clip vid�o ci-dessous montre les r�sultats en temps r�el de cette technologie pour les voitures, les gens et d'autres objets associ�s � un syst�me de D�tecte vision commune du pilote automatique, trouv� dans la ville.

YOLO v3: Une am�lioration progressive (Redmon et al avril 2018.)

La d�tection du point cl� et l'estimation de pose

Le point cl� est consid�r� comme une partie importante de l'image ou les caract�ristiques int�ressantes. Ils sont la position spatiale ou d'un point dans l'image, la d�finition de l'image ou le contenu du point fort contenu int�ressant. Le point cl� est particuli�re car elle est la m�me cl� que le suivi des modifications de l'image devient possible, dans lequel l'image ou de l'objet dans la rotation de l'image se produit, le retrait / l'expansion ou la modification.

estimation de la pose est un probl�me commun dans la vision par ordinateur, dont le but est de d�tecter la position et l'orientation de l'objet. Le point cl� qui signifie g�n�ralement pour d�tecter l'objet. Cette technique peut �tre utilis�e pour cr�er un tr�s pr�cis mod�le � deux dimensions / trois dimensions qui d�crit les principaux points de la position de l'objet peut alors �tre utilis� pour cr�er un fr�re jumeau num�rique.

Par exemple, dans le probl�me d'estimation de pose peut �tre d�tect�e dans les coins des carr�s des objets m�nagers courants, qui peuvent comprendre la position des objets en trois dimensions dans l'environnement.

Pose profonde d'objets Estimation pour s�mantique robotique Saisissant d'objets m�nagers (Trembley et al. Septembre 2018)

La m�me m�thode peut �galement �tre utilis� pour d�tecter la posture du corps humain, les points cl�s du corps humain tels que les �paules, les coudes, les mains, les genoux et les pieds seront d�tect�s.

OpenPose: en temps r�el 2D Pose multi-personne Estimation par affinit� Partie Les champs (Cao et al 18 d�cembre 2018.)

segmentation s�mantique

Dans le cadre d'une technologie appel�e segmentation s�mantique (�galement d�sign� comme une cible de masquage), qui r�sout un probl�me important dans la vision par ordinateur: s�paration visuelle de l'image de l'objet. Du grand point de vue de l'image, pour comprendre la sc�ne de segmentation s�mantique a ouvert la voie. Ceci est utile, car il permet � un ordinateur de reconna�tre avec pr�cision les limites des diff�rents objets. Sc�ne comprendre comme un probl�me central dans la vision informatique, et ses mensonges importance dans les connaissances acquises � partir de la segmentation s�mantique rend la robustesse de plus en plus d'applications peuvent �tre am�lior�es. Dans un des v�hicules autonomes ci-dessous, qui permet d'identifier la position exacte du v�hicule et d'autres objets de la route.

Etude approfondie de la division s�mantique (George SAF Septembre 2018)

Mentionn� ci-dessous dans la technique appartenant � l'image � une conversion de l'image visible. Pour la technique suivante pour extraire le r�seau plut�t que des opinions ou tirer des conclusions et d'am�liorer l'image vid�o en am�liorant la qualit�.

Super-r�solution:

L'objectif de cette mission est d'am�liorer le niveau de d�tail tout en m�me temps am�liorer la r�solution de l'image. Un r�seau tr�s profond de neurones a r�cemment connu un grand succ�s en termes d'image de super-r�solution. Agrandissement pour un grossissement de 2 fois, comme indiqu� ci-dessous.

Super-r�solution r�seau dense de r�tention d'image (Zhang et al., Mars 2018)

Vision nocturne

L'imagerie est un d�fi � faible luminosit�. l'image d'exposition � court se produit le bruit, une longue p�riode d'exposition entra�nerait le flou de mouvement. Ce dernier est souvent peu pratique, en particulier pour la photographie � main. Il a �t� propos� divers suppression du bruit, de-flou et la technologie am�lior�e, mais leur effet est limit� dans des conditions extr�mes, comme la photographie � grande vitesse la nuit. Afin d'am�liorer la norme actuelle, les chercheurs ont introduit la technologie de traitement d'image de faible luminosit� en fonction de la profondeur de l'extr�mit� du r�seau � la formation de fin. L'utilisation directe du r�seau de donn�es de capteur brut, remplacer de nombreuses techniques de traitement d'images classiques. Cela peut �tre clairement vu dans l'image suivante, un bruit d'image sombre a �t� am�lior�e de mani�re significative.

Apprenez � voir les choses (Chen et al., Mai 2018) dans l'obscurit�

super SloMo

Vid�o destin� interpolation entre deux images successives afin de g�n�rer un cadre interm�diaire. Ces image d'�cran g�n�r� artificielle � l'indiscernable caract�ristique visuelle originale. Cette technologie est utilis�e pour amplifier sur la performance d'imagerie du syst�me. Les r�sultats exp�rimentaux montrent que la pluralit� d'ensembles de donn�es, la profondeur de l'apprentissage une plus grande uniformit� que les m�thodes conventionnelles. Les r�sultats de cette technique peut �tre vu dans le clip vid�o ci-dessous, un cadre interm�diaire 7 est ajout� entre les images d'origine pour cr�er lisse vid�o au ralenti.

Super SloMo: vid�o de haute qualit� et plus moyenne estimation de l'interpolation d'image (Jiang et al, Juillet ici 2018.)

Dans cet article, nous avons �tudi� de nombreuses technologies de vision par ordinateur, qui sont aliment�s par une �tude approfondie d�velopp�e ces derniers mois, et ont montr� des r�sultats incroyables, et pr�ts � mettre en uvre dans l'industrie. Ces technologies � la pointe de la technologie en am�liorant la rapidit�, la pr�cision, la fiabilit� et la flexibilit�, ont montr� que la technologie significative mieux pr�c�dente.

Les principaux moteurs de l'innovation au cours des derni�res ann�es, l'augmentation du nombre de documents de recherche en intelligence artificielle, en particulier dans le domaine de la vision par ordinateur, en utilisant pleinement les derni�res avanc�es technologiques pour am�liorer l'�volution des op�rations industrielles deviennent plus importantes.

Merci de lire! Espoir vous avez appris quelque chose de nouveau et des choses utiles sur la plupart des technologies de vision informatique de pointe, la technologie est pr�te pour les applications industrielles r�elles.

Si vous voulez en savoir plus, assurez-vous d'applaudir pour cet article, et qu'il me suive.

Si vous souhaitez discuter d'un environnement de production associ�e � votre cas d'utilisation, s'il vous pla�t me contacter philip@beamberlin.com.

Je veux continuer � voir les articles liens et r�f�rences connexes?

Appuyez sur et cliquez pour ouvrir un lien ou de clics, dans quelle mesure l'�cart entre [AI et de l'industrie 4.0? ]:

https://ai.yanxishe.com/page/TextTranslation/1410

AI Yanxishe contenu passionnant mis � jour quotidiennement, la visualisation de contenu plus excitant: Lei Feng Lei Feng Lei r�seau de r�seau de r�seau Feng

Classification des images Conseils d'inventaire

Programmation Dynamique: s�quence binomiale

Comment construire un mod�le LSTM Keras, et le r�glage des param�tres

Comment voulez-vous construire un RCNN plus rapide culturel et �ducatif avec PyTorch

En attendant vous interpr�tez:

Comment la structure s�mantique r�f�renc� dans le traitement PNL nerveux

Tu dors encore? Pas aussi bon que cela vous donne une sorte de sommeil il!

DQNs Senior: Tirer profit de la profondeur de l'apprentissage de renforcement pour jouer au jeu Pac-Man

La profondeur des nouvelles tendances d'apprentissage de renforcement: Google curiosit� comment l'introduction de l'agent d'apprentissage par renforcement

Route de la soie

Apprenez � conna�tre la Chine