AI entre 4,0 et industrielle, ainsi que dans quelle mesure l'écart?

Cet article est une compilation de technologie blog AI Yanxishe, le titre original:

Couvrant l'écart entre la réalité de l'IA et de l'Industrie 4.0

Auteur | Philip Montsho

Traduction | ciky étrange, Ophria

Relecture | examen Jeff Demps | éternel comme la nouvelle finition quotidienne | soeur d'ananas

Lien original:

https://medium.com/@p.k.montsho/a-summary-of-industry-ready-state-of-the-art-computer-vision-techniques-a7f2b893de2f

niveau le plus avancé de la synthèse de la technologie de vision par ordinateur de l'industrie

Aujourd'hui, Amnesty International a une tendance en plein essor dans l'industrie, car l'automatisation et l'optimisation est toujours l'objectif principal de la révolution numérique. Dans cet article, nous allons passer en revue les passionnante au cours des dernières années, la technologie de vision par ordinateur la plus avancée dans la communauté AI, ces techniques sont considérés comme prêts à l'industrie, et ont un impact significatif sur l'industrie, mais les cas d'utilisation réelle. Certaines de ces techniques pour l'amélioration des performances dans la mesure incroyable, au-delà des niveaux de performance de la portée de l'homme, qui a dépassé les attentes des normes de l'industrie la plupart de précision et de fiabilité. progrès Astonishing fait dans les tâches de vision informatique de base (par exemple la classification de l'image), ce qui rend la combinaison fiable de technologies pour créer un nouveau cas d'utilisation n'a jamais été explorée auparavant dans un environnement industriel avant une nouvelle technologie composite afin d'obtenir possible. Cela dit, ces nouvelles technologies se sont avérées des résultats comparables à ceux de l'exactitude et de la fiabilité des résultats que par un système très dense matériel dédié à entrer. Bien qu'il y ait des difficultés et des limites pratiques à la réalisation de ces systèmes propriétaires et matériel connexe installé, mais l'appareil photo est très facile d'acheter, ce qui a grandement élargi la gamme de cas d'utilisation. système de vision par ordinateur a permis AI permet entré dans un nouveau domaine, l'accélération de l'industrie 4.0, la réalité numérique et physique vraiment amélioré le processus.

Avant de comprendre les derniers développements dans la vision par ordinateur, laissez-nous introduisons tout d'abord quelques concepts de base des événements historiques et la vision de l'apprentissage en profondeur et l'ordinateur à cet égard.

Introduction à l'informatique Vision

vision informatique est une science, conçu pour permettre aux ordinateurs de comprendre et d'informations à partir discernable graphiques et vidéo. capacité de vision informatique qui effectuent automatiquement des tâches visuelles, telles que l'extraction et l'analyse des informations utiles à partir de graphiques ou vidéo.

Introduction à l'apprentissage de la machine et l'apprentissage en profondeur

l'apprentissage de la machine est un des algorithmes scientifiques et des modèles statistiques, cela dépend de l'approche axée sur les données pour prendre des décisions plutôt que l'approche basée sur des règles. Compte tenu de la quantité et la qualité des données et en améliorant les algorithmes, les systèmes d'apprentissage de la machine pour améliorer progressivement ses performances sur des tâches spécifiques. l'apprentissage en profondeur est une sous-classe de l'apprentissage machine, axée exclusivement sur un ensemble d'algorithmes mathématiques peut être décrit comme un réseau. Ils ont inspiré d'abord par les réseaux de neurones biologiques du cerveau trouve, également, réseau de neurones artificiels avec des millions de synapses artificiels, représenté mathématiquement par des millions de simples équations linéaires algébriques.

Conduire la vision par ordinateur d'apprentissage profond

Depuis 2012, la profondeur de l'apprentissage réseau de neurones a été une préoccupation majeure de la vision par ordinateur est justifiée. Poussé par la profondeur des avantages de l'apprentissage des systèmes de vision par ordinateur est qu'ils ont une plus grande précision, une plus grande flexibilité, et un grand nombre de changements dans des conditions d'éclairage, vue, dimensions, orientation, fusion avec l'arrière-plan, le type de situation, la différence, la déformation et comme ayant une occlusion visuelle plus tolérant. Mais surtout, ils ont inspiré un nouveau cas d'utilisation.

Début modèle de vision par ordinateur dépend des données de pixels d'origine en tant qu'entrée à des modèles d'apprentissage de la machine. Cependant, les données brutes des pixels individuels suffisante pour contenir l'objet en constante évolution de l'image.

étude approfondie du réseau de neurones de profondeur du pilote basée sur la vision par ordinateur peut extraire automatiquement et créer des tâches spécifiques dans les caractéristiques de phase de formation, qui est ensuite utilisé pour effectuer des tâches de vision par ordinateur.

La figure ci-dessous met en lumière certains d'apprentissage de la profondeur et la vision informatique près de six ans d'histoire des événements les plus importants.

  • La profondeur du réseau de neurones introduit en 2012 provoqué une percée fait une erreur de classification d'image est réduite d'environ 10% (de 25,8% en 2011 jusqu'à 16,4% en 2012).

  • 2015 les meilleures performances de l'algorithme avancé en termes de classification d'image dépasse le niveau humain (5,1%, Russakovsky et al.), Le taux exact de 3,57%.

  • En général, la profondeur de l'introduction de l'erreur de classification du réseau de neurones, l'image réduction de 10 fois (de 25,8% 20112017 approchant 2,3%).

  • En particulier, les résultats ci-dessus sont obtenus sur le jeu de données IMAGEnet, dans lequel une catégorie 20.000 typique de catégories, telles que « ballon » ou « fraise », une résolution d'image de pixels 469x387 de centaines de composants. système de vision informatique appliquée à une petite catégorie, une tâche particulière et une image haute résolution plus grand nombre de petits changements, et sa précision peut être aussi élevé que 99,9%. Cela fait fonctionner complètement avec confiance un système indépendant possible.

    Maintenant que nous avons couvert les bases, nous pouvons comprendre ces technologies de façon plus détaillée.

    Classification des images

    Dans cette section, nous allons introduire la classification d'image, il est une tâche étiquetterait un ensemble fixe de catégories affectées à l'image. Ceci est l'une des questions fondamentales dans la vision informatique, malgré sa simplicité, il dispose d'une large gamme d'applications pratiques. De nombreuses autres tâches de vision par ordinateur apparemment disparates (tels que des légendes d'image, détection de cible, la détection de point de clé et segmentation) peuvent être simplifiées que la classification d'image, d'autres tâches à l'aide de la nouvelle architecture de réseau de neurones. Les clips vidéo suivants illustrent un cas de classification très simple.

    Classification des images simple à l'aide Convolutif Neural Network (Venkatesh Tata décembre 2017)

    mot-clé d'image et la légende

    L'intersection de ces deux technologies AI dans les zones les plus intéressantes de la vision informatique et le traitement du langage naturel (PNL). Un mot clé est un mot utilisé pour décrire un des éléments de photographie ou image. Mots-clés sont ajouter des termes descriptifs pour photographier le processus.

    Il fait référence au processus basé sur la description des objets d'image de sous-titres image et le texte de l'action générée par image ou vidéo. Dans la figure ci-dessous, nous pouvons voir un exemple à cet égard.

    Image Sous-titrage basé sur l'apprentissage profond renforcement (Shi et al. Août 2018)

    Détection cible

    la détection des cibles est une technique de vision par ordinateur pour identifier et localiser un objet dans une image ou de vidéo. Ceci est généralement réalisé en enfermant un objet marqué avec un cadre de bordure. détection automatique de la cible est la technologie clé de conduire la voiture derrière, afin qu'ils puissent identifier ou distinguer les piétons et les autres voitures lampadaire. Il peut également être utilisé pour diverses applications, telles que l'inspection industrielle et la vision du robot. Parce que la concurrence IMAGEnet, seulement de 2010 à 2014, des erreurs de positionnement (de 42,5% à 25,3%) réduit de 1,7 fois. Le clip vidéo ci-dessous montre les résultats en temps réel de cette technologie pour les voitures, les gens et d'autres objets associés à un système de Détecte vision commune du pilote automatique, trouvé dans la ville.

    YOLO v3: Une amélioration progressive (Redmon et al avril 2018.)

    La détection du point clé et l'estimation de pose

    Le point clé est considéré comme une partie importante de l'image ou les caractéristiques intéressantes. Ils sont la position spatiale ou d'un point dans l'image, la définition de l'image ou le contenu du point fort contenu intéressant. Le point clé est particulière car elle est la même clé que le suivi des modifications de l'image devient possible, dans lequel l'image ou de l'objet dans la rotation de l'image se produit, le retrait / l'expansion ou la modification.

    estimation de la pose est un problème commun dans la vision par ordinateur, dont le but est de détecter la position et l'orientation de l'objet. Le point clé qui signifie généralement pour détecter l'objet. Cette technique peut être utilisée pour créer un très précis modèle à deux dimensions / trois dimensions qui décrit les principaux points de la position de l'objet peut alors être utilisé pour créer un frère jumeau numérique.

    Par exemple, dans le problème d'estimation de pose peut être détectée dans les coins des carrés des objets ménagers courants, qui peuvent comprendre la position des objets en trois dimensions dans l'environnement.

    Pose profonde d'objets Estimation pour sémantique robotique Saisissant d'objets ménagers (Trembley et al. Septembre 2018)

    La même méthode peut également être utilisé pour détecter la posture du corps humain, les points clés du corps humain tels que les épaules, les coudes, les mains, les genoux et les pieds seront détectés.

    OpenPose: en temps réel 2D Pose multi-personne Estimation par affinité Partie Les champs (Cao et al 18 décembre 2018.)

    segmentation sémantique

    Dans le cadre d'une technologie appelée segmentation sémantique (également désigné comme une cible de masquage), qui résout un problème important dans la vision par ordinateur: séparation visuelle de l'image de l'objet. Du grand point de vue de l'image, pour comprendre la scène de segmentation sémantique a ouvert la voie. Ceci est utile, car il permet à un ordinateur de reconnaître avec précision les limites des différents objets. Scène comprendre comme un problème central dans la vision informatique, et ses mensonges importance dans les connaissances acquises à partir de la segmentation sémantique rend la robustesse de plus en plus d'applications peuvent être améliorées. Dans un des véhicules autonomes ci-dessous, qui permet d'identifier la position exacte du véhicule et d'autres objets de la route.

    Etude approfondie de la division sémantique (George SAF Septembre 2018)

    Mentionné ci-dessous dans la technique appartenant à l'image à une conversion de l'image visible. Pour la technique suivante pour extraire le réseau plutôt que des opinions ou tirer des conclusions et d'améliorer l'image vidéo en améliorant la qualité.

    Super-résolution:

    L'objectif de cette mission est d'améliorer le niveau de détail tout en même temps améliorer la résolution de l'image. Un réseau très profond de neurones a récemment connu un grand succès en termes d'image de super-résolution. Agrandissement pour un grossissement de 2 fois, comme indiqué ci-dessous.

    Super-résolution réseau dense de rétention d'image (Zhang et al., Mars 2018)

    Vision nocturne

    L'imagerie est un défi à faible luminosité. l'image d'exposition à court se produit le bruit, une longue période d'exposition entraînerait le flou de mouvement. Ce dernier est souvent peu pratique, en particulier pour la photographie à main. Il a été proposé divers suppression du bruit, de-flou et la technologie améliorée, mais leur effet est limité dans des conditions extrêmes, comme la photographie à grande vitesse la nuit. Afin d'améliorer la norme actuelle, les chercheurs ont introduit la technologie de traitement d'image de faible luminosité en fonction de la profondeur de l'extrémité du réseau à la formation de fin. L'utilisation directe du réseau de données de capteur brut, remplacer de nombreuses techniques de traitement d'images classiques. Cela peut être clairement vu dans l'image suivante, un bruit d'image sombre a été améliorée de manière significative.

    Apprenez à voir les choses (Chen et al., Mai 2018) dans l'obscurité

    super SloMo

    Vidéo destiné interpolation entre deux images successives afin de générer un cadre intermédiaire. Ces image d'écran généré artificielle à l'indiscernable caractéristique visuelle originale. Cette technologie est utilisée pour amplifier sur la performance d'imagerie du système. Les résultats expérimentaux montrent que la pluralité d'ensembles de données, la profondeur de l'apprentissage une plus grande uniformité que les méthodes conventionnelles. Les résultats de cette technique peut être vu dans le clip vidéo ci-dessous, un cadre intermédiaire 7 est ajouté entre les images d'origine pour créer lisse vidéo au ralenti.

    Super SloMo: vidéo de haute qualité et plus moyenne estimation de l'interpolation d'image (Jiang et al, Juillet ici 2018.)

    Dans cet article, nous avons étudié de nombreuses technologies de vision par ordinateur, qui sont alimentés par une étude approfondie développée ces derniers mois, et ont montré des résultats incroyables, et prêts à mettre en uvre dans l'industrie. Ces technologies à la pointe de la technologie en améliorant la rapidité, la précision, la fiabilité et la flexibilité, ont montré que la technologie significative mieux précédente.

    Les principaux moteurs de l'innovation au cours des dernières années, l'augmentation du nombre de documents de recherche en intelligence artificielle, en particulier dans le domaine de la vision par ordinateur, en utilisant pleinement les dernières avancées technologiques pour améliorer l'évolution des opérations industrielles deviennent plus importantes.

    Merci de lire! Espoir vous avez appris quelque chose de nouveau et des choses utiles sur la plupart des technologies de vision informatique de pointe, la technologie est prête pour les applications industrielles réelles.

    Si vous voulez en savoir plus, assurez-vous d'applaudir pour cet article, et qu'il me suive.

    Si vous souhaitez discuter d'un environnement de production associée à votre cas d'utilisation, s'il vous plaît me contacter philip@beamberlin.com.

    Je veux continuer à voir les articles liens et références connexes?

    Appuyez sur et cliquez pour ouvrir un lien ou de clics, dans quelle mesure l'écart entre [AI et de l'industrie 4.0? ]:

    https://ai.yanxishe.com/page/TextTranslation/1410

    AI Yanxishe contenu passionnant mis à jour quotidiennement, la visualisation de contenu plus excitant: Lei Feng Lei Feng Lei réseau de réseau de réseau Feng

    Classification des images Conseils d'inventaire

    Programmation Dynamique: séquence binomiale

    Comment construire un modèle LSTM Keras, et le réglage des paramètres

    Comment voulez-vous construire un RCNN plus rapide culturel et éducatif avec PyTorch

    En attendant vous interprétez:

    Comment la structure sémantique référencé dans le traitement PNL nerveux

    Tu dors encore? Pas aussi bon que cela vous donne une sorte de sommeil il!

    DQNs Senior: Tirer profit de la profondeur de l'apprentissage de renforcement pour jouer au jeu Pac-Man

    La profondeur des nouvelles tendances d'apprentissage de renforcement: Google curiosité comment l'introduction de l'agent d'apprentissage par renforcement

    Chaussures de mariage de choix? 600 paires défini adidas NMD_R2 « bonheur » faire la définition de vue détaillée pas de note ici!
    Précédent
    Le premier rapide domestique! MIX 2S mil premier à mettre à jour la version officielle de P Andrews
    Prochain
    C'est vraiment Dr!
    téléphone écran pliant Samsung Galaxy Version Fold ligne de pays peut être officiellement ajoutée à préenregistrer
    La première clé vraiment pas non poreux téléphone mobile! Meizu zéro officiellement libéré
    Histoire ou cette histoire, pourquoi nous ne pouvons pas être comme « Meteor Garden » up?
    Takahashi est ménageait votre porte-monnaie! UNDERCOVER 2017 Winter Series Adds Nouveau!
    Outsiders ne font pas l'ancre? Zhang Tai Sin enfin officiel a déclaré les bonnes nouvelles, de se joindre à l'entreprise de devenir le haut
    vivo et fourmis robe d'or a annoncé la signature d'un accord de coopération stratégique: un visage humain à payer
    Yuan Zhenguo: les classements universitaires ne sont pas sérieux, non scientifique, indigne de confiance
    Voir « l'emporte sur le mal » avant, vous devez savoir au sujet de ces!
    L'hiver arrive, l'automne et l'hiver Cav Empt 2017 version nouvelle semaine de travail
    2022, un grand nombre de collèges de premier cycle et les universités ordinaires pour changer le type d'application
    Letme discours universitaire, pas le droit de laisser les fans l'ont appelé l'empereur, ne pas apporter trop de pression sur ce titre?