La télédétection | identification mer cible de champ de bataille basé sur l'image d'apprentissage en profondeur

résumé

Ces dernières années, convolution les performances du réseau de neurones dans la classification d'images, recherche d'images et détection d'objets dans des domaines tels que l'obtention d'une meilleure, les applications d'apprentissage la recherche pour la profondeur du champ de bataille de la mer Image Recognition devenir riche. Tout d'abord, il résume la théorie et le développement commun système de reconnaissance d'objets d'image de la technologie d'apprentissage approfondie et une analyse comparative de la technologie de reconnaissance traditionnelle et de la technologie de l'apprentissage en profondeur, le modèle de la série R-CNN en fonction des recommandations régionales et les avantages et les inconvénients modèle YOLO régression, peignage l'état d'application de la profondeur de la mer des techniques d'apprentissage dans la reconnaissance cible d'image sur le terrain, enfin tourné vers l'avenir direction possible du développement de l'image technologie de reconnaissance cible mer sur le terrain.

Dans la guerre navale moderne, satellites, drones et autres plates-formes de l'aérospatiale et d'enquête militaire pour obtenir la détection de cible dans une large gamme d'applications peut être surveillé et capturé un grand nombre de télédétection, SAR et images visibles, calcule la solution cible de l'identité de ces images et informations de localisation planification tactique, le commandement et aide à la décision ainsi que des frappes de précision de grande valeur. Cependant, dans l'environnement du champ de bataille de la mer réelle, la qualité d'image est souvent sensible à la lumière, la brume, les facteurs naturels et géographiques occlusion d'influence, en outre, cible elle-même a l'attitude et de la variabilité à l'échelle, ces facteurs auront un certain impact sur les performances de reconnaissance. Par conséquent, l'étude de l'image technologie avancée de reconnaissance automatique cible pour améliorer la capacité de reconnaissance d'image dans l'environnement du champ de bataille de la mer est très important.

Battlefield Naval technologie de reconnaissance de cible

Battlefield reconnaissance d'image basée en mer et la reconnaissance d'objets, y compris la séquence de reconnaissance d'images fixes sur la base de l'image, ce document met l'accent sur l'identification basée sur l'image statique. Une image complète du champ de bataille de la mer système d'identification cible à reconnaître la catégorie d'image et de l'image toutes les cibles dans l'emplacement spécifique et la taille de toutes les cibles.

1.1 Classification modèle de réseau de neurones en fonction de convolution

Circonvolution réseau de neurones est actuellement la technologie de l'apprentissage en profondeur le plus largement utilisé, et ses excellentes performances dans la classification d'images, recherche d'images, détection d'objets et d'autres tâches.

Un réseau neuronal convolutif classique comprend typiquement une couche d'entrée, une couche de convolution, la couche inférieure a été échantillonné (couche de cellules a également appelé), intégralement couche connectée et la couche de sortie, dans lequel la couche supérieure est formée par convolution d'une certaine taille, par la convolution couche d'adaptation de sortie de gauche à droite, de haut en opération de convolution étape incontournable fond, sous-échantillonnage résultat de convolution de couche en petits points caractéristiques d'intégration de voisinage, les données de couche entièrement reliées par une série de convolution et downsampling étape après classement, le dos d'erreur résultant aux couches précédentes et met à jour les paramètres du noyau de convolution et paramètres complets de la couche de connexion, la réalisation définitive de la classification d'image.

En 1998, LeCun a mis en avant pour les deux dimensions des problèmes de reconnaissance de texte d'image prototype du réseau de neurones de convolution moderne --- Lenet, illustré à la figure 1.

AlexNet sur la base de Lenet approfondi l'étude de couches du réseau, en utilisant cinq couches de convolution et à trois couches entièrement connectées, et un certain nombre d'améliorations dans la formation, principalement: 1) Utilisation fonction RELU ne résout la fonction d'activation gradient de problème sujettes disparaît couches plus profondes du réseau; 2) en utilisant une LRN normalisée améliorer la capacité de généralisation du réseau; 3) en taille de la piscine est plus grande que l'étape, la partie entière de neurones de formation tomber au hasard de la couche de connexion élément et analogues pour développer les données d'apprentissage de taille fixé inhibée surajustement, 4) répartis sur un réseau de formation de calcul de l'accélération multi-GPU. AlexNet est la première percée dans la classification d'images du réseau de la concurrence IMAGEnet, il a jeté les bases du futur en modèle plus exceptionnel.

Circonvolution extraction de caractéristiques d'image du noyau afin d'améliorer la performance de CNN dans la classification des images, des chercheurs de l'utilisation intensive de 3 * 3 couche de convolution de l'Université d'Oxford, a fait le modèle plus profond que AlexNet modèle VGG.

Google pour une meilleure intégration de fonctionnalité modèle multi-échelle proposé InceptionNet, InceptionNet contrôle de convolution sur une pluralité de tailles différentes de la même couche d'une sortie de convolution de convolution de couche, et tous les résultats accumulés à une opération de convolution ensemble, évitant ainsi la détermination manuelle pour amener la taille du noyau de convolution d'incertitude. En outre, InceptionNet réduire le nombre de couches entièrement connectées couches, toutes les couches sauf la classification de la couche que toutes les caractéristiques de l'extracteur commun.

Depuis la disparition du gradient et problème d'explosion gradient, une formation de réseau de neurones profond est difficile, par conséquent, que le réseau continue d'augmenter la profondeur de précision de la classification, mais diminuera. Pour résoudre ce problème, basé sur l'utilisation de Ming Ho Kai plus facile convolution de pensée entre les couches d'entrée et de sortie étude, proposée ResNet, ResNet chaque bloc résiduel sur la base de la propagation précédente de la valeur d'activation de la couche de courant est connecté à long plus profondément dans le réseau, comme représenté sur la. figure 2.

l'apprentissage de transfert de technologie à 1,2 petit échantillon

Depuis la formation du réseau de neurones de convolution nécessite beaucoup de données, mais dans l'image réelle des applications d'identification des cibles du champ de bataille de la mer, Collect image mer contient un grand nombre de cibles réelles du champ de bataille plus difficile, envisager la migration d'apprendre. Transfert d'apprentissage en ajustant simplement le modèle formé pour obtenir le nouveau modèle est appliqué à de nouveaux problèmes sur une question.

Donahue J et al Note: dans les modèles Inception-v3 ont terminé la formation, la fonction est à l'image extraite de la couche d'entrée à la dernière couche d'une convolution, le dernier réseau de neurones entièrement connecté ne peut par une bonne monocouche IMAGEnet distinguer la classe d'image 1000, la couche de sortie du modèle de convolution de création-v3 peut être simplifié et exprimé en tant que vecteur de caractéristique d'image arbitraire forte capacité. Ainsi, l'utilisation peut être formé couche de puits fonctionnalité modèle Inception-v3 convolutionnel extraction nouvelle série d'images, et en utilisant les vecteurs de caractéristiques comme entrée extraits pour former un nouveau classificateur.

1.3 Détection et reconnaissance des cibles zone proposée sur la base

Étant donné que l'image contient habituellement plus d'une cible, donc, l'image entière est divisée en une seule catégorie ne sont pas précis. En outre, un système de reconnaissance d'image complète de reconnaître les cibles dans toutes les catégories et leur emplacement spécifique dans l'image. Comme système d'identification classique, en utilisant également le modèle de classification algorithme de détection objet pré-formé selon la région candidate région de réseau de neurones convolutionnel dans l'image sont classés. Ces dernières années, une méthode de génération d'un approfondissement de la région candidate a émergé de nombreux algorithme de détection sophistiqué comprend une série de détection algorithme R-CNN.

CNN couramment utilisé dans les systèmes de reconnaissance classiques procédé de détection de fenêtre coulissante peut également être utilisé pour identifier la même profondeur du système à base de réseau, qui, au moyen de la force de gauche à droite et de haut en fenêtre glissante inférieure de taille fixe, et en utilisant un pré-formés pour remplir la fenêtre la classification cible. Calcul de la méthode de fenêtre coulissante pour détecter le coût élevé, la taille de la fenêtre et le mouvement de la fenêtre est difficile de déterminer les lacunes évidentes foulée.

Girshick R et d'autres défauts de la méthode de la fenêtre coulissante est proposé d'utiliser sélective Recherche environ 2000 zone d'extraction de candidat peut comprendre une cible à détecter à partir d'une image à détecter, en utilisant un CNN pré-formé caractéristiques d'extraction de ces régions candidates, et enfin le classement cible retour de trame, qui est R-CNN, comme représenté sur la Fig.

En ce qui concerne la méthode de fenêtre coulissante, R-CNN, bien que le coût de calcul est largement réduite, mais les régions 2000 candidats résultant nécessite une entrée séparée CNN caractéristiques extraites, la formation, et est donc encore très faible vitesse est déduit. Pour réduire davantage le coût de calcul, double comptage R-CNN résoudre les problèmes, Girshick R basée sur l'utilisation directe au lieu de carte de caractéristique originale pour détecter l'idée cible, propose également plus rapide R-CNN, plus rapide R-CNN n'est plus le même que R-CNN pour chaque extraction de région candidate, mais la totalité de la première extraction de caractéristique d'image en utilisant CNN, la méthode crée des régions candidates sélective recherche directement sur un graphique caractéristique représentée à la Fig.

Plus rapide R-CNN généré pour le problème du temps modèle 2000 trop longtemps une région candidate, Ren S mis en avant plus rapide R-CNN, a ajouté réseau recommandé de générer rapidement une région candidate après la dernière couche de convolution, et détermine la région candidate comprenant ou non une classe particulière de cibles, utilisée pour ajuster davantage la région candidate de régression final incluant un objet, comme le montre la figure 5, plus rapide R-CNN améliorer grandement l'efficacité de la détection et de reconnaissance cible.

1.4 sur la base de réseaux de technologie de détection de bout en entraînables objet

BojarskiM et ainsi pour la première fois dans leurs documents mentionnés à la fin de l'étude, mais n'a pas donné une définition stricte. En général, toutes les tâches de l'extrémité d'entrée à la borne de sortie dans le processus de formation du même réseau peut être considéré comme la fin de l'apprentissage.

En fait, le plus rapide RPN R-CNN intégré plus rapide R-CNN obtenir réseau de détection uniforme de bout en bout a un réseau capable d'être formée. Plus rapide R-CNN, mais encore être accompli par un procédé de génération de zone candidate de reconnaissance de cible, il y a un grand chevauchement de plusieurs région candidate identifié le travail apporté à plusieurs reprises. Plus rapide R-CNN les défauts existent, Redmon J mis en avant YOLO (You Look Only Once) modèle. modèle YOLO est un modèle de régression pour la détection et l'identification de détection d'objet sur la base comme une régression, en utilisant l'image d'entrée est un CNN raisonnement directement à l'image de tous les objets, appartient à la catégorie et la probabilité de confiance correspondant, fortement pour améliorer la vitesse de détection de cible.

Comparaison des différentes reconnaissance dans l'application pratique de la technique

2.1 Comparaison de la technologie d'identification et les techniques traditionnelles d'apprentissage en profondeur

Battlefield procédé classique d'identification du système de reconnaissance de cible de mer dans le prétraitement, l'extraction de caractéristiques, l'intégration de fonctions et la détection de la cible et l'étape de reconnaissance de quatre, comme représenté sur la Fig.

Et les systèmes conventionnels de reconnaissance artificielle nécessitent des caractéristiques de conception, le système de reconnaissance basé sur la profondeur des technologies d'apprentissage en apprenant automatiquement un grand nombre de données de formation, pour extraire des caractéristiques importantes nécessaires à la cible de reconnaissance, complétant ainsi la tâche de reconnaissance, comme le montre la figure.

Ces dernières années, la technologie basée sur le réseau de neurones convolutionnel a été l'apprentissage en profondeur dans le domaine de la vision par ordinateur a été largement utilisé, pourquoi la discussion sur la profondeur de la technologie d'apprentissage peut travailler de plus en plus, l'affichage, la profondeur des techniques d'apprentissage et de la technologie de reconnaissance traditionnelle la différence principalement dans les trois aspects suivants:

Une autre façon d'extraction de caractéristiques. Lors de la construction d'un système de reconnaissance traditionnelle, vous devez extraire manuellement a été identifié comme un des experts de l'industrie efficaces variété de fonctionnalités et d'applications fonctionnalité algorithme fusion fonctions redondantes d'exclusion du montant, de sorte que la fonction de formation de classificateur, et les tentatives de réseau de neurones de convolution à l'apprentissage des données caractéristiques, peut réduire considérablement le coût de la fonction de découverte. De plus, convolution réseau de neurones apprentissage de grandes quantités de données sur les caractéristiques du prochain environnement du champ de bataille de la mer par le bruit, l'ombrage et l'échelle, le changement d'attitude de perturbation de l'image est plus robuste.

D'autre part, différentes quantités de volume de données de formation et de la diversité de la dépendance. Avec l'augmentation de la quantité de données de celui-ci, la performance d'un système d'identification classique facilement saturé, les performances du système de reconnaissance basé sur la profondeur de la technologie d'apprentissage peut continuer à améliorer. De plus, les techniques d'enseignement supérieur fondé sur la reconnaissance de la profondeur de la diversité des besoins de données, l'attitude différentes échelles du même type de cible et l'autre plus l'image interférences, le get modèle de formation plus robuste.

Exécution de différence de temps Troisièmement, le système est grand. Les systèmes de reconnaissance traditionnels formés modèle de classification rapide, mais pour prédire l'extraction de données de ligne fonctionnalités impliquent souvent la transformation d'images complexes, en temps réel des données en ligne est difficile de garantir prévisible, il y a trop de système d'identification des technologies de l'apprentissage en profondeur sur la base des paramètres doivent apprendre, prendre formation longue, mais le modèle complet de formation implique seulement quatre opérations simples dans l'extraction des caractéristiques, peut assurer en temps réel sur la tâche de prédiction.

2.2 Cibles comparatives de l'étude sur la base de la profondeur de reconnaissance

Sur la base de la détection de cible, y compris l'apprentissage de la profondeur modèle de la série R-CNN en fonction des recommandations régionales et modèle par régression YOLO. Ces deux types de techniques de détection d'usage courant est un réseau de neurones convolution comme extracteur de caractéristiques, mais de différentes manières de résoudre la détection cible. modèle de la série R-CNN en fonction des recommandations régionales sera donnée en présence de problèmes de détection de cibles dans les zones cibles et d'identifier la classe cible possible toute la région des recommandations et basé sur le modèle de régression YOLO converti problème de régression de détection de cible, exécutez une CNN directe obtenir tout l'emplacement cible, appartient à la catégorie et la probabilité de confiance correspondant. Ainsi, par rapport au modèle de régression sur la base YOLO, modèle de la série R-CNN sur la base de la région cible a suggéré un taux de détection plus élevé dans l'application pratique, un positionnement plus précis (en particulier pour les petites cibles), mais la détection plus lente.

À l'heure actuelle, basée sur la détection de la cible et la technologie de reconnaissance étude approfondie du développement rapide, mais encore au stade de la recherche, pas beaucoup d'application pratique. La construction de HU vont bien dans le cadre R-CNN plus rapide qu'une couche de réseau de neurones convolutionnel 3 et 4 types de largeurs différentes images SAR environnement marin pour tester le bruit, obtenu un meilleur résultat de la détection, par Zhou Qi l'intégration des fonctions de bas niveau et les caractéristiques abstraites proposé un nouveau modèle de réseau YOLO variantes obtenir une détection en temps réel d'un navire en mouvement.

conclusion

En raison de données d'étiquette méga-bande tels IMAGEnet, les réseaux de neurones de convolution à briller dans le champ de vision d'ordinateur, on peut dire que l'apprentissage en profondeur est une technologie axée sur les données. Pour l'instant, l'application pratique d'un manque d'un grand nombre de données étiquetées, les algorithmes traditionnels au fil du temps continuera d'être la principale méthode de reconnaissance des cibles d'image navale de Champ de bataille, mais l'application des technologies d'apprentissage dans la profondeur de la mer de l'image sur le terrain tendance cible de reconnaissance a été plus la plus évidente.

On peut prévoir à travers différents canaux pour recueillir des données réelles et l'annotation, l'amélioration et les données de recherche peuvent migrer vers la mer pour trouver le modèle de reconnaissance cible d'image sur le terrain devrait être l'objet de travaux futurs. En outre, une combinaison d'extraction de caractéristiques manuelle et abstraite classique extraction de caractéristiques CNN pour la classification, la classification en utilisant une forte capacité de fonction dimensionnelle CNN SVM pour classer les caractéristiques extraites, été montré pour améliorer la précision de l'identification, l'avenir devrait être direction de la recherche. Enfin, l'image du système d'identification cible de champ de bataille de la mer pour la détection cible rapide et précise et de reconnaissance ont des exigences plus élevées, donc la formation peut être basée sur la technologie d'identification de bout en réseau sera la vague de la recherche future.

Source: Contrôle Commande et simulation

(Cet article est une réimpression ou d'un réseau extrait, appartient à l'auteur original ou publié dans les médias du tout. Comme travaux sur des questions de droit d'auteur, s'il vous plaît nous traitons le contact.)

C Lo: Je ne déteste pas Messi, mon préféré est l'homme appelé Marcelo!
Précédent
Ou ouvrir quelques années ou de couverture, couverture en haute auto-SUV est-il!
Prochain
Football orangistes gagner gros café ont été évalués: en vie est difficile, pour l'avance de rêve!
Impliquant des millions de dollars! Le gang a été démantelé la police du Jiangxi Shicheng
300 villages visités et enfin prendre cette photo, vous avez certainement pas vu!
Nouvelles | armée américaine a publié le rapport annuel 2018 d'essais opérationnels et d'évaluation
Orgueil et complot en vue de jouer, comment l'eau Deep Silver Zhuhai Lung?
Rolls-Royce a également hors du SUV, pas trop cher, pas ensemble?
Il conscience Ann? Démineur héros blessure de gaze fendus, des hommes d'affaires sans scrupules osent commencent spoof!
Excelsior! Père de la création de héros Marvel, et de créer le monde futur
Cet endroit équitation sur le dos du mouton a été nommé dix pays les plus heureux du monde à vouloir ne pas laisser
Pouces est un pouce de long et fort? GS3, vision SUV Pourquoi pas aussi bon que « Big Brother » se vendent bien?
Laoganma et transféré sur le marché, laisser la vieille dame à droite
Aimez-vous Voyage Je t'aime