images vidéo de groupe de recherche adaptative et la reconstruction de super-résolution

Yang Haili, Huang Hongqiong

(College of Engineering Information, Université maritime de Shanghai, Shanghai 201306, Chine)

: En raison des changements rapides de la scène vidéo, une erreur d'enregistrement, le bruit, la résolution inférieur au nombre d'images et d'autres raisons, va effectuer sur la base reconstruite image vidéo de format conventionnel paquet fixe conscient compression du codec vidéo est pauvre, et aussi la reconstruction de super-résolution semble problème mal posé. Pour résoudre ces problèmes, l'article propose un paquet codec vidéo basé sur l'image de trame compressée d'adaptation est perçue, alors que la méthode de calcul du coefficient de régularisation temporelle adaptative courbe L algorithmes de reconstruction de super-résolution, peut être adaptativement coefficients normalisés calculés. Les résultats expérimentaux montrent que l'algorithme peut résoudre les problèmes décrits ci-dessus pour reconstruire l'effet visuel d'une bonne image de l'image vidéo.

: La compression de détection, l'image de trame de paquet vidéo adaptatif; reconstruction de super-résolution; régularisation temporelle adaptative; courbe de L

: TP391.9 Code du document: ADOI: 10,19358 / j.issn.1674-7720.2017.09.015

Format de référence : Yanghai Li, l'adaptabilité Huang Hongqiong des images vidéo à partir des paquets et la reconstruction de super-résolution [J] SES APPLICATIONS, 2017,36 (9): 49-52.

0 introduction

* Projet Fonds: la Fondation nationale des sciences naturelles de Chine (61673260)

Avec l'amélioration de la vie spirituelle des besoins humains, un certain nombre d'images numériques de haute qualité, la vidéo est devenue un élément indispensable de la vie, si dans le traitement de ces images contiennent de grandes quantités de données d'information vidéo numérique, suivez toujours la loi à l'échantillonnage Nyquist il y aura des inconvénients du nombre excessif d'échantillons, mais aussi apporter beaucoup de mal pour le stockage et la transmission des informations. la théorie de la perception proposée comprimée devenir un fil conducteur pour résoudre ce problème. Candes a pris les devants dans le domaine des mathématiques raisonnant conclusions [1] peut reconstituer avec précision le signal d'origine à partir des coefficients de transformée de Fourier partielle, la conclusion de l'argument au signal reconstruit fournit une nouvelle façon de penser. Et puis par l'approfondissement de l'étude, les concepts et les théories de détection de compression ont été formellement proposé, qui est l'essence de la théorie est que la combinaison unique comprimé de la théorie et de la théorie de l'échantillonnage. Est plus simplement le signal d'origine est échantillonné directement dans le processus d'échantillonnage, mais l'acquisition des mesures de projection linéaire non-adaptatifs, puis reconstruite à partir des valeurs mesurées avec l'algorithme de reconstruction du signal d'origine correspondant [2]. Mesurer la quantité de signal de la théorie de la compression de données de projection acquises par rapport à l'échantillonnage classique beaucoup moins, compenser les lacunes de l'échantillonnage de Nyquist se produit Law nombre excessif d'échantillons dans un traitement d'image vidéo numérique, le signal à haute résolution de telle sorte que acquisition rendue possible par les avantages exceptionnels posés la théorie de détection de compression dans une position importante dans le domaine de la technologie de traitement vidéo [3].

la technologie vidéo et le développement rapide de nouvelles applications vidéo basé sur le codec vidéo traditionnel et la perception de la compresse la reconstruction ne sont plus pleinement applicables, certaines améliorations méthode traditionnelle est également confronté à des défis énormes. Par exemple, dans le système de surveillance de la sécurité, lorsqu'un accident se produit, la nécessité d'une reconstruction vidéo de surveillance de super-résolution, fournissant ainsi des indices importants pour les événements de la poignée, le signal général de télévision basse définition du format NTSC

Converti en signal de télévision haute définition (appelée HDTV), afin d'obtenir une meilleure qualité d'image. Sur cette base, le regroupement d'images vidéo inter-cadre et la reconstruction de super-résolution adaptative des deux aspects d'une étude visant à améliorer la qualité de l'image de l'image vidéo reconstruite.

Etude adaptative 1 images vidéo et des paquets de reconstruction de super-résolution

1.1 trame de paquets adaptative codecs vidéo d'image

[4] d'abord proposé codec vidéo sur la base de détection de compression, qui est basée sur l'image entière de l'image vidéo devant être traité cardinalité minimale, et la détection en utilisant la compression réduit considérablement la théorie nécessaire pour le nombre d'échantillons d'image reconstruits vidéo, la complexité des opérations est optimisée. Document [56] a proposé un dispositif de détection comprimé vidéo distribué (Distributed compressé de détection vidéo) théorique, en mesurant le taux de diminution du cadre de référence pour améliorer le système global codec peut être largement utilisé dans le réseau de capteurs sans fil ou d'un réseau omniprésent. L'image de trame codec vidéo sur la base de détection comprimé dans la session de paquet vidéo, essentiellement divisé en chaque groupe dans l'ordre, et le nombre de trames vidéo dans chaque groupe est le même. Cette approche appliquée en l'absence d'évolution rapide des scènes effet de reconstruction vidéo est meilleure [78], l'évolution rapide des scénarios devrait la vidéo est apparue soudainement dans la trame suivante, toujours en utilisant cette approche, l'effet est très pauvres. Sur la base de ce qui précède, nous vous proposons une scène vidéo peut être adaptée à un changement rapide dans le codec vidéo d'adaptation inter-paquets.

Proposé d'adapter à des scènes vidéo évolution rapide semblent conception codec adaptatif vidéo inter-paquet a deux axes principaux, d'abord il est de savoir comment déterminer si la scène vidéo change rapidement, et comment parvenir à une telle situation est différente pour formes traditionnelles de paquet. Pour toute question sur la façon de déterminer si la scène vidéo en évolution rapide, approche adoptée dans ce document est le premier traitement d'images vidéo pour la définition de cette étape, la décision de seuil. La valeur de seuil est utilisée ici pour déterminer les différences dans la trame courante et la trame de référence, afin d'identifier les paramètres de PSNR sélectionnés de chaque image de trame des différences de taille. Contrairement à la manière traditionnelle pour un paquet adaptatif suivant le paquet. Tout d'abord, la première trame de la trame vidéo de la première clé de groupe par défaut, alors la seconde trame à partir du début de la trame courante et une image de différence trame supra à titre de comparaison, à savoir, une décision de valeur de seuil. Si le coefficient de variation entre la trame courante et la trame de référence est inférieure à une valeur de seuil établie, la trame courante avec la trame courante est classée comme une clé de groupe, et les trames non clés de la trame courante est défini comme le groupe, si la différence entre la trame courante et la trame de référence le coefficient de variation est supérieure ou égale à la valeur de seuil, vous devrez redéfinir un groupe et définir le cadre est un cadre clé d'un nouveau paquet. Cela peut entraîner l'image image vidéo paquet adaptatif, chaque trame est pas fixe, mais peut être une scène vidéo avec la planification automatique de leur état de chaque cadre.

Capable d'adapter à un changement rapide du processus de mise en uvre de codec adaptatif scène vidéo vidéo inter-paquet représenté sur la figure 1.

organigramme détaillé d'une procédure de mise en uvre est décrite ci-dessous:

Un premier cadre (1) est définie comme la première trame vidéo clé dans key1 Groupe 1;

(2) La valeur de seuil principe de jugement et l'ensemble principe ci-dessus paquets adaptative de chaque trame vidéo en N groupes (Groupe 1, Groupe 2, ..., Groupe N) et n correspond à un nombre de trames clés et des trames non clés;

(3) le traitement de l'image entière est une image de trame clé CS codage, la transmission, le décodage, puis reconstituer la sortie de l'image clé de trame par l'algorithme adaptatif de reconstruction de super-résolution;

Où (4) pour la trame non critique est différente de l'image clé doit d'abord déterminer si une image résiduelle (l'image de trame non-clé et l'image de trame d'image de référence obtenus à une demande résiduelle), alors l'image de l'étape ( traitement 3) dans les mêmes images clés. Enfin reconstruit besoins d'image résiduelles à traiter et l'image du cadre de référence sont ajoutés pour compléter la sortie d'image de trame.

Adaptive recherche 1.2 vidéo reconstruction super-résolution

méthode de domaine spatial a une plus grande valeur de la recherche et de l'application dans l'espace de la reconstruction de la vidéo super-résolution, et de devenir ainsi l'objet de recherches dans ce domaine. Procédé de projection arrière itératif [9], la méthode de projection des ensembles convexes (POCS) [10], un procédé maximal a posteriori (MAP) [11] et d'autres plus classiques, ces dernières années, les résultats de la recherche. Bien que ces algorithmes typiques ont largement amélioré l'effet de reconstruction vidéo, mais la plupart d'entre eux ne sont en mesure d'ignorer beaucoup de la situation réelle dans l'état idéal à atteindre. Dans le processus de reconstruction de super-résolution réelle généralement sujette à l'amplification du bruit, l'espace sonnant problèmes morbides affectent gravement la qualité de la reconstruction de l'image, afin d'éviter la situation de la solution générale est prise uniquement à partir du domaine spatial pour commencer par régulière la façon d'améliorer la qualité de la reconstruction. Envisagé ici entre l'image vidéo de trame sont présents simultanément dans l'espace et le temps, ils doivent être associés à la présence à la fois dans l'espace et le temps, de sorte que le joint mis opérateur de régularisation temporelle est introduite dans l'algorithme d'améliorer la qualité de la solution. En même temps, présente une méthode de calcul L-courbe peut calcule le facteur le plus adaptative de régularisation temporelle appropriée, afin d'améliorer la qualité vidéo de la reconstruction d'image super-résolution.

Dans le processus de reconstruction de super-résolution, pour lutter contre l'impact négatif de facteurs externes tels que les besoins de la fonction pénalité de bruit à ajouter, cette solution sera appelée régularisation. La reconstruction de super-résolution avec une fonction de pénalité comme indiqué dans la formule (1):

X = {argxmin AX-Y2 + X2} (1)

Dans lequel, AX-Y2 est un terme allant avec les données, X2 pour le terme de régularisation peut être contrôlée perturbation Solution [12]. est le facteur de régularisation, la valeur de est augmentée, la finesse de l'image reconstruite sera augmente, de sorte que le manque de l'information d'image originale fournie, affectée par le bruit et d'autres circonstances défavorables, être approprié d'augmenter la valeur de . Cependant, l'image est trop lisse une autre distorsion, en raison de la finesse de l'image reconstruite et les valeurs de a montré qu'une corrélation positive, ce n'est pas la valeur de peut choisir l'infini, mais il faut trouver le plus approprié de prendre valeur pour obtenir les meilleurs résultats de la reconstruction [12].

Combiné à un opérateur de régularisation spatio-temporelle, telles que la reconstruction de super-résolution de formule (2):

X = argxmin (Y-AX22 + X1) (2)

Cette fonction objectif, tandis que l'introduction de L1, L2 norme, norme L2 est d'abord utilisée pour améliorer la fidélité des données reconstituées; norme Ll du second gradient qui permet d'améliorer le domaine de parcimonie [9]. Lequel l'opérateur de régularisation temporelle combinée suit:

Ici, SLX1, SMX2, Stt X est une vidéo de x1, x2, en direction de t, respectivement, l, m, t pixels translation opérateur.

La formule (1) peut être réalisée dans X pour AX-Y2 sur la mise à l'échelle lg-lg, à la fois motif résultant exactement la courbe de conversion de L, et est une variation du facteur de régularisation le long de cette courbe. La présence de L-courbe en deux parties horizontale et verticale, la valeur du point d'inflexion des espaces de séparation des deux parties qui apparaissent correspondent exactement par régularisation et moins la valeur de seuil de régularisation [10], ce qui correspond donc à un point d'inflexion de la valeur de coefficient de régularisation de elle est la plus appropriée la valeur *. La plus grande valeur appropriée de la formule est défini comme suit:

Des mesures spécifiques de l'algorithme est:

(1) nécessaire à la reconstruction fournie nombre de trames vidéo à faible résolution i (i = 1,2, ...,), en même temps, à tous les numéros d'images à haute résolution j (j = i, i + 1, ..., i + n);

(2) la séquence d'images vidéo à basse résolution du vecteur de configuration d'origine en Y, une configuration de matrice creuse;

(3) configuré matrice de régularisation Gamma];

(4) calculée à partir de Y, A, i courant positif le plus approprié correspondant au coefficient , le Y calculé, A, , et [lambda] est remplacé dans la formule (2) obtenu Xi;

(5) i = i + 1, en répétant les étapes (2) à (4). Lorsque i = nombre (nombre de trames de la séquence vidéo d'entrée à basse résolution d'origine) est arrêté, pour obtenir la vidéo reconstruite à haute résolution.

Simulation et analyse expérimentale

Afin de prouver la faisabilité de l'algorithme proposé, l'utilisation de la séquence « garde-côtes » en plein air moniteurs vidéo bateaux enregistrés et patrouille dans l'eau expérience en cours d'exécution rapide. Dans l'expérience, une série de pixels d'une image de trame vidéo complète de 352 x 288, tandis que la mesure de matrice SBHE est une matrice de 32 x 32, en utilisant le groupe de DWT-yl transformation clairsemée.

Dans la trame vidéo est fixée, chaque trame est complètement motif de regroupement identique, une séquence de trames vidéo afin d'en tirer un ensemble de toutes les 10 trames, et seule la première trame de chaque groupe est une trame de clé prédéterminé. mesure d'images clés a été de 0,5, 0,2 a été mesurée trames non clés, qui reconstruisent la GPSR manière traditionnelle, et le mode nommé (F_GPSR). Les paquets en mode adaptatif, la valeur de seuil T = 28, et le nombre variable de trames sont regroupées selon les principes ci-dessus paquets adaptative, le réglage de l'image clé a été mesurée 0,5, 0,2 a été mesurée trames non clés, de façon reconstitué l courbe adaptative basée présenté ici procédé de reconstruction de super-résolution, le mode est appelé (proposé). Dans lequel L est prise résolution de la courbe des images résultantes montrent une trame vidéo 26 comme représenté sur la figure contraste, le modèle proposé d'utiliser l'image de trame vidéo reconstruite comme représenté sur la Fig.

Peut être visuellement vu de la figure 2 se déplaçant à une situation de patrouille rapides, ce qui dans le cadre de la vidéo en mode proposée reconstruit la qualité d'image est bien supérieure à l'image vidéo de qualité d'image reconstruite obtenue en mode F_GPSR, alors que. La figure 3 la trame vidéo la plus appropriée obtenue lorsque le facteur de régularisation de reconstruction d'image * 0,00090608.

Pour mettre en évidence les avantages de l'algorithme proposé d'utiliser le clairsemée trois algorithme de reconstruction signal connu GPSR, torsade et OMP, et à fixer l'image en utilisant une image vidéo encodeur vidéo de paquets, en combinaison avec l'algorithme adaptatif proposé (proposé) puis l'expérience comparative suivante.

Les images vidéo sont définies MR = 30%, la performance des algorithmes présentés dans le tableau 1. comparative. Le tableau, on peut observer dans le cas où le même MR image vidéo, l'algorithme proposé proposé dans le présent document que trois autres algorithmes avec d'excellentes performances en moyenne et le temps de reconstitution moyenne de performance PSNR.

La séquence vidéo reconstruite chaque moyen de performance de l'algorithme PSNR de l'image représentée sur la figure 4. Dans chacun de la condition de valeur de MR. Comme on peut le voir d'après la figure 4, le rendement PSNR de l'algorithme adaptatif présenté ici incorporé évidemment supérieur à trois algorithme de reconstruction connu sous la forme d'une image de trame vidéo est fixé paquet. En particulier, dans le cas d'un faible MR, autre algorithme proposé que l'algorithme peut être mis en uvre de meilleures performances. Chaque algorithme de reconstruction de temps moyen (en secondes) par rapport à 5 chaque trame, peut être visuellement vu, le temps moyen nécessaire algorithme de reconstruction proposée pour chaque trame d'image est courte, Description de l'algorithme par rapport aux trois algorithme de reconstruction traditionnelle a une reconstruction de moindre complexité.

Des données complètes dans le tableau 1 et les figures. 2 à 5 résultats observés, l'algorithme proposé proposé dans cette étude dans le processus de reconstruction d'une séquence d'images vidéo basse résolution se produisent sur la scène en évolution rapide, que ce soit dans l'image reconstruite effets visuels, lourds performances PSNR ou la complexité de la configuration de la reconstruction sont beaucoup mieux que l'algorithme classique de reconstruction dans un mode paquet fixe classique.

3 Conclusion

L'algorithme proposé pour que le paquet vidéo et de l'état de reconstruction de super-résolution image de cadre ont réalisé leur vidéo originale peut être optimisée en fonction de façon adaptative la fonction de traitement souhaitée. Et démontré par l'expérience en utilisant cet algorithme adaptatif de traitement de reconstruction de paquets en combinaison peut résoudre efficacement les pauvres depuis le changement de scène facteurs externes rapidement et défavorables comme la reconstruction de l'image de l'image vidéo et les effets pathologiques de la reconstruction de super-résolution problème, de sorte que l'image de l'image vidéo dans des environnements difficiles inévitables obtenir un bon effet de reconstruction, mais aussi dans la reconstruction vidéo performance PSNR et de la complexité de la reconstruction a également d'excellentes performances. Seuil de la valeur optimale de l'algorithme prise après des expériences répétées et obtenu les recherches suivantes la meilleure valeur de ce seuil pour le paquet d'image vidéo adaptative.

références

[1] CANDES E, J ROMBERG, TAO T.Robust principes d'incertitude: la reconstruction exacte du signal d'information de fréquence très incomplète [J] IEEE Transactions on Information Theory, 2006,52 (2) :. 489-509.

[2] Donoho D L.Compressed détection [J] .IEEE Transactions on Information Theory, 2006,52 (4): 1289-1306.

[3]. STANKOVIC V, L STANKOVIC, CHENG S. échantillonnage vidéo compression [C] .proc 16 IEEE Conférence internationale sur le traitement de l'image Pologne :. IEEE Press, 2009: 30013004.

[4] XIF X, Z LU, LAI Z.Fast de codage vidéo basé sur la détection à la compression [C] .PROC YCICT'09.Beijing :. IEEE Press, 2009: 114-117.

. [5] DO T T, CHEN Y, NGUYEN D T, et al Distributed détection vidéo compressé [C] IEEE Conférence internationale sur le traitement de l'image IEEE Xplore 2009: .. 1393-1396.

[6] BAIG Y, LAI E M K, Punchihewa A. codage vidéo distribué basé sur la détection comprimé [C] .PROC ICMEW 2012.Melbourne, VIC :. IEEE Press, 2012: 325-330.

[7] WU M H, X ZHU C.Un code vidéo sur la base de la distribution de détection à la compression [J] .Procedia ingénierie, 2012 (29): 3613-3618.

[8] DONG G, XI Z. Un schéma codec nouvelle vidéo basé sur la détection de compression [J] Journal de l'information et de la science informatique, 2013,10 (14) :. 46814689.

[9] IRANI M, PELEG S. Analyse du mouvement pour l'amélioration de l'image: la résolution, l'occlusion et la transparence [J] Journal de la communication visuelle et la représentation de l'image, 1993, 4 (4) :. 324335.

[10] PATTI AJ, Sezan MI, Tekalp A M. Des méthodes robustes pour des images fixes de highquality de vidéo entrelacée en présence de mouvement dominante [J] IEEE Transactions sur les circuits et systèmes pour la technologie vidéo, 1997, 7 (2) .: 328-342.

[11] BORMAN S, STEVENSON R L. simultanée multiframe amélioration vidéo MAP superresolution utilisant prieurs spatiotemporal [C] Conférence internationale sur le traitement de l'image, 1999. ICIP 99.IEEE 1999 :. 469-473.

[12]. Shang Junguo, Jiao Binliang recherche sur la régularisation de Tikhonov algorithme de reconstruction d'images multitrame [J] Application de la recherche d'ordinateurs, 2011, 28 (2) :. 785-787.

Onze Dapeng: De la « confiance en nous la dernière fois » « confiance spéciale » à | Interview
Précédent
« Meilleure performance » de cette année pour les voir
Prochain
"Dragon Ball Z combat" nouveaux personnages DLC: Ultra Race Dieu Beiji Te guerre
« Agents de carte Trump 2 » entrevue mettant en vedette le chat chaud Egg fait l'éloge voix chantante Ma Qiang aussi belle que les sons de la nature
Analyse comparative | intelligence artificielle non seulement de passer l'examen, mais aussi vous aider à remplir volontaire Gufen
Lettre ouverte de "Stock God" Buffett aux actionnaires : de fortes fluctuations des bénéfices trimestriels sont inévitables
Longue durée de vie de la batterie peut apporter une meilleure expérience avec la machine Grande smartphones batterie recommandée
détection de zone sous-marine d'image multi-échelle basée sur significative
Vous ne pouviez vraiment pas deviner! « Hunter x Hunter » entourant les boucles d'oreilles trop Sculpture de sable
Ne pas manquer! « agents de carte Trump 2 » ou la deuxième moitié du meilleur film à la recherche newbest
Super Malware maintenant Google magasin, Kaspersky pot jeté le personnel de sécurité chinois: ne répondez pas!
moi Cinéma | a attendu si longtemps, il est finalement venu
Lu Han Guan Xiaotong a publié micro-Bo Aite amour, c'est ma petite amie
Appareillage équipement de détection de décharge partielle conçue