Reconnaissance des visages scientifiques hardcore: vu dans la foule à vous, ne pas oublier votre visage

Xiao Bian est une personne intrinsèquement paresseux, mais il est aussi impatient, c'est le plus de services de technologie de plaisir.

Par exemple, il y a dix ans, les gens utilisent encore l'ère de l'argent universel, petit shopping dans la ligne de caisse du magasin, le caissier quand je vois une course quand le changement regard inquiet, et ne voulait, il pourrait aller directement pris les choses personnes. A cette époque, le jeune Xiao Bian Zuanjinquantou rêver de l'avenir doit être un procédé de l'invention ne cherchez pas petit changement.

Plus tard, au coeur du rêve de bourgeon depuis de nombreuses années par d'autres réalisés, déçu Xiao Bian également profiter de leur musique dans. L'utilisation d'un téléphone mobile sera en mesure de balayer la cour à payer plus pratique que l'argent. Dieu sait petites séries peuvent être « paresseux cancer du cancer anxieux + » en retard, au fil du temps, levant son code d'analyse de la main pense effectivement ce genre d'action est très gênant d'entrer un mot de passe. Par conséquent, l'apparition ultérieure de paiement d'empreintes digitales être sauvé petites séries.

Plus tard, même les doigts ne bougent pas, parce qu'il a été une expérience remarquable « brosse paiement visage », avec la main iPhone, je dois dire que Xiao Bian aiment cette fonctionnalité.

Ah, la brosse fera face à payer sauvé d'une petite série d'attente anxieuse longtemps à payer et l'anxiété de la science et de la technologie dans l'atmosphère de la maison de sorte que le service de la rédaction de l'informatique dans pendage de la prostitution après de nombreuses années, Xiao Bian a ressenti le besoin de tout le monde à parler. " brosse le visage « à la fin est ce que, l'on peut appeler Gratitude!

« Visage brosse », comme son nom l'indique, est une technologie clé derrière: reconnaissance faciale.

Ne regardez pas les deux dernières années en raison de l'utilisation sur les téléphones intelligents et chaud, en fait, les dates de recherche en technologie de reconnaissance des visages dans les années 1950 premiers, quand les scientifiques ont étudié la méthode d'extraction du contour du visage, mais limité la technologie, la recherche de cette technologie a stagné jusque dans les années 1980, la méthode de reconnaissance du visage ont une nouvelle percée, neurophysiologie, la neurologie, visuelle et d'autres connaissances connexes est introduit dans une nouvelle reconnaissance faciale stade de développement.

Par conséquent, la phase actuelle de reconnaissance faciale n'est pas une seule technologie, mais la convergence de plusieurs disciplines technologiques neurophysiologie, la neurologie et la vision par ordinateur. Cependant, il est essentiellement une technologie de vision par ordinateur.

Bien sûr, il maisons ne font pas l'objet de cet examen de l'article de la reconnaissance de l'histoire, mais parler à tout le monde quelques-uns des principes de base de la reconnaissance faciale.

L'architecture logique de base d'un système de reconnaissance faciale

Chaque jour, nous utilisons la technologie de reconnaissance faciale pour déverrouiller les paiements de factures de téléphone, est si naturel, mais très peu d'étudiants à penser croire profondément que la technologie derrière la façon dont un processus.

Mais nous avons dit, la vision par ordinateur est la technologie de reconnaissance de relation la plus étroite. Nous commençons donc à partir de ce moment-là.

Computer Vision, est familièrement l'utilisation de caméras vidéo, au lieu de l'oeil humain, d'acquérir des images en utilisant le traitement de l'information d'image de l'ordinateur, le modèle cognitif humain intégré est utilisé pour calculer la théorie de la vision humaine.

Parmi ceux-ci, sans doute le plus difficile est de savoir comment traiter l'information d'image, comment simuler le modèle cognitif humain.

Pour résoudre ces problèmes, la vision par ordinateur présente également le traitement d'images, la connaissance de la reconnaissance des formes, la compréhension de l'image, la génération d'images et d'autres disciplines.

Le traitement d'image est de convertir une image originale dans l'ordinateur d'image plus facile à identifier, la reconnaissance des formes, est l'ordinateur détermine son propre à identifier quoi et processus comment l'identification, la compréhension de l'image, est l'image d'une scène décrite analyse, la génération d'images, par exemple quand il fait partie de l'information d'image est manquante, l'information manquante peut être jusqu'à ......

Ce sont la nécessité d'utiliser les disciplines technologiques de vision par ordinateur. Ce que nous voulons mettre l'accent sur parler de la reconnaissance des formes, il est un système théorique indépendant, spécifique à l'application de la vision par ordinateur qui représente l'ordinateur à partir d'images et catégories processus d'appariement cohérent.

Est-il pas un peu à comprendre. À la maison pour tout le monde pour expliquer le populaire, que l'on appelle « l'identification » est d'abord reconnaître et identifier. Qu'est-ce que l'intelligence? J'appréciera que les caractéristiques de l'image à partir de l'image en additionnant l'objet cible. Comment identifier? La fonction se résume et ils ont maîtrisé la base de signatures de comparaison, avant d'activer la discrimination.

Nous, les humains reconnaissent le même objet est de suivre cette logique, le premier résumé de fonction, puis comparée. Quant à l'avant du « modèle », un peu abstrait, vous pouvez être compris comme une loi qui affecte les résultats des caractéristiques et types d'alignements.

Oui, cela est l'essence même du processus de reconnaissance.

Nous sommes donc penser le long de la reconnaissance des formes, un regard sur son processus global: prétraitement, respectivement, l'extraction de caractéristiques et de classification. Nous puisons l'organigramme suivant:

Prétraitement est la première étape, mais cette partie du travail peut être beaucoup de très complexe, par exemple, pour réduire le bruit dans l'image, afin d'améliorer la clarté, incluant également le filtrage de l'image, la conversion, transcoder, conversion analogique-numérique et similaires.

L'extraction de caractéristiques, dans une image prétraitée qui est extrait pour identifier un effet significatif sur les caractéristiques, et de réduire la dimension des caractéristiques de modèle dans ce processus, pour le rendre facile à manipuler. Ceci est un processus complexe, en arrière quand nous avons parlé de la méthode spécifique reflètera;

Le classement est sur les valeurs de caractéristiques extraites sont classées en fonction de certains critères, afin de faciliter la prise de décision.

Par exemple, l'ordinateur pour identifier l'homme sur cette photo, quand il a les photos, vous pouvez sentir l'écran est trop sombre, la première luminosité de mention, puis constaté que trop de bruit, puis faites un repas de bruit de fonctionnement ...... après le sentir, mettre la photo en informations numériques, le processus est pré-traitement.

Extrait valeur de caractéristique dans l'espace de fonction dans l'individu, car il peut faire mieux identifier et classer. Ensuite, il est nécessaire que l'espace de représentation dans la classification des données, et les laisser aller les yeux des yeux, du nez propriété nez, les cheveux, les cheveux ...... aller en fonction de ces bons de classification des données, l'ordinateur peut identifier des jugements et des décisions.

Bien sûr, afin de faciliter la compréhension de ce processus logique, il est juste un exemple description sommaire maison ici peut ne pas être précis, des mesures concrètes est assez complexe, mais aussi envisager une variété d'interférences facteurs, par exemple, la qualité d'image n'est pas clair, fond distribution complexe, irrégulière de l'image d'éclairage, l'angle de posture cible est déformé ou le port du casque et des lunettes barbe Zhang, le maquillage et analogues dans chaque cas.

A noter aussi est que ce système de reconnaissance des formes est la nécessité d'une auto-formation, le processus d'apprentissage, le plus important est la formation du taux d'erreur de classification précédente (formation classificateur), parce que dans la classification précédente, nous ne peut garantir les résultats de la classification est 100% correct, mais il doit être contrôlé à une certaine classe de taux d'erreur, qui doit être constamment révisée par un grand nombre d'échantillons de formation, de sorte que le taux d'erreur pour répondre aux exigences.

Eh bien, sur la base de la discussion ci-dessus de la vision informatique, la reconnaissance des formes, la reconnaissance des visages que nous pouvons donner au système les modules principaux de fonction:

Il peut y avoir de petits partenaires estiment que mentionné ci-dessus dispose ce module trop facile, nous allons donc être précis, étant donné le tableau logique ci-dessous, je crois que c'est facile à comprendre:

Procédé de reconnaissance de généraliste

Dans une partie de ce qui précède, nous présentons le flux logique de base de la reconnaissance faciale, la reconnaissance du visage est en fait l'idée de base est relativement similaire, est de couvrir l'extraction de caractéristiques d'image, la conversion à un sous-espace approprié, puis ce sous-espace mesure de similarité ou d'apprentissage de classification. Mais le problème est de savoir comment harmoniser l'utilisation du monde objectif et une représentation efficace? Nous voulons savoir comment subspatial approprié, comment classer, afin de faire la distinction entre les différentes classes, réunis catégorie similaire? Pour résoudre ces problèmes, donné naissance à une variété de méthodes et de solutions.

Nous parlons donc de technologie générale de reconnaissance faciale est, en fait, c'est une collection d'un grand nombre de techniques et méthodes.

Nous pourrions aussi bien sur la base ci-dessus la structure logique des instructions étape par étape.

1, le prétraitement

image faciale pré-traitement, cette étape est pas grand chose à dire, y compris l'élimination du bruit, la normalisation gris, correction géométrique, ces opérations sont généralement facilement disponibles algorithme peut être mis en uvre, les opérations relativement simples. Mais pour montrer que cela est parle surtout de pré-traitement de l'image du visage statique, si elle est pré-traitement de l'image face dynamique, est plus compliquée, habituellement première image du visage dynamique dans un ensemble de l'image du visage statique et puis bord détection de visage humain et le lieu, faire une série de traitement ici est pas commencé.

2, l'extraction de caractéristiques

extraction de caractéristiques de l'image est plus critique étape (mentionné ci-dessus à travers le motif spatial de l'espace de caractéristiques), mais l'étape de traitement d'image est également relativement précoce. Il existe actuellement sur les méthodes d'extraction de caractéristiques d'image sont nombreux, mais en fait, nous pensons aux caractéristiques générales de l'image peuvent encore être classés, tels que la couleur, les caractéristiques de texture, les relations disposent d'espace, la forme et d'autres caractéristiques, chaque fonction a les méthodes d'appariement, dont certains sont plus classiques, faciles à utiliser des méthodes telles que HOG propose des méthodes, dans laquelle la méthode LBP, dans lequel le procédé Haar, bien sûr, impossible d'expliquer les petites séries, donc ici pour sélectionner une méthode de fonction de --HOG.

fonction HOG, également connu sous l'histogramme de direction de gradient, il est par Navneet Dalal et Bill Triggs présenté dans une thèse de doctorat en 2005. Nous regardons simplement comment il a été fait.

Nous avons cette photo, par exemple, la première étape est que vous voulez transformer en photographies en noir et blanc, couleur d'informations ici en raison de la reconnaissance n'a pas aidé.

Sur cette photo en noir et blanc, on voit du pixel, les pixels observés autour, pour voir dans quelle direction il est progressivement plus sombre, puis indiquer la direction de la flèche avec des pixels noircis.

Si une telle opération effectuée pour chaque pixel, de sorte que tous ces pixels seront remplacés par une flèche qui indique le sens de variation de luminosité des pixels. Chaque flèche indique tel gradient de luminosité.

En fait, pour chaque pixel, le système de coordonnées donné, on peut déterminer la valeur de sa direction de gradient. La méthode de calcul est plus complexe, on n'a pas besoin de savoir, le besoin de connaître cette étape est de capturer les informations de profil de la cible, tout en continuant à affaiblir l'interférence de la lumière.

Si cela est fait de telle manière à extraire, la quantité de calcul sera grande. Par conséquent, nous allons utiliser l'image de pixel 8x8 est divisé en petits carrés, appelée cellule, puis calcule des informations de gradient pour chaque cellule, y compris la taille et la direction du gradient. La résultante vecteur de caractéristique 9 dimensions se trouve dans cette cellule.

Je crois que certaines personnes ici ne comprennent pas. À la maison à nouveau pour les petits partenaires expliquent un peu, en fait, le but de cette étape est de construire un histogramme de direction de gradient pour chaque cellule, l'histogramme est un graphique à barres de notre bien connu, cet histogramme, l'axe X est la direction les sections divisées, Navneet Dalal et al étude 9 représente une section divisée est le meilleur effet, si la direction de 180 °, chaque segment représente de 20 °. axe des ordonnées représente la direction de la grandeur de gradient dans une certaine plage. Cela équivaut aux caractéristiques de chaque descripteur de cellule.

à peu près ce que je veux dire (Source: San Francisco mémoire de traitement d'image, Université de Californie)

Il y a aussi une étape que si votre image est affectée par l'éclairage est relativement important, il peut aussi être certain de la cellule forment un bloc, par exemple, une cellule de 2x2, de sorte que chaque bloc est de 36 dimensions vecteur caractéristique, cette 36 dimensions faire vecteurs de caractéristiques normalisées (plus précisément comment les normes, relatives à la connaissance des mathématiques supérieures, on n'a pas besoin de savoir).

Si la taille de l'image est 256x512 pixels notre entrée, alors il est 32x64 = 2048 Ge Cell, il y a 31x63 = 1953 bloc Ge, chaque bloc a un vecteur 36 dimensions, l'image aura 1953x36 = 70308 vectoriel de dimension. Ce vecteur 70308 dimensions est le vecteur caractéristique HOG de l'image.

Bien sûr, les étapes ci-dessus vous ne pouvez pas savoir, il vous suffit de connaître la forme définitive de l'image originale est représentée HOG est devenu, comme indiqué ci-dessous:

Ensuite, à la base de ce HOG, HOG trouver avec quelques-uns des styles les plus connus, regards partie la plus similaire dans notre bibliothèque.

3, la reconnaissance d'image

Les scientifiques de la technologie de reconnaissance faciale, après des années de recherche et de développement, a formé une variété de méthodes de recherche et de recherche plus, si l'on peigne, y compris la méthode en fonction des caractéristiques géométriques de l'approche basée sur un modèle, ainsi que l'approche basée sur un modèle d'autres méthodes.

La méthode est basée sur les caractéristiques géométriques du stade relativement précoce, la méthode traditionnelle, et il est d'étudier la géométrie des yeux de visage humain pour décrire la forme et de la structure de la relation entre le nez et d'autres organes, comme une caractéristique importante de la reconnaissance faciale.

L'idée de base d'une approche basée sur un modèle est de prendre un modèle existant et de l'image de la même taille de la zone à comparer, y compris la méthode de mise en correspondance de corrélation basée sur la méthode caractéristique du visage, analyse discriminante linéaire, les méthodes de réseau de neurones.

Il est une caractéristique importante du visage en fonction de la direction de l'approche des points caractéristiques du modèle, puis codant pour le visage humain, puis utiliser le processus de reconnaissance faciale modèle correspondant, par exemple, modèles de Markov cachés, et apparence active modèle de forme active des procédés tels que le modèle.

Différents algorithme de reconnaissance faciale

En reconnaissance des visages, il y a quelques algorithmes plus classiques, tels que la Loi sur Eigenface (Eigenface), méthode modèles binaires locale, Fisherface, etc., mais la maison se sentent ici ou encore des temps meilleurs, donc j'ai choisi un cadeau largement utilisé et méthode populaire comme un exemple, il est appelé Openface. Bien sûr, nous ne faisons pas le test réel, juste pour comprendre les principes reconnus par elle.

Openface appartiennent à l'approche basée sur un modèle, il est une bibliothèque open source qui contient un point de repère, pose de la tête, Actionunions, oeil regard et d'autres fonctions, ainsi que la formation et le test cadre open source pour tous les visages humains.

Dans les étapes précédentes, nous avons été à la maison pour vous dire comment extraire les caractéristiques des données d'image de visage humain au moyen de HOG, qui est détecté avec succès visage humain.

Ensuite, il y a un autre problème, qui est la posture du visage humain ne semble pas « positif », le même homme, si sa posture, une orientation différente du visage, l'homme lui reconnaissent encore, mais l'ordinateur ne peut pas reconnaître la .

Résoudre ce problème, il existe un moyen, est la principale caractéristique des points caractéristiques de détection des visages et l'alignement du visage faire un étalonnage en fonction de ces points caractéristiques. C'est Vahid Kazemi et Josephine Sullivan en 2014, la méthode de l'invention, en leur donnant une partie importante de la face sélectionnée 68 points caractéristiques (Repères), dont la position 68 points sont fixés, de sorte que le système n'a besoin que d'une certaine formation, il vous pouvez trouver ce 68 point tout le visage.

Source: API Openface lecture du document (Cliquez ici pour visiter)

Avec ces 68 points, vous pouvez corriger le visage humain, principalement en comparant la transformation affine originale redresser le visage tordu, essayez d'éliminer les erreurs. Ici, la transformation affine principalement une certaine rotation, zoom, ou une légère déformation, plutôt que la déformation exagérée, qui ne peuvent être lus.

sur ce processus, le visage original était un certain degré de correction (Source: Openface page d'aide github)

Nous avons donc mis les images de visage d'origine et HOG entrée fonction de vecteur, peut obtenir une position correcte de l'image ne contient qu'une face humaine.

Notez que cette étape nous pouvons prendre ce directement à l'image du visage de comparaison, parce que la charge de travail est trop grand, nous devons faire est de continuer à des fonctions d'extraction.

Ensuite, nous faisons face à ces images personnelles et entrer dans un système de réseau de neurones, il génère un vecteur 128 dimensions pour le visage, on peut dire que 128 mesures du visage humain, ils peuvent représenter la distance entre les yeux, les yeux et la distance, la taille des oreilles sourcils et ainsi de suite. Voici juste un exemple pour faciliter la compréhension, en fait, cette représentation particulière vecteur 128 dimensions qui présente, nous ne savons pas.

Bien sûr, cette étape semble assez simple, en fait, les mensonges de difficulté dans la façon de former un tel réseau de neurones de convolution. Méthode spécifique de formation n'est pas ce que nous devons savoir, mais nous pouvons regarder l'idée de la formation. La formation que nous pouvons entrer vecteur une image de visage, le vecteur des poses différentes de la même représentation du visage et vecteur autre face de ladite répétée des opérations similaires, et ajuster en permanence, ajuster le but est de faire le même genre de représentation vecteur correspondant le plus près possible, en fait, il est la même personne que la proximité de la représentation vectorielle, l'empathie, les différents types de vecteurs représente la distance dans la mesure du possible. En ce qui concerne les principes de base de l'intelligence artificielle, la formation de réseaux de neurones, vous pouvez voir publiés avant la Chambre des IT « AI ne sont pas des films de science-fiction du fléau, mais lentement changer le mode de vie » dans cet article.

En fait, l'idée de la formation est aussi bien compris, parce que le visage d'une personne, peu importe la façon dont le changement d'attitude, au fil du temps certaines choses sont fixes, telles que la distance entre les yeux, la taille de l'oreille, la longueur du nez.

Après avoir obtenu ces 128 mesures, la dernière étape est simple, qui est, ces 128 mesures et notre formation, toutes les données de visage testées ont comparaison, les valeurs mesurées les plus proches, est l'homme que nous voulons reconnaître .

De cette façon, nous pouvons reconnaître un visage humain.

résumé

La technologie de reconnaissance de visage après 70 ans de développement, aujourd'hui a mis au point dans une des disciplines techniques complètes de vision informatique pour le centre de traitement de l'information numérique, qui combine la science de l'information de sécurité, la linguistique, la neurologie, la physique, l'IA et d'autres sujets de rapports , a des connotations riches, et le développement rapide. La maison dans l'article tente d'expliquer à vous, mais la reconnaissance la plus fondamentale et populaire du principe et l'analyse de cas d'utilisation relativement simple, couvrir ne peut évidemment pas tout le contenu de la reconnaissance faciale, en espérant que tout le monde comprenne, savent maintenant nous sommes devenus habitués à utiliser la reconnaissance faciale caractéristiques de l'aide.

Gen Insights firme de recherche internationale données publiées du marché montrent que d'ici la fin de 2025, la valeur de marché des appareils de reconnaissance mondiale face atteindra 7,17 milliards $, les téléphones intelligents sont largement utilisés la technologie de reconnaissance des visages, tout comme nous comprenons la technologie offre une occasion à l'avenir, avec l'avènement de l'ère Internet 5G toutes choses, marché du matériel intelligents seront considérablement élargis, qui est la véritable technologie de reconnaissance faciale pour montrer ses preuves dans le monde.

Ah, oui, je me réjouis de l'arrivée précoce de ce jour et de l'âge, à l'époque où Zhangsheng Shi Xiao Bian beauté enfin faire quelque chose de significatif, et les parents aussi considérés comme vivants bienfaisance.

Cette référence:

Shen Li, Liu Yiguang, Zhi-Yong Xiong, 16.11.2015, "et algorithme de reconnaissance de visage Principe: Système de reconnaissance de visage dynamique"

CSU985, RPSC, 06.10.2018, "Récapitulatif de l'extraction de caractéristiques d'image"

retardé artificiel v, Jane livres, 30.07.2018, « dispose d'HOG - Reconnaissance des piétons »

laolaonuonuo, RPSC, 10/03/2018, « le principal algorithme de reconnaissance faciale »

Big Data v, RPSC, 23/08/2018, « la profondeur des marchandises sèches! La technologie de reconnaissance faciale pour lire l'article (collection recommandé) "

leon1741, RPSC, 02/08/2018, « dans le principe de la reconnaissance de la langue profane »

zouxy09, RPSC, 25.04.2015 « Procédé de reconnaissance de caractéristique faciale (Eigenface) »

RPSC technologie R & D, RPSC, 26.01.2018, « pour voir comment Openface obtenir une reconnaissance précise du visage. »

Pékin ouvert « mode beauté haute définition » ciel bleu Summer Palace Image,
Précédent
SanDisk Version tranquillement classé 2 To Extreme PRO Solid State Drive
Prochain
190622 été rafraîchissant microblogging mise à jour studio Chen Linong petit ami agricole vraiment séduisant ~
Japon massivement dans l'achat de la formation d'avions Osprey à rotors basculants ne peuvent rares apparitions aux États-Unis
Pourquoi les programmeurs devraient éviter les codes indirects?
Stephanie Shirley: 60 que le secteur de la technologie des femmes du siècle dernier | Portraits
AMP appliquée outils, les développeurs veulent « interdiction » Google
« Antidrogue 2 » chanson thème « Brothers ne doute pas » premier refrain Andy Louis Koo
JavaScript programmation fonctionnelle et la programmation orientée objet la différence entre ce que?
Cette technologie de casque noir pratique et élégant, pas peur assis écouter de la musique
5G vague de grèves! Quelles sont les possibilités de sortie de programmeurs?
190622 Cai Xu Kun est apparu l'aéroport de Pékin étoiles mignon de rêves ressembler à un deuxième période
les fabricants nationaux de téléphonie mobile dans les premiers cercles brillent la moitié de ces nouveaux gadgets (bas)
« TFBOYS » « Partager » 190622 mince ou petite main de viande chacun amour Wangjun Kai