la science Profondeur: types et leurs fonctions réseau de neurones

Le texte intégral 3046 Les mots, lorsque l'apprentissage tout au long attendu 9 minute

sources FIG: cent No.

L'apprentissage automatique est une branche de l'intelligence artificielle qui combine les réseaux de neurones pour créer un certain nombre de personnes de logiciels en cours utilisent tous les jours.

Si vous utilisez Baidu pour trouver des informations pertinentes, utilisez les Baidu réseau de neurones, le réseau de neurones sera classé en fonction de la plus page du mot-clé donné. Si vous voulez acheter quelque chose récemment visité Taobao site officiel, le site de tous les produits sont recommandés par la gestion du réseau de neurones.

Même maintenant, quand l'utilisation des téléphones mobiles, peut aussi l'expérience d'un réseau de neurones vie pratique. Les réseaux de neurones partout, ils complètent une variété de tâches de différentes façons de travailler.

Alors ...... « réseau de neurones » quel est-il?

Figure source: wemedia.ifeng.com

« Nerveux » est juste une autre expression du cerveau.

«C'est donc un réseau de cerveau? »

En substance, tout à fait vrai! Un réseau de neurones est le plus puissant outil de l'humanité - un cerveau simplifié. Les neurones sont utilisés par son poids (la ligne inférieure sur la figure) reliés entre eux. Certains neurones d'entrée numérique est assignée, et par le poids. Est le noyau des poids de réseau de neurones par le poids est convertie en une valeur spécifique, on peut traiter toute entrée et obtenir la sortie souhaitée.

réseau de neurones est juste un moyen de traitement des données. Les données lui-même est critique ici. En utilisant une variété de données de traitement de réseau de neurones ...... vous pouvez créer des outils puissants pour accomplir des choses incroyables!

Parmi ceux-ci, il y a beaucoup de réseaux de neurones a des propriétés magiques, petit noyau introduira une des plus célèbres:

1. La perception - la plus ancienne et la plus simple réseau de neurones

Perceptron les réseaux de neurones est la plus ancienne, datant de son invention en 1958. Il est aussi le plus réseau de neurones simple. Frank Rosenblatt Perceptron (Frank Rosenblatt) invention est un principe de base du réseau de neurones a jeté les bases.

Ce réseau de neurones a un seul neurone, il est très simple. Il reçoit une entrée de n et multiplié par les coefficients de pondération correspondant. Le calcul d'une sortie uniquement perceptron, car il peut traiter qu'un seul niveau de complexité des données, le faible niveau de complexité, et donc le développement est limité.

Cas d'utilisation:

· Compréhension du cerveau humain

· Extension pour le réseau de neurones de niveau supérieur

2. Multilayer Perceptron - Qu'est-ce qu'une couche?

Multilayer Perceptron (MLP), il est encore essentiellement perceptron, mais la complexité de conception est renforcée par couche. Dans MLP, il existe trois types de couches:

couche d'entrée:

Comme son nom l'indique, se réfère à l'entrée de données à la couche d'entrée du réseau de neurones. Les données d'entrée doit être numérique. Ce contenu doit être traduit en valeur non numérique. Processus avant que les données sont entrées dans le réseau neuronal sera dénommé opérations de traitement de données, en général, le traitement des données consiste à produire des modèles d'apprentissage de la machine plupart de temps.

couche cachée:

Par un neurones de couche cachée de réseau neuronal à la majorité, il est le noyau des données de traitement pour obtenir une sortie désirée. Les données passe à travers la couche cachée, par un certain nombre de poids et de réglage de polarisation. Il est appelé un « caché » couche, il est parce que les couches d'entrée et de sortie des différents développeurs réseau de neurones ne pas utiliser directement ces couches.

couche de sortie:

Les données de couche de sortie est le produit final du traitement dans un réseau de neurones, peut représenter des choses différentes. Typiquement, la couche de sortie de neurones, chaque neurone représente un objet, et la valeur supplémentaire indique que la probabilité que l'objet est un objet spécifique. Dans d'autres cas, la sortie peut être une couche de neurones de sortie, lorsqu'il est donné certaines entrées, il est la valeur spécifique.

L'idée de base est: couche de sortie est le résultat du transfert de données du réseau de neurones, mais aussi des gens qui essaient d'atteindre l'objectif.

les réseaux de neurones feedforward

Ce principe est, les données numériques transfert au réseau de neurones, puis procéder à un grand nombre d'opérations. Que les données continuent vers le bas passe, il n'y a pas de commentaires. Pour fonctionner correctement, de sorte que toute entrée donnée produisent toujours la sortie désirée, nous avons besoin de formation. Il est de trouver une méthode pour produire les meilleurs résultats sur la nature de la formation et l'appliquer au réseau de neurones.

Cas d'utilisation:

  • Vision par ordinateur
  • Traitement du langage naturel
  • Autre réseau de neurones de base

3. réseau de neurones convolutionnel - couche de convolution?

Circonvolution réseau de neurones utilise toujours le Multilayer Perceptron (MLP) sur le même principe, mais il convient de noter qu'il utilise une couche de convolution, convolution réseau de neurones habituellement appliqué aux images et vidéo.

Il est important de reconnaître que l'image se trouve une grille de nombres, chaque nombre représente l'intensité d'un pixel. Une image numérique est grille connue, peut être trouvée par les caractéristiques de fonctionnement d'une image et un mode numérique. la couche de filtre de convolution est réalisé en utilisant ce produit.

filtre

Le filtre est défini comme un N x M (N et / M représente la taille de maille) de la matrice numérique qui est multiplié fois l'image originale. Pour comprendre la situation réelle, s'il vous plaît se référer à l'animation.

Et déplacer une nouvelle valeurs de filtre sur la grille. Ces valeurs peuvent représenter des lignes ou des bords dans l'image. Par exemple, en utilisant le filtre suivant:

filtre horizontal tentera d'éliminer la valeur autre que le centre vertical. Il est par l'utilisation des fronts négatifs, enlevés afin d'éliminer l'utilisation de 0 au centre de pixel au point mort. Si le filtre est réussie, vous pouvez voir une ligne horizontale à partir des nouvelles valeurs. La même chose est vrai pour le virage à droite du filtre vertical.

Après que le filtre est appliqué à l'image entière, en utilisant la couche de cellules peut facilement extraire les principales caractéristiques de l'identification du filtre. Lors de la formation du modèle, le filtre numérique est déterminé à inclure. Trouvez la meilleure valeur à la tâche pour atteindre les meilleurs résultats.

couche Mise en commun

Les caractéristiques les plus importantes telles que leur nom à la piscine de la couche filtrante est d'identifier le rôle de « regroupement », ce qui est accompli en utilisant une variété de méthodes.

Une façon populaire est le « maximum commun » (Max pooling), dans ce procédé, pour chaque partie de l'image filtrée, en prenant le nombre maximum de nouvelles et stockées dans une matrice. Sa fonction essentielle est d'identifier les caractéristiques les plus importantes et une image comprimée, de sorte que le modèle de processus en tant que perceptron multicouche (MLP). Ce processus est également appelé les données d'échantillonnage, ce processus produira des résultats satisfaisants.

Cas d'utilisation

· Classification des images

· Computer Vision

· Trouver une fonction d'image / Mode

Figure source: www.crazyiter.com

4. Réseaux de neurones récurrents - données temporelles?

l'analyse des données de réseau de neurones est pas tout à fait limitée aux données statiques. Les données peuvent être analysées, comme toutes les images et les numéros de châssis et autres. Toutefois, selon les cas passés pour prédire les données à venir lui-même, ce qui est un exemple de données temporelles. données boursières, les données de séries chronologiques, les données d'analyse des ondes cérébrales et autres est toujours un résultat de passé par l'utilisation de variables d'instance.

Jusqu'à présent, le réseau de neurones du type mentionné ne peut pas gérer les données d'autres états, puis parler du réseau de neurones récurrents (RNN) est la solution.

matrice d'état

Recurrent Neural Network (RNN) des données de sortie finales mémorisées dans la mémoire par lui-même à l'état précédent de la mémoire. Ceux-ci sont appelés matrice d'état. Réseaux récurrents Neural travaille avec perceptron multi-couches (MLP) de l'ordinaire comme couche, mais il est utilisé pour calculer un nouvel état de la matrice de sortie. Envisagez d'utiliser les données de sortie finales précédentes et de sortie sur l'état de la nature, cette application est essentielle pour la prévision du marché boursier et la prévision des séries chronologiques.

réseau de mémoire à court et à long terme

À court et à long terme réseau de mémoire (LSTM) étend en outre à enregistrer la matrice d'état est l'idée de deux Etats - l'état de long terme et la situation à court terme. Si le voyant reste de l'Etat dans la sortie du modèle, il sera enregistré en tant qu'Etat à long terme de la matrice, et occupera plus de poids lors de l'examen de nouvelles données.

indicateurs très efficaces et marchés boursiers en prévision de l'avant-garde du modèle de recherche pour les applications de données en continu, système de LSTM.

Cas d'utilisation

  • Traitement du langage naturel
  • Stock Market Forecast
  • Sur la base des données de séries chronologiques prédit

Le codeur automatique - pour compresser les données présentées

La plupart des réseaux de neurones pour recevoir les données et de faire certains types de décisions. encodeur automatique a alors une autre tâche, à savoir trouver un moyen sans nuire à la qualité des données peut être comprimé.

Dans la machine d'apprentissage classique, attaché aux données de sortie du réseau de neurones de l'étiquette cible ne sont pas les mêmes. Dans le codeur automatique, il correspond à la balise d'entrée.

Ainsi, l'architecture du système de mesure automatique, d'entrée et de sortie des couches sont les mêmes. couche cachée et la couche de sortie est inférieure à l'entrée (en termes de nuds), que l'on appelle le « goulot d'étranglement ». En raison du petit goulot d'étranglement, il est forcé de trouver une méthode de compression de la couche arrière des données d'origine et les sorties. Cette compression est généralement mieux que la méthode classique, car il peut encore maintenir des données de qualité.

Cas d'utilisation:

· Principalement pour les petites grandes quantités de données compressées présentées.

Figure source: Unsplash

Maintenant, vous n'êtes pas appris beaucoup de connaissances du réseau de neurones?

Papier viennent Zhongjue savent que cette pratique est essentielle.

Agissez maintenant, passons maintenant à mettre en uvre ces réseaux de neurones à leurs problèmes pratiques vont ~

pouces Message attention

Ensemble, nous partageons l'apprentissage et le développement de l'IA sec

Tels que réimprimer, s'il vous plaît laisser un message dans les coulisses, se conformer aux normes de réimpression

personnes KEQIAO: Ne pas paniquer, ne pas se précipiter, ne pas thésauriser! Keqiao grain de riz et de l'offre assez d'huile abondante nous ouvrons l'estomac pour manger une demi-année
Précédent
200126 voix profonde Cheng Cheng Gala à dire le résumé complet complet sentiment juvénile
Prochain
Chanson réconfortante Ha prop Xian « la lutte contre le SRAS parapluie »
Télétravail: Comment améliorer la maîtrise de soi?
an dernier C de
« TFBOYS » « nouvelles » Wang Yuan 200126 grande scène cercle rose, une recherche en temps réel louange
200126 Wang Yuan grand site cercle rose Recherche vivre une louange
perspectives pour l'iPhone d'Apple 2020: grosse mise à jour de la caméra, 5G pour le premier accès
OMS Directeur général: les efforts de la Chine « Contagion » méritent la reconnaissance et le respect ... mais cette épidémie de pneumonie, de sorte que nous voyons entre les attitudes « du monde »
« Pas bon en maths, faire ne fonctionnera pas! » Programmeur: Ne pas aveugle les efforts
Bureau à distance plus d'un an pour apporter ma perception
Ningbo Takahashi vieille femme a été diagnostiqué allé tranquillement? ! maisons Fuming a été capturé, la cellule a été scellé? La vérité est ...
200126 Kim Suk Jin Tian Jiu & FILA pays Illustrated ouvert au public! Les personnes âgées et département des sports amis en ligne
Ali Tencent Huawei en action! Les programmeurs de bureau à distance pour savoir quelle vidéo conférence bon usage?