Kam Technology co-fondateur de Deep: l'apprentissage en profondeur pour le processeur de vision machine (téléchargement PPT)

Ce contenu est sélectionné à l'Université Tsinghua, professeur agrégé du Département de l'électronique, Shenzhen Science et Technology Co-fondateur Kam Wang Yu Le 27 Avril 2018 au l'Institut de salle de réception de données scientifiques organisée par l'Université de Tsinghua Main Building Forum Le deuxième « grandes données dans Tsinghua » fait intitulé « Apprentissage en profondeur pour le processeur de vision de la machine » Discours.

Remarque: Le mot-clé arrière de réponse de lettre privée « 0427 », télécharger la version complète du PPT. Lorsque la vidéo est d'environ une demi-heure, il est recommandé d'utiliser le wifi pour observer

Wang Yu: Bonjour à tous, aujourd'hui le rapport que notre travail fait dans le passé.

De Tsinghua rêve des chevaux Nous avons actuellement une équipe de 130 personnes, 50 étudiants de Tsinghua, couvrant tout de l'architecture logicielle, la puce, le matériel, les algorithmes de compiler tous les aspects. processeurs speaking Aujourd'hui, y compris Intel, y compris de nombreuses entreprises ne l'architecture non seulement, faire le matériel, le logiciel a aussi beaucoup à faire et les algorithmes. Laissez les jetons aux autres de les utiliser, doivent démontrer que les autres peuvent voir l'effet, et avoir un bon compilateur.

technologie de base auto-développé Pour vous parler de notre propre technologie de base, pour parler de notre point de vue sur ce domaine.

En ce qui concerne l'apprentissage en profondeur, nous avons dit pourquoi faire des affaires pour un apprentissage en profondeur, pas pour d'autres? Etude approfondie est essentiellement une forme, les paramètres définis par le réseau de neurones, pour un nombre suffisant de X, Y marque, à partir du niveau de l'algorithme pour soutenir différentes applications.

A partir de 2010, après la popularité de l'Internet mobile, de plus en plus de données marquées. réseau de neurones peut fournir un procédé, les données sont utilisées. De la CPU au GPU et du matériel dédié, nous espérons que dans le domaine du terminal personnel, y compris chaque caméra peut faire un tel réseau.

De la grande tendance, passez en revue toute la période historique, il y a un matériel critique (image ci-dessous). Nous ne savons pas à ce stade IA, ce que le matériel est la clé, donc nous sommes très heureux de vous voir luttez loin pour une telle capacité de base.

Notre approche est de quoi? Ci-dessous l'image est la plus critique de trois parties: la chaîne d'outils logiciels DNNDK-, l'architecture de niveau d'instruction.

Étant donné ci-dessus est un petit module tous les algorithmes correspondant à son unité des briques dans un mur, donc pour l'apprentissage en profondeur du paragraphe précédent, il n'y a pas possibilité de trouver ces niveaux abstrait, c'est le niveau d'instruction. Pour ce résumé, nous pouvons répondre à ces matériel abstrait, nous avons besoin de tout le réseau de neurones est un ensemble d'instructions. Étant donné que le matériel est fixé, de sorte que les opérations de soutien limité.

Pour un système, trois choses sont importantes, la première capacité de pointe, encerclez le nombre d'unités de calcul, combien de personnes travaillent pour vous. La seconde est de savoir comment obtenir un pourcentage plus élevé de personnes réellement dans le travail. Le troisième est de faire la même chose, peut réduire le nombre de personnes dans le besoin. Ces trois ont ainsi une chance de remonter à la performance globale.

Toutes les branches d'activité sont données, après un bon algorithme de formation, nous pouvons être comprimé dans l'enseignement que nous avons défini le flux, et sur le matériel, la formation d'une solution de système.

Pourquoi nous devons mettre l'accent sur la coopération matérielle et logicielle? Il a une carte, l'axe horizontal est le nombre de watts. Puissance différente correspondant à différentes applications, il est souhaitable de faire de chacun de watts, ce qui correspond à un rendement suffisamment élevé.

L'axe vertical représente la performance - le nombre de calculs par seconde. triangle figure représente la puce, il peut être fait à propos 1T ~ 5T / W, qui est essentiellement une ligne très redoutable. Par conséquent, la puce est pas assez de lumière pour faire, des algorithmes d'optimisation doivent le faire.

Nous essayons aussi de faire leur propre propriété intellectuelle. À ce moment-là, vous voudrez peut-être mettre une puce à faire des millions de dollars en temps de conception de puces, comment adapter à l'avenir, comment mettre tout bon réseau de soutien actuel. Êtes-vous sûr de vouloir abstraire le niveau intermédiaire, niveau intermédiaire d'unités de base devrait être en mesure de mettre en place tous le réseau, vous ne savez pas ce que l'avenir du réseau.

Du côté logiciel, nous faisons tout le réseau de neurones, les arêtes et les points indésirables sont supprimés, le calcul global nécessaire peut être réduite. Non seulement le travail à faire ces choses, si vous voulez dynamiser l'ensemble de l'industrie, nous devons aussi avoir une chaîne d'outils. Avec l'outil de compression profonde, disponible sur RNN et CNN et le taux de compression important, de sorte que l'algorithme est plus petit, la puissance plus rapide, moins cher.

Solutions de produits et applications Comment l'appliquer? Nous illustrons.

Ceci est la version accélérée de notre réseau de neurones, à l'avant que vous pouvez faire pour identifier et comparer, l'avenir ne passera pas les flux vidéo et des images, il peut y avoir transfert de valeurs propres. Je crois que dans les prochaines années, les valeurs propres seront unifiées standard.

Ceci est une demande de reconnaissance de la parole. Président dialogue complexe, se propage dans le nuage pour le faire. Nous pouvons utiliser FPGA faire, plus vite que le CPU et le GPU, et réduire la consommation d'énergie. Si nous pouvons augmenter la puissance de calcul par watt correspond, nous pouvons servir plus de clients.

Ceci est notre effort pour essayer de le faire à la fin de l'automobile, derrière le support par le réseau de neurones. Une voiture a plusieurs caméras, mettra l'accent sur une plate-forme pour faire l'opération, l'original peut être à voir avec le GPU, nous offrons maintenant à voir avec FPGA. Derrière l'extrémité avant comprenant, une puce peut aussi avoir besoin de prétraitement, la puce FPGA peut également être utilisé pour faire.

Nous sommes impatients de le faire sur les performances de la puce, la réduction des coûts, afin de remplacer le coût plus élevé existant FPGA, plus que ce que nous dans le monde universitaire faire des travaux dans le passé, dans le cas des applications d'entreprise et de services, je vous remercie!

Note: mot-clé de réponse de fond « 0427 », télécharger la version complète du PPT.

Manqué classique! L'attaquant de Manchester United dans la barre de Dieu pour préparer chemise se moquant de Paris, où il n'a pas marqué!
Précédent
Nouvel an chinois sur une tête chaude, les mamans à travers le pays ne sont pas tous comme ça?
Prochain
Un texte lu Google I / O conférence: des changements majeurs Andrews, le développement de l'intelligence artificielle, Google devrait ouvrir iPhone Assistant
2 Coupe du monde six ans d'expérience, la maison de verre de la Place Rouge de Moscou, sur la plus belle ancre féminine de télévision en circuit fermé de sport
inventaire des IA rivières et lacs, « Ouest Non-Est » de Tsinghua
Avec les cinq sens du goût du matin « World of Color » artistes chinois couleurs Chen Xiao Chengdu, le premier étage d'exposition de SM Place Xiao
Il y a quatre ans, ils sont montés à bord presque le sommet de l'Europe, maintenant déjà chuté Ligue amateur!
Université Tsinghua Professeur Zhang Zhang eau: l'apprentissage automatique et de reconnaissance d'image (télécharger PPT)
Etude approfondie surmontera les connaissances, les ressources sèches ici (avec le code source, liens papiers)
adieu Hong Jin Yong Zhang Jizhong: faire tous les efforts pour faire un bon film « outsiders solitaires volant » pour commémorer Jin Yong
La technologie détaillée du pilote automatique de données à la maison et à l'étranger
catastrophe Storm: l'homme romain et une femme à l'intérieur de la voiture ont été tués arbres, demain ou le jour il y a plus de pluie torrentielle
1 grands conflits espagnol Oolong surgissent! peine de l'arbitre mauvaise personne, peut jouer le principal Barcelone 1
Le nouveau micro-canal des laboratoires en ligne, a lancé la « recherche trouvé » et « jeter un oeil »