Kam Technology co-fondateur de Deep: l'apprentissage en profondeur pour le processeur de vision machine (t�l�chargement PPT)

Ce contenu est s�lectionn� � l'Universit� Tsinghua, professeur agr�g� du D�partement de l'�lectronique, Shenzhen Science et Technology Co-fondateur Kam Wang Yu Le 27 Avril 2018 au l'Institut de salle de r�ception de donn�es scientifiques organis�e par l'Universit� de Tsinghua Main Building Forum Le deuxi�me � grandes donn�es dans Tsinghua � fait intitul� � Apprentissage en profondeur pour le processeur de vision de la machine � Discours.

Remarque: Le mot-cl� arri�re de r�ponse de lettre priv�e � 0427 �, t�l�charger la version compl�te du PPT. Lorsque la vid�o est d'environ une demi-heure, il est recommand� d'utiliser le wifi pour observer

Wang Yu: Bonjour � tous, aujourd'hui le rapport que notre travail fait dans le pass�.

De Tsinghua r�ve des chevaux Nous avons actuellement une �quipe de 130 personnes, 50 �tudiants de Tsinghua, couvrant tout de l'architecture logicielle, la puce, le mat�riel, les algorithmes de compiler tous les aspects. processeurs speaking Aujourd'hui, y compris Intel, y compris de nombreuses entreprises ne l'architecture non seulement, faire le mat�riel, le logiciel a aussi beaucoup � faire et les algorithmes. Laissez les jetons aux autres de les utiliser, doivent d�montrer que les autres peuvent voir l'effet, et avoir un bon compilateur.

technologie de base auto-d�velopp� Pour vous parler de notre propre technologie de base, pour parler de notre point de vue sur ce domaine.

En ce qui concerne l'apprentissage en profondeur, nous avons dit pourquoi faire des affaires pour un apprentissage en profondeur, pas pour d'autres? Etude approfondie est essentiellement une forme, les param�tres d�finis par le r�seau de neurones, pour un nombre suffisant de X, Y marque, � partir du niveau de l'algorithme pour soutenir diff�rentes applications.

A partir de 2010, apr�s la popularit� de l'Internet mobile, de plus en plus de donn�es marqu�es. r�seau de neurones peut fournir un proc�d�, les donn�es sont utilis�es. De la CPU au GPU et du mat�riel d�di�, nous esp�rons que dans le domaine du terminal personnel, y compris chaque cam�ra peut faire un tel r�seau.

De la grande tendance, passez en revue toute la p�riode historique, il y a un mat�riel critique (image ci-dessous). Nous ne savons pas � ce stade IA, ce que le mat�riel est la cl�, donc nous sommes tr�s heureux de vous voir luttez loin pour une telle capacit� de base.

Notre approche est de quoi? Ci-dessous l'image est la plus critique de trois parties: la cha�ne d'outils logiciels DNNDK-, l'architecture de niveau d'instruction.

�tant donn� ci-dessus est un petit module tous les algorithmes correspondant � son unit� des briques dans un mur, donc pour l'apprentissage en profondeur du paragraphe pr�c�dent, il n'y a pas possibilit� de trouver ces niveaux abstrait, c'est le niveau d'instruction. Pour ce r�sum�, nous pouvons r�pondre � ces mat�riel abstrait, nous avons besoin de tout le r�seau de neurones est un ensemble d'instructions. �tant donn� que le mat�riel est fix�, de sorte que les op�rations de soutien limit�.

Pour un syst�me, trois choses sont importantes, la premi�re capacit� de pointe, encerclez le nombre d'unit�s de calcul, combien de personnes travaillent pour vous. La seconde est de savoir comment obtenir un pourcentage plus �lev� de personnes r�ellement dans le travail. Le troisi�me est de faire la m�me chose, peut r�duire le nombre de personnes dans le besoin. Ces trois ont ainsi une chance de remonter � la performance globale.

Toutes les branches d'activit� sont donn�es, apr�s un bon algorithme de formation, nous pouvons �tre comprim� dans l'enseignement que nous avons d�fini le flux, et sur le mat�riel, la formation d'une solution de syst�me.

Pourquoi nous devons mettre l'accent sur la coop�ration mat�rielle et logicielle? Il a une carte, l'axe horizontal est le nombre de watts. Puissance diff�rente correspondant � diff�rentes applications, il est souhaitable de faire de chacun de watts, ce qui correspond � un rendement suffisamment �lev�.

L'axe vertical repr�sente la performance - le nombre de calculs par seconde. triangle figure repr�sente la puce, il peut �tre fait � propos 1T ~ 5T / W, qui est essentiellement une ligne tr�s redoutable. Par cons�quent, la puce est pas assez de lumi�re pour faire, des algorithmes d'optimisation doivent le faire.

Nous essayons aussi de faire leur propre propri�t� intellectuelle. � ce moment-l�, vous voudrez peut-�tre mettre une puce � faire des millions de dollars en temps de conception de puces, comment adapter � l'avenir, comment mettre tout bon r�seau de soutien actuel. �tes-vous s�r de vouloir abstraire le niveau interm�diaire, niveau interm�diaire d'unit�s de base devrait �tre en mesure de mettre en place tous le r�seau, vous ne savez pas ce que l'avenir du r�seau.

Du c�t� logiciel, nous faisons tout le r�seau de neurones, les ar�tes et les points ind�sirables sont supprim�s, le calcul global n�cessaire peut �tre r�duite. Non seulement le travail � faire ces choses, si vous voulez dynamiser l'ensemble de l'industrie, nous devons aussi avoir une cha�ne d'outils. Avec l'outil de compression profonde, disponible sur RNN et CNN et le taux de compression important, de sorte que l'algorithme est plus petit, la puissance plus rapide, moins cher.

Solutions de produits et applications Comment l'appliquer? Nous illustrons.

Ceci est la version acc�l�r�e de notre r�seau de neurones, � l'avant que vous pouvez faire pour identifier et comparer, l'avenir ne passera pas les flux vid�o et des images, il peut y avoir transfert de valeurs propres. Je crois que dans les prochaines ann�es, les valeurs propres seront unifi�es standard.

Ceci est une demande de reconnaissance de la parole. Pr�sident dialogue complexe, se propage dans le nuage pour le faire. Nous pouvons utiliser FPGA faire, plus vite que le CPU et le GPU, et r�duire la consommation d'�nergie. Si nous pouvons augmenter la puissance de calcul par watt correspond, nous pouvons servir plus de clients.

Ceci est notre effort pour essayer de le faire � la fin de l'automobile, derri�re le support par le r�seau de neurones. Une voiture a plusieurs cam�ras, mettra l'accent sur une plate-forme pour faire l'op�ration, l'original peut �tre � voir avec le GPU, nous offrons maintenant � voir avec FPGA. Derri�re l'extr�mit� avant comprenant, une puce peut aussi avoir besoin de pr�traitement, la puce FPGA peut �galement �tre utilis� pour faire.

Nous sommes impatients de le faire sur les performances de la puce, la r�duction des co�ts, afin de remplacer le co�t plus �lev� existant FPGA, plus que ce que nous dans le monde universitaire faire des travaux dans le pass�, dans le cas des applications d'entreprise et de services, je vous remercie!

Note: mot-cl� de r�ponse de fond � 0427 �, t�l�charger la version compl�te du PPT.

Route de la soie

Apprenez � conna�tre la Chine

Kam Technology co-fondateur de Deep: l'apprentissage en profondeur pour le processeur de vision machine (t�l�chargement PPT)