[2018 Ji-won nouveau compte � rebours au sommet de la technologie AI 16 jours]

Les seuls juges du prix Nobel visitent le domaine de l'informatique, la premi�re gamme d'invit� du sommet annonc�

Early Bird billets ont �t� vendus, les billets sont officiellement entr�s dans la sc�ne en plein. A propos, qui se tiendra � Beijing 2018 Festival chinois nouvelle ann�e --2018 nouvelle AI Ji-won AI Technology Summit , Nous avons invit� la chanceli�re allemande Angela Merkel conseiller scientifique, le seul prix Nobel juge de domaine de l'informatique, l'industrie 4.0 parrain, haut traitement du langage naturel du monde expert Professeur Wolfgang Wahlste. Le professeur Wahlster visitera 329 site sommet europ�en r�flexion sur le d�veloppement de la technologie de l'intelligence artificielle AI et de l'industrialisation de la part. juges Nobel veulent voir le style du site, cliquez sur le lien pour voix d'appui, les participants imm�diatement!

Rush billets d'un lien: http: //www.huodongxing.com/event/8426451122400

�Ji-won nouveau rapport

Source: tvmlang.org

Auteur: Xiao Qin, Wen Qiang

[New Ji-won EXAMEN Chen Tianqi �tude approfondie de l'�quipe de l'Universit� de Washington sont g�n�rateurs de code optimis� automatiquement des mises � jour de version TVM sans �crire une seule ligne de code Javascprit, le mod�le d'apprentissage en profondeur sera en mesure de diriger le compilateur � WebGL, puis ex�cutez dans le navigateur.

Aujourd'hui, l'Universit� de Washington a d�velopp� par l'�quipe Chen Tianqi TVM a affich� une mise � jour, pas besoin d'�crire un code JavaScript, sera en mesure de diriger le compilateur mod�le d'apprentissage en profondeur WebGL / OpenGL, et ex�cuter dans le navigateur.

l'apprentissage en profondeur ne peut pas �tre s�par� tensorflow, MXNet, �tude approfondie Caffe et PyTorch de ces syst�mes �volutifs, mais la plupart d'entre eux est optimis� pour une petite gamme de plates-formes mat�rielles (telles que le GPU niveau du serveur), pour adapter � d'autres plates-formes d�pensant les co�ts d'ing�nierie consid�rables et les co�ts, ce qui pose un d�fi pour le syst�me d'apprentissage en profondeur de d�ploiement flexible.

Un certain nombre de diff�rents cadres d'apprentissage de profondeur (langage de programmation), un nombre croissant d'architectures mat�rielles, la n�cessit� d'un pont entre les deux. cadre TVM est n� pour, con�u pour donner aux chercheurs et aux d�veloppeurs une vari�t� de mat�riel, des t�l�phones cellulaires, les appareils embarqu�s � ces diff�rents syst�mes d�di�s de puces de faible puissance, l'apprentissage en profondeur d�ployer rapidement et facilement des applications sans sacrifier la puissance ou la vitesse batterie.

TVM est une couche commune (une couche commune) et entre le mat�riel dorsal r�seau neuronal, sans avoir � construire une infrastructure distincte pour chaque type de dispositif ou d'un serveur, le cadre permet aux d�veloppeurs de rapidement sur une vari�t� de dispositifs mat�riels d�ployer facilement et d'optimiser le syst�me d'apprentissage en profondeur pour aider les chercheurs � mettre en uvre rapidement nouvel algorithme d'optimisation pour v�rifier de nouvelles id�es, mais aussi aider � promouvoir le domaine du mat�riel et des logiciels de co-conception d'�tude et des recherches approfondies.

La nouvelle version OpenGL / WebGL support back-end

TVM supporte de multiples mat�riel back-end: CPU, GPU, les appareils mobiles, etc ...... cette fois-ci, nous avons ajout� un autre back-end: OpenGL / WebGL .

OpenGL / WebGL nous permet de tirer parti du GPU CUDA install� dans un libre environnement. � l'heure actuelle, c'est la seule fa�on d'utiliser le GPU dans votre navigateur.

Le nouveau back-end nous permet d'examiner trois fa�ons d'utiliser OpenGL / WebGL:

OpenGL local : Nous pouvons �tre compil� dans un mod�le d'apprentissage en profondeur OpenGL, et ex�cuter directement sur la machine locale, enti�rement en utilisant uniquement Python.
RPC avec le WebGL : Nous pouvons apprendre un mod�le de compilation de profondeur WebGL, et l'exporter comme une biblioth�que partag�e, et le code h�te avec le code de l'appareil JavaScript et WebGL. On peut alors �tre d�ploy� sur le syst�me de biblioth�que partag�e � l'ex�cution RPC JavaScript TVM, en cours d'ex�cution dans le navigateur.
WebGL avec une biblioth�que statique : Nous pouvons apprendre un mod�le de compilation de profondeur WebGL, connectez-vous au JavaScript TVM pour ex�cuter le syst�me, et d'exporter l'ensemble du paquet. Vous pouvez ensuite ex�cuter le mod�le dans un navigateur web, pas de d�pendances. organigramme d�taill� repr�sent� sur la Fig.

Figure 1

Demo code ci-dessus trois fa�ons: https: //github.com/dmlc/nnvm/blob/master/tutorials/from_mxnet_to_webgl.py

Comment cela diff�re de X?

Les r�seaux de neurones en cours d'ex�cution dans le navigateur n'est pas chose tr�s �trange. ConvNetJS Andrej Karpathy propos�, ainsi que les DeepLearning.JS de Google toutes ces pens�es.

Ensuite, utilisez le WebGL TVM Ce qui est unique? La plus grande diff�rence est dans le noyau de fonctionnement est automatiquement compil� TVM, plut�t que compil� manuellement. Comme repr�sent�, la TVM utilisant une d�finition uniforme du noyau repr�sent� sur la. Figure 2 AST et compiler le code sur diff�rentes plates-formes.

Figure 2

Cela signifie:

Vous n'avez pas besoin d'�crire beaucoup de code suppl�mentaire, vous pouvez d�ployer le mod�le existant pour WebGL. mod�le NNVM / TVM cible d�finit en est la m�me pour tous, donc il vous suffit de le compiler � une nouvelle cible.
Si vous souhaitez ajouter un nouveau noyau de syst�me d'exploitation, il vous suffit de d�finir une fois dans la TVM sans r�alisation une fois pour chaque cible. Vous n'avez pas besoin de savoir comment �crire du code GLSL pour ajouter un nouveau noyau de syst�me d'exploitation pour WebGL!

Indice de r�f�rence

Ici, nous travaillons en charge la mise en uvre typique des tests de r�f�rence: Utilisation resnet18 pour la classification d'images.

J'utilise un 8-core 5 ans de vieux ordinateurs portables Core i7-3610QM Intel �, ainsi qu'un GTX650M.

Dans ce benchmark, nous avons t�l�charg� le mod�le resnet18 de la biblioth�que de mod�le gluons et la classification d'image cat-end. Nous ne mesurons le mod�le de temps d'ex�cution (mod�le non inclus / entr�e / param�tres de charge), et chaque ex�cution du mod�le 100 fois pour obtenir la moyenne. Les r�sultats pr�sent�s sur la figure 3.

Figure 3

Les pistes de r�f�rence dans les quatre diff�rents param�tres suivants:

CPU (LLVM) : Le mod�le est compil� dans LLVM IR et JIT'ed, ex�cutez enti�rement sur la CPU.
OpenCL : Le mod�le est compil� dans OpenCL. Il y a un code de colle est compil� dans LLVM, responsable de la mise en place et le d�marrage du noyau OpenCL. Ensuite, nous courons sur la machine locale.
OpenGL : OpenCL et m�me, mais compil� pour OpenGL.
WebGL : Code colle est compil� dans LLVM, et l'utilisation emscripten converti en JavaScript. Dispositif code est compil� dans WebGL. Notre mod�le d'ex�cution sur Firefox.

Comme on peut le voir les r�sultats ci-dessus, arri�re OpenGL TVM OpenCL ayant des propri�t�s similaires. Fait int�ressant, la version WebGL du navigateur n'est pas beaucoup plus lent que l'OpenGL de bureau. Vu le code h�te est JavaScript, il est surprenant. Cela peut �tre d� asm.js g�n�r�s emscripten, peut �tre une optimisation significative dans Firefox.

Ceci est la premi�re �tape du mod�le d'apprentissage en profondeur est automatiquement compil� dans un navigateur Web. Comme nous allons optimiser la TVM dans la pile, nous pouvons nous attendre plus d'am�liorations de performance.

TVM: une extr�mit� de la pile d'extr�mit� optimis�

cadre extensible, comme tensorflow, MXNet, Caffe et PyTorch est la profondeur de champ d'�tude du cadre le plus populaire et pratique. Cependant, le cadre a �t� optimis� pour une gamme �troite de GPU au niveau du serveur, si vous souhaitez d�ployer des charges de travail vers d'autres plates-formes (comme les t�l�phones portables, les appareils embarqu�s et de l'acc�l�rateur d�di� FPGA, ASIC, etc.), il faut beaucoup de travail laborieux. Nous vous proposons une pile de bout en bout optimis� TVM, avec l'optimisation de niveau op�rateur et le niveau graphique, pour fournir des performances back-end pour diff�rentes �tude approfondie de la portabilit� du mat�riel et la charge de travail. Nous avons discut� de l'�tude approfondie de TVM pour relever les d�fis de l'optimisation: l'int�gration des op�rateurs avanc�s, la r�utilisation de la m�moire � faible niveau entre les threads, et une cartographie des primitives de mat�riel et de cacher la latence de la m�moire. Les r�sultats ont montr� que, TVM peut �tre comparable avec le soutien existant CPU faible puissance et les biblioth�ques de niveau serveur GPU performance optimale de multiples mat�riel back-end. Nous testons �galement pour l'�tude de la profondeur g�n�rale des acc�l�rateurs � base de FPGA, montrant la capacit� de TVM � adapter � nouveau backend acc�l�rateur mat�riel. L'infrastructure de compilateur open-source d�j�.

Figure 4: CPU, GPU acc�l�rateur de TPU a besoin d'un autre type de primitives de puces de m�moire et une architecture de calcul. Lors de la g�n�ration du code optimis�, nous devons examiner cette question.

Nous vous proposons TVM, une fin de l'optimisation de la pile du compilateur (figure 5), il peut r�duire la charge de travail et d'affiner la profondeur de l'apprentissage � adapter � une vari�t� de mat�riel back-end. TVM est con�u pour s�parer les descriptions algorithmiques, le calendrier et l'interface mat�riel, ce principe a inspir� Halide l'id�e Compute / calendrier de s�paration, mais aussi par le calendrier avec le mat�riel cible fonction � l'int�rieur s�par�ment �largi. Cette s�paration suppl�mentaire peut supporter nouvel acc�l�rateur d�di� et ses nouvelles fonctions internes correspondantes.

Figure 5: TVM de la Fig. La pile actuelle prend en charge une vari�t� de cadre d'apprentissage profond et CPU grand public, GPU et acc�l�rateur d'apprentissage profond d�di�.

Optimisation TVM ayant deux couches: l'une est calcul d'optimisation de la figure couche , L'autre est avec les nouvelles primitives de planification couche d'optimisation Tensor . La combinaison de ces deux optimisation des couches, peut �tre obtenu � partir de la plupart de la description du mod�le de cadre TVM apprentissage profond, haute et basse optimisation d'ex�cution, et pour g�n�rer le code optimis� pour le mat�riel sp�cifique extr�mit� arri�re, par exemple Raspberry Pi, GPU et des acc�l�rateurs � base de FPGA d�di�. Dans cette �tude, les contributions sont les suivantes:

Nous avons construit une optimisation du compilateur fin de la pile, peut �tre cadre avanc� (y compris Caffe, MXNet, PyTorch, Caffe2, CNTK) les charges de travail d'�tude de profondeur sp�cifi�es d�ploy�s dans une vari�t� de mat�riel back-end (y compris CPU, GPU et FPGA bas�e sur acc�l�rateur et back-end publi� aujourd'hui OpenGL / WebGL).
Nous vous proposons un d�fi majeur pour optimiser les performances pour assurer la charge de travail de l'�tude en profondeur de la portabilit� dans un mat�riel diff�rent back-end et introduit une nouvelle primitive calendrier, pour tirer parti de la fonction de m�moire interne dans les threads r�utiliser, nouveau mat�riel et cacher la latence.
Nous tvm �valu�s sur l'acc�l�rateur � usage g�n�ral � base de FPGA, des �tudes de cas sp�cifiques sur la meilleure fa�on d'adapter � l'acc�l�rateur sp�cifique.
Notre compilateur peut g�n�rer un code qui peut �tre d�ploy�, et sa performance peut �tre comparable aux meilleures biblioth�ques actuelles, et peut adapter � la nouvelle back-end d'acc�l�rateur d�di�.

Figure 6: Exemple de calcul de la figure deux du r�seau neuronal convolutif. Chaque noeud de la figure repr�sente une op�ration, un ou plusieurs Tensor consomm�, et pour g�n�rer un

Pour plus de d�tails, s'il vous pla�t lire la th�se: https: //arxiv.org/pdf/1802.04799.pdf

XLA V.S. TVM: apprentissage en profondeur � repr�sentation interm�diaire � du diff�rend

Structurellement, la TVM est un apprentissage indique la profondeur interm�diaire int�gral (IR) de l'empilement de la couche de base (couche de base), fournit une cha�ne d'outils r�utilisables pour compiler algorithme de r�seau neuronal de haut niveau afin de g�n�rer une plate-forme mat�rielle sp�cifique inf�rieure code machine.

M�thode de r�f�rence du compilateur de construction, un b�timent �quipe deux couches interm�diaire par NNVM (IR pour la planification avanc�e et la gestion de la m�moire), et la TVM (bas Compute noyau Optimized IR). TVM est livr� avec une biblioth�que optimis�e r�utilisable, peut �tre ajust�e pour r�pondre aux besoins des serveurs � partir d'un calcul dispositif portable � nuage haut de gamme diff�rentes plates-formes mat�rielles.

Google utilise �galement deux couches de XLA structure optimis�e, mais seulement pour XLA tensorflow. En revanche, TVM tente de devenir une interface ouverte.

Non seulement cela, avant que Chen Tianqi sait presque en r�ponse � une question: � Comment �valuer le syst�me d'apprentissage modulaire profondeur Chen Tianqi NNVM? � Il a dit, � diff�rentes solutions existantes et � TVM XLA � titre d'exemple, TVM disparu et maintenant plus de XLA feuille de route technologique agressive, TVM peut �tre utilis� de mani�re � obtenir la fonctionnalit� requise XLA plus facile ".

Selon le blog TVM, nous avons fait la mise � jour suivante:

Dans une �tude statistique r�cente de la profondeur du classement cadre open-source, tensorflow sont situ�s dans la premi�re, il n'y a pas de controverse. Mais � l'avenir, la repr�sentation interm�diaire (IR) sera la cl� de la concurrence entre le cadre de l'apprentissage en profondeur.

Blog Adresse: http: //www.tvmlang.org/2018/03/12/webgl.html

Th�se: https: //arxiv.org/pdf/1802.04799.pdf

Code: https: //github.com/dmlc/nnvm/blob/master/tutorials/from_mxnet_to_webgl.py

Route de la soie

Apprenez � conna�tre la Chine

[Auto] Code �quipe Chen Tianqi compil� TVM lourd Mise � jour: Utilisez le GPU directement dans votre navigateur

La nouvelle version OpenGL / WebGL support back-end

TVM: une extr�mit� de la pile d'extr�mit� optimis�

XLA V.S. TVM: apprentissage en profondeur � repr�sentation interm�diaire � du diff�rend