L'outil d'optimisation du compilateur le plus commun! b�timent MIT, le taux de pr�cision est cinq fois les m�thodes traditionnelles

s�cher � partir du fond de l'�videment treize non-Temple rapports Qubit | Num�ro public QbitAI

Quel est l'�tat d'un nouveau code � ex�cuter sur leur propre puce? Intel ne sont pas eux-m�mes de nouveaux outils clairement � la maison de quelqu'un.

Ceci est la recherche propos�e par le MIT a pris un an, appel� Ithemal La fonction de base est tr�s simple:

millions d'analyse peuvent �tre d�crits automatiquement des blocs de base (instructions de calcul des fragments de base), de savoir exactement comment effectuer les moyens de calcul diff�rentes puces.

L'effet est tr�s �tonnant.

MIT Nouvelles a r�v�l� que le mod�le traditionnel de la conception artificielle, la pr�diction de la vitesse de fonctionnement de code bas� sur la puce, et le taux d'erreur entre la vitesse de fonctionnement r�elle de jusqu'� 50%.

M�me les fournisseurs de puces, comme propre code de pr�diction d'Intel sur la vitesse de la puce, le taux d'erreur a atteint 20%. Et Ithemal, le taux d'erreur �tait seulement 10%.

Cinq fois la performance de la m�thode conventionnelle, Intel 2 fois.

L'ensemble du processus est automatis� et ne n�cessite pas d'intervention humaine, il sera en mesure d'analyser rapidement des centaines de milliers ou des millions de blocs de base.

Et General Motors, il peut rapidement apprendre le code en tout cas la performance de la nouvelle architecture de puce, que ce soit l'alchimie de l'apprentissage machine, ou d'une cha�ne de technologie de chiffrement, ou les optimisations du compilateur, etc., peut contenir en direct.

Les chercheurs de l'utilisation partag�e d'un tel sc�nario:

Si vous souhaitez former un mod�le sur une nouvelle architecture de puce, comme TPU de Google, il vous suffit de recueillir ces donn�es � partir du sch�ma, ex�cutez apr�s l'analyseur, pour former Ithemal, vous pouvez obtenir un mod�le qui peut pr�dire la performance. "

Pour les performances de la puce compl�te, ce qui permet le code de fonctionner plus efficacement, ce qui est un progr�s r�volutionnaire.

Bas� sur le r�seau de neurones, �vitant � �l�phant �

En r�gle g�n�rale, pour que le code � ex�cuter efficacement sur la puce, les d�veloppeurs de compilateur combiner les performances d'un mod�le de conception pour simuler le fonctionnement du code sur l'architecture de la puce.

Les d�veloppeurs d'optimiser davantage le code ces informations pour am�liorer encore l'efficacit� du code, briser le goulot d'�tranglement de la puce.

Bien que cette ligne de pens�e aucun probl�me, les mensonges trouble dans la fa�on de concevoir le mod�le de performance, la m�thode traditionnelle est une fraction des experts � la conception artificielle.

Le visage de l'architecture de puce complexe, ce qui est un peu le sentiment � d'�l�phant �, il est un processeur Intel, sa description architecture de puce document, jusqu'� 3000 pages.

Et le contenu est pas n�cessairement compl�te, en tenant compte de la concurrence commerciale et de la s�curit� technologique, Intel devra ignorer d�lib�r�ment une partie du contenu, ce qui a augment� sans doute la difficult� - l'homme aveugle a touch� l'�l�phant, peut �tre mutil�e.

Sans parler de l'architecture de la puce moderne, non seulement opaque, mais son complexe et difficile � comprendre. Vous voulez obtenir un mod�le de performance, il est difficile, vous voulez obtenir un mod�le de performance plus pr�cis, est plus difficile.

approche MIT, en commen�ant sans passer par le dilemme � �l�phant �, mais un r�seau de neurones, l'apprentissage de � donn�es �.

Ces donn�es sont les effectue � puce � blocs de base � de toute fonction pour ajouter un nombre moyen de cycles souhait�, aucun manuel.

Non � voir � � travers l'entr�e m�me avant que le bloc de base et l'architecture puce, le mod�le peut �tre form� donner le nombre de pr�dire la vitesse de la puce effectuer plus pr�cis�ment le code.

Comme on dit Rome n'a pas �t� construite en un jour n'est pas .

La naissance du MIT est aussi un outil puissant Pas � pas .

La premi�re �tape: un indicateur de donn�es de formation � bloc de base �

Tout d'abord, les chercheurs proposent un outil de r�seau de neurones - � " bloc de base � Mark sous la forme de donn�es de formation.

Le but est de pr�dire automatiquement une puce donn�e, le temps d'ex�cution requis pour le bloc de base.

Les r�sultats ont montr� que, par rapport au mod�le de r�glage manuel traditionnel, la pr�cision est beaucoup plus �lev�.

Cet outil est appel� Ithemal, l'�tude a �galement publi� dans le ICML 2019.

nom Ithemal complet est appel� " Je nstruction TH roughput E stimator utilisant MA �chine L gagnant �.

Inspir� par la profondeur du r�seau de neurones, qui utilise une nouvelle approche ax�e sur les donn�es pour pr�dire un certain bloc d'instructions.

Ithemal le probl�me d'estimation de d�bit est mod�lis� comme une t�che de r�gression, et utiliser beaucoup d'utilisation de jeu de donn�es �tiquette de s�quence DNN est mis en correspondance avec les valeurs de d�bit r�el, afin d'apprendre � pr�dire.

Plus sp�cifiquement, Ithemal RNN l'aide d'un multi-�chelle hi�rarchique, de sorte que chaque instruction pour g�n�rer un insert s�par�, suivie par une connexion � une instruction incorpor�e dans le d�bit pr�dit.

Dans tous les points de r�f�rence, EMCP (EMCP) est r�duite de plus de 50% Tout en offrant une vitesse d'estimation rapide.

Lors de la g�n�ration d'une pr�diction de haute qualit�, la sp�cification Ithemal seule ISA et les donn�es de formation, y compris les instructions et les sp�cifications op�randes explicites et implicites.

Et avec un autre mod�le, Ithemal sans aucune sp�cification claire ou la mod�lisation, vous avez seulement besoin d'apprendre une aide importante pour am�liorer les d�tails de la structure du syst�me de micro-d�bit peut �tre.

Les chercheurs ont �galement des ressources li�es Ithemal dans l'open source sur GitHub: https://github.com/psg-mit/Ithemal

Deuxi�me �tape: lancement Performance Mod�le Kit de validation

Puis, en Novembre l'ann�e derni�re, le Symposium international IEEE sur la charge de travail conf�rence Caract�risation, les chercheurs ont pr�sent� une suite de tests de r�f�rence .

Le kit se compose de blocs de base de diff�rents domaines, y compris l'apprentissage automatique, compilateur, de la cryptographie et de graphiques, peut �tre Utilis� pour v�rifier le mod�le de performance .

Il est int�ressant de noter que l'�tude est termin�e et Google ensemble.

Ils seront plus de 30 millions de blocs de donn�es � la collection BHive Ceci est un bloc de base x86-64 r�f�rence de v�rification du syst�me de mod�le de performance.

Les chercheurs ont utilis� BHive ont �valu� la performance de quatre mod�les existants: IACA, LLVM-mca, Ithemal et OSACA.

blocs de base et leur d�bit pr�dit

Dans leur �valuation, Ithemal la vitesse de pr�dire le code en cours d'ex�cution puce Intel, � Plus rapide que le propre mod�le de performance d'Intel �tabli .

De plus, les donn�es chercheurs ont bien capture les propri�t�s de base de deux applications Google: Spanner et Dremel.

A ce stade, le d�veloppeur et le compilateur peut utiliser cet outil pour g�n�rer un code qui peut �tre plus rapide sur la conception de puces diverses � bo�te noire �, un fonctionnement plus efficace.

G�nie �lectrique et informatique (SIGE) Professeur adjoint Michael Carbin a d�clar�:

processeur informatique moderne opaque, terriblement complexe, difficile � comprendre. La pr�paration de ces processeurs pour effectuer aussi vite que le code informatique possible est �galement confront� � des d�fis �normes.

Cet outil est mod�lis� pour toutes les performances de ces puces, une �tape importante afin d'am�liorer l'efficacit�.

La troisi�me �tape: g�n�rer automatiquement des optimisations compilateur

Enfin, NeurIPS r�unis en D�cembre l'ann�e derni�re, les chercheurs proposent une G�n�ration automatique des optimisations du compilateur La nouvelle technologie.

Plus pr�cis�ment, ils g�n�rent automatiquement un algorithme, appel� Vemal Le code sp�cifique est converti en un vecteur, il peut �tre utilis� pour le calcul parall�le.

algorithme de vectorisation main avec compilateur LLVM respect (compilateur de l'industrie populaire) sont utilis�s pour de meilleures performances Vemal.

Le principal est d'explorer un raccord Figure politique de r�seau de neurones Pour simuler son (entier la programmation lin�aire) des d�cisions optimales prises par solution ILP est possible.

Les r�sultats montrent que la m�thode g�n�re un sch�ma de vecteur dans les param�tres temps d'ex�cution statiques et sont mieux que le heuristiques du compilateur standard de l'industrie performance.

Du MIT Computer Science et Laboratoire d'intelligence artificielle

Trois documents sont de la centrale de recherche d'intelligence artificielle du MIT - Informatique et Laboratoire d'intelligence artificielle, appel� CSAIL.

La figure centrale est Charith Mendis, trois documents, il y a deux pour lui.

Il est n� au Sri Lanka, o� le Ma�tre est venu au MIT, est ACM Fellow, disciples proches CSAIL responsables universitaires Saman Amarasinghe - le dernier �tudiant au doctorat.

2015 Institut de recherche Microsoft Redmond au nom de la pratique, la direction de la recherche principale est le compilateur, l'analyse des programmes et de l'apprentissage machine.

Il esp�re qu'� l'avenir la majorit� de l'optimisation du compilateur g�n�re automatiquement et l'apprentissage, plut�t que d'�crire manuellement. Ils produisent non seulement un code plus rapide et sera plus facile � d�velopper et � entretenir.

Et maintenant, une s�rie de travaux, se d�place dans cette direction.

La prochaine �tape imm�diate, ils forcera le mod�le � expliquer les m�thodes de recherche pour savoir pourquoi un mod�le particulier peut faire des pr�dictions.

portail

Blog Adresse:

papier Ithemal Adresse:

papier BHive Adresse:

G�n�ration automatique de papier de compilateur Adresse:

- FIN -

Qubit QbitAI � titres sur contrat

Suivez-nous, la premi�re fois inform� l'avant-garde des d�veloppements scientifiques et technologiques

Route de la soie