La loi de Moore AI et le d�veloppement acc�l�r� du ralentissement affectent la conception de eFPGA 7nm?

AI se d�veloppe rapidement, la demande de puissance et � plus grand nombre puce m�moire et plus, mais la loi de Moore ralentir ou m�me pas faire la puce en utilisant la technologie de semi-conducteurs pour am�liorer les performances de la puce et l'efficacit� �nerg�tique de plus en plus difficile. � ce stade, les deux derni�res ann�es dans le march� des puces est encore dominante g�ants de la technologie de puces ont d�velopp� puce AI, un nouveau type de puce et la technologie ont commenc� � �merger. Ainsi, eFPGA Cette technologie int�gr�e FPGA sera de savoir comment promouvoir le d�veloppement de la grippe aviaire? conception eFPGA comment 7nm affecter le d�veloppement de la grippe aviaire?

Le droit et le d�veloppement acc�l�r� du ralentissement de AI Moore

AI permet le d�veloppement rapide de l'assistant vocal intelligente est presque devenu un t�l�phone mobile standard, mais aussi haut-parleurs intelligents exp�ditions augmenter ann�e apr�s ann�e. En m�me temps, de plus en plus de t�l�phones mobiles utilisent la technologie AI pour optimiser l'effet de l'album photo et cam�ra sont class�s. Mais ce ne sont que quelques-unes des techniques d'intelligence artificielle communes � ce stade de l'application �volutive, nous algorithmes AI AI sont combin�s avec plus d'industries et d'applications, de nouveaux algorithmes AI, quelle que soit la m�moire de comptage de la puce et donc la force ou mettre en avant des exigences plus �lev�es, toutes les soci�t�s de premier ordre AI dans la recherche de performances plus �lev�es, une faible consommation d'�nergie, surface de la puce plus petite.

Revenant sur l'histoire de la performance de la puce, entre 1986 et 2003, la performance de la puce et la consommation d'�nergie continue de diminuer apr�s 2003, en vertu des avanc�es de performance multi-core dans la conception de la puce et le processus de semi-conducteur est toujours dans la mise � niveau, mais la loi de Moore il a clairement ralenti. Apr�s 2015, de plus en plus difficile de mettre � jour la puce, la discussion sur la loi de Moore, de plus en plus d'�checs.

Les slows loi de Moore

Par cons�quent, CPU, GPU, FPGA, am�lioration de la performance ASIC et faible consommation d'�nergie font face � des d�fis croissants, en outre, � partir de 7 nm nud 16nm, les co�ts de fabrication de puces sont �galement consid�rablement augment�. Pour une vitesse de calcul, le transfert de donn�es, besoins en bande passante m�moire sont �lev�s puce AI, comment obtenir une meilleure performance par watt et � moindre co�t?

Comment changer l'architecture AI eFPGA de?

Pour puce AI, la conception de puces de plus en plus d'entreprises utilisent l'architecture multi-core h�t�rog�nes pour am�liorer l'efficacit� de la puce pour r�pondre aux besoins des algorithmes d'apprentissage en profondeur. En plus d'une architecture multi-core h�t�rog�ne, l'architecture de noyau en b�ton sont constamment optimis�s aussi pour AI, FPGA ne fait pas exception. Il est int�ressant de noter, a �t� cr�� en 2004 et son si�ge social aux �tats-Unis Achronix fournit une technologie FPGA embarqu�. Le Achronix Speedcore IP peut �tre int�gr� dans un ASIC SoC et int�gr� FPGA (eFPGA), comme un co-processeur et des acc�l�rateurs mat�riels peuvent �tre configur�s pour supporter une vari�t� de t�ches, dont le bit de guidage (orient� bit) FPGA l'architecture, que l'architecture CPU (orient�e mot) ax�e sur le terrain est plus efficace pour d�sinstaller SQL, le traitement d'E / S en ligne, le cryptage, l'acc�l�ration algorithme de recherche du moteur et de traitement multim�dia des fonctions am�lior�es.

Selon Lei Feng r�seau � comprendre, Achronix est la seule entreprise � offrir la technologie eFPGA a �t� int�gr�e dans la production de masse de la soci�t� ASIC, Speedcore IP nuds de processus applicable, y compris TSMC 16nm FF + et Intel 14nm FinFET, et a annonc� qu'il commencera la premi�re moiti� de 2019 fournir quatri�me g�n�ration Speedcore eFPGA IP 7 nm adapt� aux processus TSMC.

Achronix vice-pr�sident du marketing Steve Mensor

En plus de supporter la plupart des proc�d�s de fabrication de pointe, de 7 nm eFPGA �galement optimis� l'architecture, ce qui est tr�s critique pour le processeur de la machine d'apprentissage (MLP) a augment� module d'unit� logique de biblioth�que de ressources Speedcore �tre fournie. Steve Mensor vice-pr�sident du marketing chez Achronix exprim�: � module MLP est un moteur de calcul tr�s flexible qui est �troitement coupl� � la m�moire, l'utilisation des propri�t�s sp�cifiques de l'intelligence artificielle et processus d'apprentissage de la machine, les performances de ces applications peut augmenter de 300%. tout en am�liorant le rendement et le nombre d'op�rations par cycle d'horloge, un MLP dans un cycle d'horloge pour effectuer un calcul de 16 x 16, 8 x 88 de calcul, le calcul est 126 � 6, 164 � 4 op�rations ".

Les types de donn�es peuvent �tre tr�s pr�cieux pour l'apprentissage de la machine, MLP est rapport� pour soutenir divers formats � virgule flottante fixe et, y compris peu Bfloat16,16, demi-pr�cision, bloc unit� de virgule flottante 24 et, en fonction de l'application peut �tre s�lectionn�e qui est meilleure pr�cision la pr�cision et des performances �quilibr�es. Quant � la question de savoir si l'accent sera mis sur les types de donn�es pris en charge par le support, Steve leur a dit Feng Lei r�seau eFPGA supporte tous les types de donn�es, qui sont les avantages de la ligne programmable FPGA.

Bien que capable de supporter tous les types de donn�es, mais l'acc�s aux donn�es de consommation d'�nergie est plus que le probl�me de la consommation d'�nergie calcul�e tous les jetons AI doivent faire face. � cet �gard, Steve dit: � MLP Chaque cycle comprend un fichier de registre (Fichier registre Cyclique), pour stocker des donn�es ou du poids de r�utilisation, sans passer par le LUT, d'am�liorer les performances de traitement tout en r�duisant la consommation d'�nergie. �

En outre, on calcule pour l'application de l'apprentissage machine densit� relativement �lev�e, si pas en mesure de r�pondre � l'opportunit� MLP, la table de Speedcore Gen4 (LUT) en tant que compl�ment, peut �tre mis en oeuvre ind�pendamment FPGA de deux fois plus �lev� multiplicateur.

Non seulement les performances d'apprentissage de la machine, Steve a dit: �Notre unit� logique 7nm eFPGA, le c�blage, l'architecture de routage, la m�moire est am�lior�e � Plus pr�cis�ment, la table de consultation d'une am�lioration globale, y compris les changements � l'ALU taille double le nombre doubl� de registres chaque LUT, un certain nombre de fonctions de support et sept huit fonctions, et fournit un registre � d�calage d�di� � la liaison � haute vitesse, ce qui r�duit la zone et la consommation d'�nergie et d'am�liorer le rendement. En outre, l'architecture de routage obtenu � partir d'une structure s�par�e, bus d�di� am�lior� de routage, la structure de routage d�di�e multiplexeurs de bus, peut cr�er effectivement distribu�, la configuration de l'ex�cution r�seau de commutation, et premi�re fois � appliquer � l'optimisation du r�seau d'interconnexion FPGA de l'industrie.

conception de la puce et de l'architecture optimis�e dans le processus de bienfait 7 nm, Speedcore Gen4 d'augmenter les performances de 60%, les performances d'apprentissage de la machine une augmentation de 300 pour cent et la consommation d'�nergie de 50%, une r�duction de 65% de la superficie de la puce.

mise � niveau Speedcore Gen4 FPGA

Tout en poussant IP et 7 nm eFPGA application ind�pendante FPGA ne AI

AI que de changer la structure des aspects eFPGA, Steve 7nm repr�sente noeud de processus TSMC Speedcore Gen4 sera dans la production de volume de la premi�re moiti� de 2019, et fournira Speedcore Gen4 eFPGA pour le nud de processus de 16nm et 12nm TSMC dans la seconde moiti� de 2019 IP.

Lei Feng r�seau not�, non seulement dans la fourniture de noeud Achronix IP eFPGA 7 nm, fournit �galement FPGA die peut �tre emball� avec le SoC, et introduira �galement un des dispositifs ind�pendants de FPGA. Quant � savoir pourquoi la fourniture Achronix IP pour lancer un FPGA ind�pendant dans le noeud 7 nm, Steve a dit: � Il est plus d'une consid�ration en fonction des besoins des utilisateurs dans l'application de l'intelligence artificielle, d'acc�l�rer le centre de donn�es, 5G, a un pilote automatique diff�rent. besoins assez de FPGA plus ind�pendants pour leur permettre d'application plus rapide dans le centre de donn�es, pour obtenir l'acc�l�ration, mais aussi pour mieux r�pondre aux besoins du montant de la puce 7nm FPGA petites entreprises. ceux qui sont plus sensibles aux co�ts et surface de la puce, ou si vous voulez conception AI des soci�t�s de premier ordre de performance plus �lev�, vous pouvez s�lectionner IP. bien s�r, les entreprises SoC peut choisir la technologie d'emballage droite, nous allons mourir avec eux l'encapsulation SoC, obtenir un meilleur rendement ".

Luo Wei, directeur g�n�ral de l'Asie-Pacifique Achronix lumineux

Bien s�r, le mat�riel est fondamental, le logiciel jouera �galement un r�le de plus en plus important dans l'IA, de nombreuses soci�t�s de conception de puces ont commenc� � coop�rer davantage avec la soci�t� de logiciels dans l'�re AI, mais lors de la conf�rence de presse, en plus des outils de conception ACE Achronix et aucun autre logiciel pour l'IA. Steve a dit ceci: � Nous, comme en plein d�veloppement, mais l'�chelle est pas grande entreprise assez, actuellement, nous fournissons principalement un puces diff�rentes stables et rentables au niveau du mat�riel, nous le ferons Libiary plus haut niveau, le logiciel est plus en collaboration avec des partenaires. "

Qui a besoin moindre co�t eFPGA 7nm?

Jusqu'� pr�sent, nous avons appris, en termes de conception architecturale ou du c�t� de la demande, eFPGA sont optimis�es, mais il y a une question tr�s critique est de traiter 7 nm de 16nm mis sur la performance, la consommation d'�nergie face � l'am�lioration des co�ts semble assez attractif . Alors que Steve, entreprise de conception puce eFPGA 7nm prix d'achat IP et 16nm eFPGA IP par rapport au prix n'a pas augment�, mais les co�ts de production ont fortement augment�, ou faire beaucoup de soci�t�s de conception puce prohibitif.

Steve repr�sente, 7 nm eFPGA principal march�, y compris les exigences de prix et de performance de calcul de l'acc�l�ration du centre de donn�es, le calcul d'un bord de la faible consommation d'�nergie de l'informatique, de faible consommation d'�nergie et faible co�t de la m�moire, des performances �lev�es et une faible consommation d'�nergie requise il infrastructure programmabilit� 5G, l'acc�l�ration r�seau / carte � puce, pilote automatique.

march� eFPGA 7nm

Cependant, certaines applications sont des march�s potentiels, d'autres sont un facteur cl� de Achronix lanc� eFPGA 7 nm. Steve a dit: � � l'heure actuelle, nos revenus sont les deux applications l'infrastructure 5G et les cartes � puce les plus importantes (SmartIC), 5G haute performance et les exigences de faible puissance de la puce, donc beaucoup d'entreprises utilisent maintenant FPGA pr�c�demment transf�r�s � ASIC, mais il a besoin d'une certaine flexibilit� pour r�pondre aux changements dans l'accord. carte � puce est ensuite trait�e des donn�es avant la transmission de donn�es, nous savons que la quantit� de donn�es et la complexit� des donn�es augmentent, de sorte que ces deux sc�narios pour 7nm eFGPA a une tr�s grands centres de donn�es � la demande, et automatis�e de conduite, effacer tous les besoins de stockage, comme les bords calculer la plus appropri�e sc�ne que vous devez voir le d�veloppement du march� ".

Il est �galement � noter que, afin d'acc�l�rer l'application du centre de donn�es de la charge de travail d'apprentissage de la machine et de l'automobile, la combinaison eFPGA Achronix avec la m�moire de GDDR6 Micron, dans la quatri�me g�n�ration am�lioration eFPGA 8 GDDR6 de l'interface m�moire � travers laquelle les esp�ces de la solution mixte, la profondeur du r�seau de neurones peut traiter de grands ensembles de donn�es comprend le stockage, et le param�tre re-pond�ration activation de m�moire; n�cessit� de remettre en question le magasin de mat�riel sous-jacent, de traiter et d'autres donn�es en mouvement rapide entre le processeur et la m�moire.

Lei Feng r�seau R�sum�

algorithmes AI sont constamment it�ration et le d�veloppement, et donc plus polyvalent de la CPU, GPU, bien que capable de compl�ter l'algorithme correspondant, mais de plus en plus inefficace et plus co�teux, qui a favoris� les innovations d'architecture de puce. Nous voyons de plus en puce multicur plus h�t�rog�ne utilise AI pour am�liorer la performance et l'efficacit� gr�ce � diff�rents portefeuille de base pour mieux r�pondre aux besoins de l'IA.

De l'am�lioration Achronix eFPGA de nous voyons aussi que dans l'unit� logique, le routage, l'architecture de routage ont �t� am�lior�s, et une augmentation du MLP, de r�duire le traitement des donn�es de consommation d'�nergie, �galement �quip� d'une m�moire sur puce, et afin de r�soudre l'�tude approfondie le probl�me inh�rent, le premier � soutenir GDDR6 dans le FPGA.

puce AI AI est de promouvoir l'application de l'intelligence artificielle pour aller de l'avant dans cette interaction.

Route de la soie

Apprenez � conna�tre la Chine

La loi de Moore AI et le d�veloppement acc�l�r� du ralentissement affectent la conception de eFPGA 7nm?