Allez dans cette pi�ce � la technologie Web (NoC)

Cet article est reproduit � partir de: vieux noyau de pierre conf�rence publique Auteur: Dr. Huang Lotte (savoir presque ID: En fait, je suis le vieux KMT)

La technologie de r�seau sur puce (Network-on-Chip) n'est pas une nouvelle � technologie noire �, l'invention a �t� plus de vingt ans d'histoire. Avec l'acquisition d'Intel 2018 NoC fournisseurs IP Netspeed et 2019 NoC Facebook acquisition d'une autre soci�t� Sonics, sur puce technologie de r�seau progressivement revenir � la sc�ne une fois de plus. Pendant ce temps, comme d�crit dans l'article pr�c�dent, les entreprises FPGA grand public commencent � utiliser la technologie pour construire un r�seau de nouvelle g�n�ration sur puce puce FPGA.

Li�s � la technologie de r�seau sur puce introduite en deux parties:

Partie I: D�veloppement du syst�me � noyaux multiples sur puce NoC

Partie II: multi-curs syst�me sur puce sous-syst�me d'interconnexion

Suivant le texte:

Long a dit l'un des r�seau sur puce: le d�veloppement des multi-curs syst�me sur puce NoC

Vue d'ensemble du d�veloppement d'un syst�me � noyaux multiples avec une puce sur puce r�seau,

SoC appel� �galement un syst�me sur puce, il se r�f�re � une seule puce pour mettre en uvre une puce �lectronique compl�te, m�me la plupart des fonctions du syst�me. Cette puce est au cur des syst�mes �lectroniques haut de gamme, avec le d�veloppement de la technologie de circuit int�gr� au d�veloppement progressif des syst�mes �lectroniques bas de gamme. Aujourd'hui, beaucoup comme les montres, bracelets et comme les appareils portables et les jouets intelligents et autres appareils embarqu�s bas de gamme sont �galement � un syst�me sur puce pour r�aliser la conception comme le noyau. On peut dire qu'il est devenu un syst�me sur un circuit int�gr� � puce, en particulier des circuits int�gr�s num�riques pour r�aliser la principale forme.

En raison du d�veloppement rapide de la technologie de circuit int�gr� tir�e par la loi de Moore, le nombre de transistors par unit� de surface augmente. La mise � l'�chelle Dengna De (r�duction de la zone du transistor de sorte que la tension et la consommation de courant dont il va diminuer � environ le m�me rapport. Autrement dit, si la taille de transistor est r�duite de moiti� m�me fr�quence d'horloge, le transistor de puissance volont� jusqu'� un quart). Utilisez la nouvelle technologie de circuit int�gr� permet aux concepteurs d'augmenter consid�rablement la fr�quence d'horloge de la puce, car plus de puissance augmentera la fr�quence du transistor apport� mise � l'�chelle compens�e par une diminution de la consommation d'�nergie, les performances de la puce peut compter sur l'horloge constamment mise � niveau augmenter la fr�quence pour obtenir (bien s�r, mais aussi une architecture am�lior�e, comme l'utilisation accrue de la conception de transistors de plus en plus raisonnable cache). Une telle puce int�gr�e dans le plus lorsque les transistors pour am�liorer la fr�quence d'horloge de puce pour devenir un � repas gratuit. �

Et apr�s 2005, les transistors miniatures dans une certaine mesure apr�s l'effet tunnel quantique (voir se comporter comme l'�lectronique quantique et d'autres particules microscopiques peuvent p�n�trer ou traverser la barri�re de potentiel) a lentement commenc� � intervenir pour que le ph�nom�ne de fuite du transistor a commenc� s�rieusement. ph�nom�ne de fuite semble enfreindre la loi de Deng Nade initialement propos�. Il suffit d'augmenter la fr�quence d'horloge provoquera la consommation d'�nergie de la puce est difficile � contr�ler. En plus de l'augmentation de la consommation d'�nergie de l'�lectricit� plus co�teuse n'est pas respectueux de l'environnement, le plus gros probl�me caus� par la consommation d'�nergie accrue sera convertie en chaleur. Sur la surface de la puce minuscule emball� dense beaucoup d'�nergie conduira � une augmentation de la temp�rature forte. Si la chaleur ne sont pas, la vie r�duira consid�rablement la puce m�me devenir instable. Dans ce cas, augmenter la vitesse d'horloge de la puce n'est plus un repas gratuit. Avant de ne pas r�soudre le probl�me des transistors de fuite, la fr�quence d'horloge est augment�e simplement parce que les probl�mes de refroidissement puce agent et n'est plus r�aliste. Ainsi, les fabricants de puces ont commenc� � �tudier la puce � haute fr�quence R & D ont arr�t�, tourn� vers l'architecture multi-core basse fr�quence a commenc� � �tudier, mais avec un noyau de fr�quence plus faible pour remplacer le noyau d'une haute fr�quence. Cela comprend une pluralit� de coeurs de processeur sur puce d'un syst�me sur puce est un syst�me � noyaux multiples.

Les 10 derni�res ann�es de circuits int�gr�s syst�me-sur-puce multi-core num�rique a �t� un champ chaud, de nombreux chercheurs � travers les efforts continus de la naissance d'un grand nombre de r�sultats de recherche significatifs. R�seau sur puce, la puce est essentiellement de r�soudre le syst�me multi-core, un probl�me de transmission de donn�es entre le noyau et non-core (Un cur) entre les diff�rentes unit�s de mat�riel de base � sur puce de communication � programme. Par cons�quent, pour bien comprendre le contexte du d�veloppement du syst�me sur puce, vous devez d'abord commencer par le d�veloppement du syst�me sur puce multi-core. Ou un probl�me � inutile � et � �l�phant � se produit. Cependant, en raison de diff�rents milieux et chercheurs applications syst�me sur puce multicur conduit au d�veloppement de l'�volution de plus complexe et difficile � comprendre. Quand en 2012 il a commenc� � couper et o� le rapport avec les r�seaux �quipe de recherche sur puce, en raison du syst�me sur puce multi-core pour la compr�hension est peu profonde, il y a eu de nombreux rebondissements conduit � la recherche et la d�tresse, entra�nant plus d'un an dans la stagnation globale de l'�tude.

Pour r�duire ce probl�me pour nous tous de comprendre l'impact du r�seau sur puce, comme le d�but de notre s�rie d'articles, nous allons d'abord r�sumer l'�volution de l'histoire du cin�ma et de la situation actuelle des syst�mes multi-core. Ce qui nous permet de comprendre la force motrice du r�seau, cette technologie appara�t sur puce, sur puce peut �galement voir pourquoi le r�seau a stagn� pendant des ann�es.

Evolution deux lignes syst�me � noyaux multiples sur le d�veloppement de puces

Le premier film commercial � �tre connu comme le syst�me public est l'un des fameux fournisseur de puces de processeur multi-core pour PC, AMD a lanc� l'unit� centrale de traitement dual-core ATHLON X2 Central Processing Unit (CPU), CPU paragraphe sur grand commerciale succ�s. Depuis la commercialisation de la recherche et sur la puce des syst�mes multi-core commencer apog�e. En 2005, Intel a publi� un processeur dual-core 64 bits Montecito et le processeur Cell d'IBM a publi� neuf noyau de . Apr�s 10 ans, un syst�me sur puce multiconducteur en grandes quantit�s � appliquer aux diff�rentes infrastructures de l'information, des dispositifs �lectroniques de haute performance deviennent le noyau du dispositif.

Mais en fait puce de recherche multi-core sur le syst�me a commenc� dans les ann�es 90 du milieu du si�cle dernier, au cours des 20 derni�res ann�es dans une architecture � puce multi-core est en d�veloppement constant et l'�volution. En raison des diff�rentes applications de fond universitaires et aux chercheurs d'�tudier les syst�mes multi-core sur puce d�s le d�but, il y a un � genre � clair des points. Avec l'�tude continue approfondie de la technologie syst�me sur puce multi-core appara�t branches de plus en plus. Cela permettra non seulement il est difficile d'identifier la majorit� des melons pour le peuple, pour les �tudiants de ma�trise et de doctorat grades sur puce syst�me multi-core nouvelle � beaucoup de recherches en termes de d�terminer la diff�rence et la connexion de ces technologies branches �galement pas une t�che facile.

En termes simples, un syst�me sur puce multi-core en raison de diff�rentes origines, diff�rentes applications et diff�rents milieux universitaires et chercheurs d'autres raisons, le d�veloppement de diff�rents parcours technique. Mentionn� ci-dessus l'annonce d'Intel d'un processeur Montecito et le processeur Cell d'IBM publi� au nom de deux de l'itin�raire le plus technique.

Sur ce type de puce du processeur Montecito syst�me multitraitement du syst�me Symmetric Multi-Processing syst�me (SMP), appel� Chip multiprocesseurs (CMP) (g�n�ralement domestique traduit par une seule puce multiprocesseur), principalement pour haute performance informatique � usage g�n�ral . puce de processeur de cellule sur ce type de syst�me sur une puce par le syst�me multi-core SystemOn-puce (SoC) �volu�, connu sous le nom SystemOn puce multi-processeurs (MPSoC). Un tel syst�me sur puce multi-core principalement en tant que processeurs embarqu�s haut de gamme sont utilis�s dans les communications, le traitement du signal, le traitement multim�dia. Pour la commodit� de la r�daction, ci-apr�s CMP et directement utilis� pour d�signer les deux types de processeur MPSoC.

Une architecture CMP-on-chip est g�n�ralement appliqu� sur les postes de travail du syst�me multi-core, des serveurs, et autre plate-forme informatique en nuage, un dispositif informatique � usage g�n�ral, l'application principale fonctionne normalement le calcul scientifique, simulation grande quantit� de donn�es repr�sent�e par un objet g�n�ral de calcul. De tels syst�mes sur puce multi-core utiliser le mode de programmation parall�le-parall�le des donn�es, la m�moire partag�e selon les donn�es d'�change. Ceci a l'avantage que faible effort de d�veloppement et de meilleures proc�dures g�n�rales, peuvent emprunter la m�me OpenMP c'est plus mature mod�le de programmation parall�le � d�velopper. En outre, parce que le calcul scientifique, les caract�ristiques de simulation de telles applications sont g�n�ralement de grande quantit� de donn�es, mais le programme de base est en cours d'ex�cution sur un processeur diff�rent est souvent le m�me. Par cons�quent mani�re en utilisant la m�moire partag�e peut entra�ner la pluralit� de coeurs de processeur peut facilement partager le m�me espace d'adressage virtuel, ce qui permet le m�me programme � ex�cuter sur un noyau diff�rent, il peut facilement partager le m�me syst�me d'exploitation ou facilement tout en programme de gestion.

Hydra est un processeur d�velopp� en 1996, l'Universit� de Stanford int�gre quatre processeurs de noyau , qui est consid�r� comme la premi�re avec la nature des syst�mes CMP multicurs sur puce.

La figure la figure 1 l'architecture du processeur Hydra, il est consid�r� comme le premier syst�me � noyaux multiples sur puce comprend un propri�t�s CMP

Hydra processeur MIPS en utilisant quatre coeurs de traitement, chaque noyau a une m�moire cache d'instructions priv�e (I-Cache) et un cache de donn�es (D-Cache). Deux � quatre noyau cache partag�e, un contr�leur de m�moire � travers le noyau lui-m�me (contr�leur de m�moire, MC), et un ensemble de bus et la m�moire cache secondaire (L2), une interface de m�moire principale (Interface m�moire principale) d'entr�e d'interface de bus et de sortie (I / O Interface Bus) d'interconnexion. Etant donn� que le cache secondaire est partag� sur la puce par quatre noyau, donc le noyau comprenant essentiellement quatre espace d'adressage de m�moire logique unique. Il fait �galement partager le m�me syst�me d'exploitation ou hyperviseur possible. processeur Hydra a jet� les bases pour le d�veloppement ult�rieur du syst�me d'architecture de puce CMP multicoeur, architecture multi-curs sur puce de ce syst�me est toujours affect� par l'�volution ult�rieure de la conception initiale processeur Hydra.

Le repr�sentant principal de la naissance pr�coce sont quelques-uns MPSoC int�grer des processeurs de signaux num�riques (processeur de signal num�rique DSP) et microprocesseur (unit� microprocesseur MPU) de l'ASIC. Ces puces sont principalement utilis�s dans la t�l�vision num�rique, les lecteurs multim�dias et d'autres �quipements de traitement du signal. Contrairement � la poursuite de la haute performance � usage g�n�ral de calcul, le principal probl�me des domaines d'application principaux sont MPSoC l'informatique en temps r�el. Comme les t�ches informatiques plus de certitude que les concepteurs MPSoC et les utilisateurs peuvent et doivent �tre une r�partition pr�cise des t�ches et la r�partition rationnelle des t�ches � faire face � diff�rents d�fis.

Processeur de vip�re repr�sent� sur la. figure 2, une de est le premier MPSoC par lots.

La figure 2 diagramme d'architecture de processeur Viper, qui est un repr�sentant du d�but MPSoC

Comme on peut le voir sur la figure 2, la puce enti�re peut �tre divis�e en deux sous-syst�mes ind�pendants. Respectivement CPU et coeur de CPU TriMedia (TM32) MIPS (PR3940). Compte tenu de la partie gauche du MIPS (PR3940) sous-syst�me de noyau d'unit� centrale, cette architecture de sous-syst�me est similaire � une partie du courant int�gr� puce sur puce, par exemple int�gr� UART, IEEE 1394 ou similaire du module d'interface de contr�leur de protocole. Dans la vue de c�t� droit du coeur de CPU TriMedia (TM32) int�gr� d�codeur vid�o MPEG-2 dans ce sous-syst�me, une unit� de traitement multim�dia de processeur d'entr�e vid�o, sensiblement compos� d'un processeur multim�dia d�di�. Il peut �tre clairement d�termin� que le processeur de vip�re MIPS (PR3940) les fonctions de base de l'unit� centrale d'un sous-syst�me de processeur � usage g�n�ral est responsable du contr�le et de transmission de donn�es, et pour MIPS (PR3940) noyau d'unit� centrale est principalement responsable de sous-syst�me multim�dia le traitement du signal. Deux sous-syst�mes ind�pendants par Fast C-Pont, MIPS C-pont et trois pont de bus C-pont reli�s les uns aux autres.

l'architecture du processeur Viper refl�te clairement les caract�ristiques typiques de MPSoC: en fonction des besoins de la mission sont divis�s en plusieurs sous-syst�mes ind�pendants, chacun rempli une fonction sp�cialis�e, l'ind�pendance relative entre les sous-syst�mes. Cette approche de conception de l'architecture incarne pleinement les caract�ristiques des syst�mes embarqu�s, il a �t� h�rit� et report� les chercheurs plus tard.

Syst�me multi-core sur puce RAW est la g�n�ration d'un point de rep�re. Bien qu'il ait �t� publi� en 1997, mais il a jet� le cadre de base pour les 20 prochaines ann�es l'interconnexion des r�seaux sur puce de la CMP.

Figure 3 pour la premi�re fois la structure de tuile et le r�seau d'interconnexion des puces d'architecture CMP: RAW

RAW propos� par l'Institut de technologie du Massachusetts en 1997 et scotch�e (De l�, vous pouvez voir que les Etats-Unis est un riche patrimoine de puces de syst�me haut de gamme, nous rappelons le niveau de la conception de puces en 1997 vient seulement de pouvoir entrer dans les outils EDA processus avec eux, a commenc� � faire le niveau ASIC. conception de puces de processeur Godson, un grand nombre doivent attendre la fin 2000).

architecture microprocesseur RAW utilise de mani�re division modulaire est appel�e une tuile (litt�rature en int�rieur, il y a litt�ralement des tuiles, afin d'�viter toute ambigu�t� � la fois utilis� ici pour se r�f�rer � l'original en anglais) est. De cette fa�on est la CPU, Cache priv� (L1 Cache), partagent un cache banque (L2 Cache) est (ne sais pas comment traduire cette ......), interface r�seau (r�seau d'interface NI) des ressources mat�rielles comme un b�timent s�par� carrelage. Bien rang�s selon certaines r�gles dans le plan de la puce � diff�rentes planification de la tuile, et �tre reli�s entre tuile par NoC. Carreau et en utilisant ces diviser la mani�re de pi�ce de tissu du syst�me � plusieurs noyaux que l'avantage comparatif de chaque puce structur�e, de faciliter la conception et arri�re ont une meilleure �volutivit�. Depuis lors, bien qu'il y ait une certaine division des documents de base et de l'organisation d'autres formes de publication, mais toujours absolument certains chercheurs (trolls) h�rit� bas�e sur la division et de l'organisation de carreaux.

Ensuite, un coup d'oeil � relativement pr�s du point puce architecture CMP syst�me � noyaux multiples, le processeur SPARC M7 noyau 32 . Post� le 2015 ISSCC.

la figure processeur SPARC M7 noyau 432 de la structure logique de la Fig.

Le processeur dispose de 32 noyaux, chacun des quatre composants de base d'un groupe (article intitul� SCC), un total de huit groupes. Chaque jeu interne de cache L2 partag�, mais d'autres groupes ne peuvent pas acc�der. L3 Cache est un cache global partag�, accessible par tous tous le cur. Cache L3 est �galement divis� en huit banque s�par�, et correspondant � chaque groupe �tant constitu� d'un ensemble complet de tuiles.

Pour efficacement l'interconnexion de carreaux de diff�rents chercheurs con�us sur trois morceaux diff�rents de processeur de r�seau SPARC M7. Respectivement, en utilisant l'anneau de r�seau demandant structure (Ring) (Demande de r�seau), en utilisant un r�seau de diffusion en r�ponse structure (radiodiffusion) (Les r�ponses du r�seau) et l'utilisation de la maille (maillage) des donn�es de structure de r�seau (r�seau de donn�es). r�seaux sur puce sont diff�rentes transmettent diff�rentes donn�es et informations de contr�le, de sorte que l'acc�s au cache peut maximiser l'efficacit�.

Une fois le r�seau sur les interconnexions de puce devenir la voie dominante de l'architecture syst�me sur puce multi-core CMP, l'organisation du cache sur puce en cons�quence chang�. Dans les jours de la matrice de commutation ou le bus, le temps d'acc�s du processeur est diff�rente de la Banque cache est rest� le m�me. Mais apr�s avoir utilis� l'Internet comme une interconnexion sur puce, diff�rents temps d'acc�s CPU Cache Bank a �t� impossible de garder l'accord. Ainsi, le concept est appel� une architecture de cache non uniforme (Cache Architecture non Uniform, NUCA) ont �t� propos�es. NUCA est bas� sur le probl�me de la CMP-puce multi-core syst�me sur puce r�seau qui est li� � face, mais a �galement contribu� � l'�tude de NUMA bas�e CMP sur puce continue l'�volution du r�seau syst�me sur puce multi-core avant. Am�lioration de l'efficacit� d'acc�s m�moire architecture de la puce CMP NUMA syst�me multitraitement dans des conditions, mais est aussi un moyen d'am�liorer les performances du syst�me multi-core sur l'architecture de la puce CMP. �tant donn� que cette partie de l'�tude sur la structure du grand syst�me de stockage est dans un autre domaine de la recherche en architecture du syst�me informatique. M�me au-del� de la port�e de cet article dans cette s�rie a discut�, et ne sont donc pas encore discuter.

Bien s�r, toute l'architecture de la puce CMP multicurs du syst�me depuis lors engag� sur la voie de compter interconnexion NoC. Lorsque le petit nombre de curs quand vraiment pas besoin d'envisager l'utilisation de NoC. Tels que le Zen d'AMD est pas possible de compter NoC tandis que l'utilisation de l'Internet appel� Complexe de base (CCX) de .

5 CCX interconnect�s � l'aide Zen figure, ont encore les caract�ristiques de base de l'architecture CMP

Comme on peut le voir sur la figure 5, Zen Bien que le noyau est relativement faible, mais une architecture typique CMP.

J'ai eu une longue discussion de la CMP, nous revenons � regarder MPSoC. Par rapport � la CMP r�guli�re, l'architecture sym�trique, le MPSoC est compos� de plusieurs sous-syst�mes ind�pendants de celui-ci. La figure 6 est Intel a publi� � des robots ISSCC de cette ann�e pour Robot SoC .

La figure 6 est un robot pour robot SoC, architecture typique MPSoC

Sur la figure 6, il existe plusieurs sous-syst�mes. Le premier est un processeur X86 gauche comme le sous-syst�me � temps r�el noyau, est responsable du contr�le de l'interface externe pour communiquer avec, et ainsi de SPI, I2C et une autre interface p�riph�rique est divis� en ensemble. Tensilica DSP est un sous-syst�me de traitement du signal est responsable des op�rations. Toujours sur un sous-syst�me est normalement ouvert, est responsable du traitement du c�t� audio, il doit �tre utilis� pour r�veiller la puce. Il y a la planification de chemin d'acc�l�rateur mat�riel, acc�l�rateur mat�riel de contr�le de mouvement avec CNN et une s�rie d'acc�l�rateur et acc�l�r� par le sous-syst�me d'application processeur X86 pour la mise en uvre des algorithmes d'intelligence artificielle.

La figure 7 est un robot SoC algorithme est mis en uvre, il peut �tre vu par une pluralit� de configuration de la t�che ind�pendante. Cette forme d'application est plus facilement divis�e en plusieurs sous-syst�mes ind�pendants. Ceci est �galement caract�ristiques de base MPSoC des principaux domaines d'application dans une vari�t� d'algorithmes.

La figure 7 algorithmes robot n�cessaires pour atteindre SoC

Si les sous-syst�mes de puces internes sont relation plus complexe, bien s�r, vous pouvez compter sur l'interconnexion NoC. Par exemple, la soci�t� avait �t� acquise par les sonics a donn� un tel exemple .

Application de la puce � haute performance de. La figure 8 Sonics donn�e par le r�seau de l'entreprise dans le SoC

Comme on peut le voir, il existe de multiples sous-syst�mes ind�pendants MPSoC, l'on-chip sur le r�seau est un �l�ment n�cessaire de la communication.

�pilogue

Enfin, nous r�sumons un peu:

Le syst�me multi-core sur puce est maintenant la r�alisation principale du circuit int�gr� au niveau du syst�me;

Le syst�me multi-core sur puce est divis� en deux architectures CMP et MPSoC;

CMP mode de r�alisation est principalement utilis� pour le calcul d'usage g�n�ral, ils utilisent un mode de programmation parall�le-parall�le des donn�es, la m�moire partag�e pour �changer des donn�es, la forme g�n�ralement sym�trique configuration mat�rielle tissu de puces � ADN de carreaux;

MPSoC principalement pour les appareils embarqu�s, principalement compos�s d'une pluralit� de sous-syst�mes ind�pendants, g�n�ralement � � la demande �, conception structure m�me asym�trique.

La premi�re vient ici, les prochaines discussions sur la n�cessit� d'interconnecter diff�rents syst�mes multi-core sur puce. Parlez aussi sur la fa�on de d�velopper le syst�me sur puce multi-core sur puce pour guider le d�veloppement du r�seau.

D�tails dudit deuxi�me r�seau sur puce: multi-curs syst�me sur puce sous-syst�me d'interconnexion

Dans la premi�re partie, nous avons clairement expliqu�, et sur puce syst�me multi-core est divis� en CMP et MPSoC deux architectures. l'architecture CMP dispose est l'utilisation de la m�moire partag�e aux donn�es d'�change, autrement dit, chaque coeur peut r�ellement � voir � l'ensemble de l'espace d'adressage. MPSoC plus � la pluralit� de sous-syst�mes ind�pendants int�gr�s sur une seule puce, est g�n�ralement stock� dans un espace entre � la conception de la demande �, une pluralit� de syst�mes sont g�n�ralement pas visible � l'autre.

Donc, pour CMP, il peut �tre grossi�rement divis� en une unit� centrale de traitement / sous-syst�me de m�moire et une unit� de traitement en deux parties. Le processus de l'ensemble du syst�me est plus noyau pour ex�cuter plusieurs programmes sur un espace de m�moire partag�. �tant donn� que l'espace du programme est partag�, de sorte que le programme peut �tre programm� librement entre une pluralit� du noyau, l'�change de donn�es entre diff�rents services de base est relativement facile. Pour que le processus d'�change de donn�es peut �tre comprise comme unit� CPU / processeur de donn�es �chang�es entre la m�moire partag�e et la m�moire priv�e / remplacement du cache ligne.

Si ce processus est extrait, vous pouvez voir ci-dessous ce chiffre.

La figure 1 est bas� sur le syst�me de NoC de l'abstraction de l'architecture logique de la puce multicoeur CMP de

Comme on peut le voir sur la figure 1 LLC (dernier niveau du cache) peut �tre divis�e en plusieurs banques, mais la r�gion logiquement partag�e est termin�e. Et chacun des Core cache L1 est ind�pendant de l'autre, on peut voir que l'ex�cution d'applications ou de processus diff�rents sur diff�rents noyaux.

L'�change de donn�es entre les diff�rents niveaux de la m�moire repr�sent�e sur la figure.

L'�change de donn�es entre les diff�rents niveaux de la m�moire de la figure.

Comme on peut le voir sur la figure 2, pour remplacer l'ensemble de la relation d'�change de donn�es avec la m�moire cache. Lorsque cache Mlle se produit, L1 va chercher des donn�es dans la LLC. Lorsque la LLC est �galement miss, la m�moire externe � la puce par l'interm�diaire du contr�leur de m�moire d'extraction de donn�es (m�moire). Ainsi, alors que le programme fonctionne, en fait, nous continuerons en raison du comportement pr�c�dent d'acc�s m�moire cache de Mlle g�n�r� se produit. Et quand, en raison LLC est partag�e, de sorte que chaque noyau peut acc�der � l'ex�cution de toute la LLC. Cela cr�e un probl�me de conflits d'acc�s.

Si nous voulons liaisons entre les divers bus et Core LLC, le bus lui-m�me est devenu une ressource comp�titive. Et si nous utilisons un r�seau sur puce et Internet de base LLC, sera violation d'acc�s en grande partie la digestion. Ainsi, l'architecture du syst�me CMP pour une puce multi-core, le but est d'utiliser violation d'acc�s de digestion NoC. Et aussi en raison des protocoles de coh�rence du cache produit beaucoup de trafic en cours d'ex�cution sur le NoC. Ainsi, dans une architecture de syst�me multi-core feuille CMP et NoC cache g�n�ralement consid�r� comme ensemble la conception collaborative et l'optimisation, collectivement appel�s � Un syst�me-Core �.

Une analyse plus approfondie peut �tre trouv�e, apr�s l'utilisation d'interconnexion NoC, les contr�leurs de m�moire deviendront une des ressources � concurrentiels �. Banque Mlle se produit apr�s chaque LLC a besoin d'un acc�s m�moire hors puce externe � travers elle. Par cons�quent, afin d'am�liorer la conception de la pluralit� d'exigences de bande passante d'acc�s � la m�moire et la puce de contr�leur de m�moire de dessin pour transmettre une pluralit� de canaux de donn�es.

l'architecture figure CMP sur la feuille 3 et le syst�me de base l'interface des options de connectivit� IP

Comme on le voit dans la fig. 3 , quatre contr�leur DDR2 dans la puce. Chaque DDR2 plus d'une puce contr�leur et les noeuds de r�seau. D'autres, comme le contr�leur PCIe Ethernet est une connexion similaire.

Dans l'ensemble, la CMP en pr�sence d'un grand nombre de ressources partag�es, l'utilisation de NoC atteindre l'objectif fondamental de l'interconnexion sur puce est possible digestion, violation d'acc�s facilit� aux ressources partag�es. NoC et doivent donc �tre consid�r�s ensemble comme � Un syst�me-core � co-optimisation de ces ressources.

interconnexion MPSoC en plus comme une pluralit� de sous-syst�mes interconnect�s par une forme de bande. abstraite particuli�re comme indiqu� ci-dessous:

La figure 4 NoC sur la base de l'architecture du syst�me d'une abstraction de MPSoCP logique � puce multi-core de

Comme on peut le voir sur la Fig. 4, le r�seau d'interconnexion sur puce MPSoC chaque �l�ment de traitement (PE) est relativement sous-syst�mes ind�pendants. section de stockage ne communique pas entre les diff�rents sous-syst�mes en g�n�ral, pas un espace de stockage partag� pour stocker et partager des donn�es des programmes parall�les. Chaque sous-syst�me de fonctionner ind�pendamment, effectuer chaque diff�rentes t�ches. Une fois que les donn�es ont �t� trait�es, il est envoy� aux prochains besoins de nud pour continuer le traitement par l'interm�diaire d'un r�seau.

La figure 5 est une affaire pratique sur la base du syst�me de NoC de la feuille de MPSoCP architecture multi-core

Si elle est trop abstraite aussi. La figure 4, puis 5 est un exemple sp�cifique de la figure. Ceci est un MPSoC pour la communication sans fil, comportant une pluralit� d'unit�s de traitement et des circuits d�di�s travailler de fa�on autonome. Au sein de chaque cellule est un processeur RISC, DSP +. En programmant ces PE, il peut soutenir de fa�on flexible le protocole de traitement de communication sans fil multiples. L'utilisation de but NoC est d'accro�tre la flexibilit� et r�duire la complexit� des interconnect�s reli�s entre eux.

Il existe une m�thode de conception pour un syst�me bas� sur l'architecture NoC MPSoCP puce multicoeur, appel�e la m�thode de cartographie sur la t�che de la figure. Il est essentiellement n�cessaire pour compl�ter le syst�me est divis� en un grand nombre de t�ches et d�pendances entre le trafic et les t�ches repr�sent�es sous la forme de la figure. processus de conception MPSoC, peut �tre vu dans les t�ches assign�es figure � un processus de travail de l'unit� de traitement correspondant. 6 repr�sent� sur la figure.

La figure 6 est une carte sch�matique de la Fig.

En ajustant la position plus souple t�che dans le syst�me peut �tre mis en correspondance, et donc jouer un r�le dans la r�duction du trafic et des conflits.

Dans la phase de conception de la mise en uvre, la cartographie est appel�e une carte statique. Les deux t�ches et PE statique, la sortie finale correspondante est une conception de MPSoC d�di�. NoC correspondant peut �galement �tre personnalis�e optimisation. Mapp�e pendant la phase de fonctionnement est appel�e le mappage dynamique, l'application est suppos� que les modules individuels sont communs � PE. Cartographie dynamique fait moins fr�quente dans les applications r�elles, mais il est la recherche universitaire � habitu�s �. Parce que la recherche � l�g�re � peut �tre atteint par cette m�thode, la situation pas trop intense peut obtenir une � recherche �.

Bien s�r, maintenant il est vraiment le processeur, CMP et deux architectures MPSoC coexistent en fait. Ainsi Arteris support sensiblement simultan�ment les deux formes de fusion NoC r�seau, modes de r�alisation sp�cifiques, comme indiqu� sur la Fig.

L'int�gration des deux exigences d'architecture d'interconnexion de la figure 7 Arteris donn�es par la soci�t�

Figure 7 ncore Cache Coherent Interconnect est interconnect� avec le protocole cache de coh�rence, nous pouvons voir c'est un sous-syst�me d'infrastructure CMP tr�s importante. Et FlexNoC sous-syst�me non-coh�rent d'interconnexion p�riph�rique est utilis� pour les syst�mes d'interconnexion ou acc�l�rateur de plusieurs ind�pendants.

Cliquez ici pour lire le num�ro d'origine pour voir l'industrie des semi-conducteurs, le public pertinent quoi?

Route de la soie

Apprenez � conna�tre la Chine

Allez dans cette pi�ce � la technologie Web (NoC)

Long a dit l'un des r�seau sur puce: le d�veloppement des multi-curs syst�me sur puce NoC

D�tails dudit deuxi�me r�seau sur puce: multi-curs syst�me sur puce sous-syst�me d'interconnexion