Superordinateur japonais plus: Post-K Fujitsu a annoncé les détails de la super processeur informatique

Superordinateur a une forte capacité de calcul et des données de processus, Les principales caractéristiques de la performance de haute vitesse et de grande capacité, et avec une variété de périphériques externes et riche, système logiciel haute performance . la vitesse de calcul de super-ordinateur existant peut atteindre la plupart des plus d'un billion de fois par seconde . Ce vaste système informatique est utilisé principalement de réaliser d'importants la recherche scientifique, la tâche de calcul à grande échelle de la défense nationale et de l'économie nationale dans le domaine de la technologie de pointe et le traitement des tâches données: un large éventail de prévisions météorologiques, des photos satellites de consolidation, l'exploration de la physique nucléaire, la recherche de missiles intercontinentaux, engins spatiaux etc., pour élaborer les plans nationaux de développement économique.

2016, Chine " Divinité Taihu Lumière « (9,3 quadrillion opérations en virgule flottante par seconde) et " Tianhe-2 " A remporté le champion et la deuxième place Le troisième à la dixième place ont été les États-Unis de "Titan", "Sequoia", "Corey (Cori)", "Oakforest-PACS", "Pékin (Kyo)" du Japon, la Suisse « au nom du pic Bryant « et l'Amérique » Mira « et les » Trois Ones ".

Maintenant, super-ordinateurs sont utilisés pour étudier le domaine national de haute technologie de la technologie nationale et de pointe , Mais aussi une force au niveau national de la recherche scientifique et le développement technologique reflète .

Dans le domaine de calcul intensif, il y a un classement bien connu liste « TOP 500 ». La liste a commencé en 1993, est un classement mondial des supercalculateurs bien connus installés « rangée de sièges » dans Les États-Unis et en Allemagne Préparée conjointement experts Supercomputer, la liste publiée tous les six mois.

Carte | (Source: TOP500 site officiel)

Parmi eux, superordinateur japonais " Pékin " 2011 avait obtenu TOP 500 titre de la liste , Fujitsu a développé conjointement par RIKEN au Japon, Pour Juin 2018 a chuté à 16 dans le monde . Fujitsu a déclaré qu'il envisage de développer la prochaine génération de supercalculateurs ( Code postal-K ) Superordinateur mondial reprendre la première place Sa performance sera maintenant 100 fois « Pékin », alors que la consommation d'énergie est seulement trois fois.

Post-K utilisera un A64FX processeur nouvellement développé, tournant ARM architecture, il sera lancé en 2021. Dans la Silicon Valley cette année Hotchips réunion sur la structure détaillée et Fujitsu présente invention concerne les performances processeur A64FX.

La figure Shu disposé super-ordinateur Fujitsu

8786000000 A64FX les transistors utilisés technologie des procédés FinFET 7 nm. Ce sera la première mise en uvre du vecteur de bras extensible (Scalable Vector Extensions / SVE) processeur Ceci est spécialement conçu pour un jeu d'instructions de calcul à haute performance.

En Juin, Fujitsu a commencé la production d'un prototype du processeur et de commencer les tests préliminaires ont révélé également quelques détails fondamentaux de la CPU, Qui comprend un certain nombre de noyaux (noyau plus 48 calcule quatre noyau auxiliaire) et SIMD largeur de vecteur (512) . Lors de la réunion de Hotchips, Fujitsu Toshio Yoshida (Toshio Yoshida) micro-architecture et son profil de performance dans l'étude plus approfondie.

Carte | (Source: TOP500 site officiel)

En vitesse de calcul, comme la première puce Arm SVE, A64FX offre des données de performance de bonne virgule flottante: système 64 bits (FP64) par seconde peut faire plus de 2,7 billions d'opérations à virgule flottante, la vitesse du système 32 bits (FP32) est de 5,4 billions de fois par seconde, le système 16 bits (FP16) plus de 10,8 billions de fois par seconde . Après les deux systèmes est particulièrement important pour les applications d'apprentissage en profondeur, l'utilisation de précision inférieure FP32 et FP16 traditionnellement utilisé pour former le réseau de neurones.

A64FX également obtenu le format 16 (INT16) et produit scalaire entier de 8 bits (INT8), le même raisonnement peut être utilisé dans le réseau. Fujitsu dit, en utilisant INT8 nouvelle CPU peut atteindre plus de 21,6 billions d'opérations par seconde, INT16 peut atteindre plus de 10,8 billions d'opérations par seconde .

Bien que les performances en virgule flottante A64FX digne de reconnaissance, Mais il est seulement d'environ 35% plus rapide que le plus avancé CPU Xeon Skylake, 20% plus lent que maintenant défunte CPU Xeon Phi . Pas difficile d'imaginer, que ce soit en utilisant les processeurs CPU Xeon ou Ice lac non confirmées Xeon AP, Intel produira CPU plus haut débit est super-ordinateur Aurora ExaScale en 2021. D'autre part, Fujitsu fournit maintenant que les performances bas de gamme des estimations de A64FX, cela implique que d'autres tests seront publiés quelques années après le lancement des informations contenues dans la puce finale.

Bien que toutes les opérations à virgule flottante vitesse de super-ordinateurs, mais il ne nous laisse savoir le nombre de processeurs requis quadrillions ordinateur secondaire. En utilisant une estimation prudente de 2,7 billions de fois par seconde, plus de 370.000 jetons doivent atteindre un pic, et sur le Linpack atteint ou applications intensives en virgule flottante réel peut exiger un pic 400000 .

Parce que les plans Fujitsu pour placer un processeur A64FX seulement Post-K dans chaque noeud, de sorte que le processeur est 400000 l'ordinateur de noeud. Post-K pour chaque rack 384 noeuds, une pluralité de tels supports 1000 dans l'ordinateur exascale finale . Si la puce est de continuer à améliorer au cours des deux prochaines années, de plus en plus de calcul de pointe à nouveau.

Le processeur de noeud tellement, ce qui indique la nécessité de capacités d'interconnexion informatique de haute performance. A cet effet, A64FX sera équipé d'un contrôleur de réseau sur puce, La transmission des données appelées « tofu » réseau d'interconnexion massivement parallèle . Pour la post-K, cette structure serait un maillage de dimension 6 / réseau de tore, qui comporte six axes: X, Y, Z, A, B et C, chaque processeur (noeud) fournit deux canaux, chacun il y a 10 canaux 28,000 mégabits par seconde port. Chaque processeur de noeud ou de la vitesse de transmission pouvant aller jusqu'à 560000 mégabits .

La figure | « ou tofu « comment générer un lien réseau entre un noeud (Source: IEEE Computer Society)

Post-K Une autre place importante est la bande passante de la mémoire . A64FX en utilisant la mémoire paquet 32GB HBM2 fournit jusqu'à 1024 GB / s vitesse de chaque CPU. Selon la déclaration de Fujitsu, Ils peuvent atteindre plus de 830 Go / taux de référence de flux Triad , Plus de 80% du processeur de bande passante maximale . Fujitsu aucune mention de la puce de telle est reliée à une mémoire classique DDR.

Intérieurement, le noyau est divisé en quatre 48 + 4 la mémoire de noyau de groupe, appelé aussi CMG. CME est un noyau 13, un noyau 12 et un noyau auxiliaire de calcul. CME OS Fonctions de traitement tels que E / S et le démon de traitement. Chaque noyau 13 est équipé d'un cache L1 de 64 Ko, la vitesse peut être transmis au-delà des 11 données du CT / sec . GCM et chacun est équipé de 8 Mo de cache, courir plus vite que 3.6 TB / s. Contrôleur de mémoire cache L2 reliée à l'interface et un réseau sur puce (NoC) a. connexion NoC peut être généré et d'autres CMG, contrôleur réseau tofu et PCIe.

puce figure Shu A64FX structure interne (Source: site officiel TOP500)

En moyenne, A64FX plus vite que le SPARC64 XIfx (CPU haute performance avant Fujitsu) 2,5 fois plus rapide Pour le calcul de la charge de travail haute performance et l'intelligence artificielle. A64FX vitesse de fonctionnement hydrodynamique et champs d'ondes sismiques particulièrement rapide, respectivement, 3,0 fois et 3,4 fois plus rapide que SPARC64 Xifx.

la performance figure Shu A64FX en calcul haute performance et de l'intelligence artificielle (Source: site officiel TOP500)

Du côté logiciel, la machine post-K clients Fujitsu et RIKEN au Japon sont le processeur A64FX et le système lui-même pour développer des logiciels. développeur basé bras de systèmes logiciels et outils de Linaro et une variété de développeurs open source et logiciels indépendants seront également présents. Devrait 2021, Fujitsu développera un ensemble de composants logiciels de calcul haute performance, y compris Linux, C / C ++ et Fortran, débogueurs, MPI, OpenMP, bibliothèques mathématiques, comme Explorer et Luster .

Pékin a ouvert un dépanneur deux jours seulement personne n'a été poursuivi inventaire
Précédent
Maintenant, le « plus grave » de légumes verts à feuilles, hypolipidémiant du froid repousser ou ennemi juré de l'estomac!
Prochain
L'introduction d'un développement de haute qualité de l'industrie du bambou dans le Sichuan « feuille de route » pour faire le bambou est devenu un paysage de belle campagne
IT dirigeants le temps d'inactivité est quoi?
consultations économiques et commerciales sino-américaines pour parvenir à un consensus en principe sur les grandes questions, comment comprendre?
« Levez la route de la richesse du pavillon, naviguer dans une nouvelle ère de » développement de l'économie privée et écrire un nouveau chapitre dans le Sichuan
Un renversement de la montée de la route « fraude », la Licorne britannique, ainsi que son « Apple-style »
Haute densité de haute technologie nouveau terme dans le travail du gouvernement rapport
le plus grand A380 d'avions de passagers ne sera plus au monde, « Big Mac » Pourquoi « de la mort prématurée »?
Diamant baccalauréat Mme Yu: la technologie de l'intelligence artificielle pour voir, sa petite amie a dû compter sur le destin
Lancer de poids Femmes voitures de luxe stationné vibrato en bordure de route, lumineux opération de police de la circulation Shenzhen!
commentaires des médias britanniques a raté le tableau la plus forte Coupe du Monde 11: 2 King a conduit le Real Madrid à Manchester City cheval regret
4 semaines bébé dormir avec leurs parents étaient en vie Jisi
La dernière étude du MIT: la ségrégation des chromosomes des cellules épithéliales ne peuvent pas être aussi facile que vous le pensez