AMD champ d'atterrissage de l'apprentissage de la machine, et Nvidia, Intel opération AI mis en scène « Trois tués, »

Au cours de la dernière décennie, GPGPU (GPU Computing à usage général, avec les tâches de calcul GPU) d'onde est complètement dirigée par NVIDIA, leur GPU ciblé sur le développement de l'intelligence artificielle et de plate-forme informatique de réseau de neurones de choix. NVIDIA a même commencé la transition, se positionne en compagnie de calcul AI, pas seulement les développeurs graphiques de jeux PC les yeux de l'utilisateur.

NVIDIA dans le calcul de la forte AI, donc Intel sentir la pression intense - tenir dans une main le grand mouvement sera d'apprendre la profondeur de l'accélérateur raisonnement et 72-core puces Xeon Xeon Phi sur le marché en 2017, constitue la gamme de produits Intel AI " Twins « (voir article). D'autre part, la technologie brevetée de GPU, tourné à coopérer avec l'ancien rival AMD, plutôt que le point de moyens « anti-Cao Shu commune » - il semble NVIDIA est le développement à long terme de son grand rival de l'entreprise.

En revanche AMD côté, non seulement la tenue d'une nouvelle architecture CPU Zen ( « Zen »), être connu l'année prochaine sur le marché du PC et le serveur d'embarras Intel, tout en restant dans bat son plein pour préparer une nouvelle architecture GPU Vega ( « Vega »), pour préparer l'année prochaine pour briser le NVIDIA monopole sur le marché graphique haut de gamme. Cependant, prêt à retourner, « les entreprises agricoles » ne répond pas au concours dans les jeux de cartes CPU et vidéo les zones traditionnelles et les anciens rivaux, mais courir après leurs talons dans les opérations sur le terrain AI.

puce traditionnelle géante rouge, bleu, plante verte ouvrira trois nouveaux tués dans la bataille.

9 décembre Lei Feng réseau a obtenu les nouvelles, AMD a organisé un professionnels secrets pour mener à bien la description du produit sur la Vega. Maintenant, une partie de la réunion a finalement été exposé - AMD annonce une nouvelle AI informatique sous-marque « Radeon Instinct », et attaché à deux gammes de produits de la marque: un accélérateur de produits matériels et plate-forme logicielle ROCm. AMD va les utiliser pour fournir des solutions pour la combinaison du matériel et des logiciels pour les clients supercalculateur.

deux principaux produits de Radeon Instinct: accélérateurs matériels et logiciels ROCm

Trois accélérateurs matériels

Du côté matériel, AMD a affiché un total de trois produits - sont basés Polaris ( "Polaris"), Fidji ( "Fidji") et Vega apprentissage en profondeur accélérateur MI6, MI8 et MI25. Parmi eux, le plus calcul MI25 de puissance est un accélérateur de formation AI, les deux premiers sont un accélérateur raisonnement.

  • MI-6 en utilisant Polaris 10 sur le noyau (core RX 480), mais la mémoire est augmentée à 16 Go, et ne pas prendre de ventilateur de refroidissement passif (mais en utilisant le système de refroidissement du serveur), capacités de virgule flottante 5700000000000 par seconde.

  • MI8 petite taille de certains, parce qu'elle est basée sur l'architecture Fidji R9 Fury graphiques Nano. Il utilise la même fréquence et Nano, la même 4 Go de mémoire, parce que c'est la première génération Nano est équipé d'une mémoire HBM peut prendre en charge jusqu'à 4 Go. Lei Feng réseau a été informé que les médias étrangers ont été interrogés, mais on ne sait pas si cela apportera les goulots d'étranglement des applications d'apprentissage profondeur. Il en virgule flottante puissance de calcul de 8,2 téraflops.

  • Basé sur l'architecture de la prochaine génération MI25 Vega a attiré l'attention médiatique mondiale. Malheureusement, AMD n'a pas donné beaucoup d'informations, en disant seulement qu'il utilise 10 noyau Vega, les médias participants infère ses opérations à virgule flottante par seconde capacité d'environ 12500000000000 fois. Mais d'autres ont émis l'hypothèse qu'il est un accélérateur de cartes GPU dual-core, comme Pro Duo. Cela expliquerait pourquoi son nom MI25: deux somme principale était de 25 Tflops. Cela explique aussi la puissance thermique jusqu'à 300W. Lei Feng réseau de rappeler aux lecteurs, regard attentif à ces rumeurs.

MI6 et MI8 devrait expédier au premier semestre de l'année prochaine, alors que MI25 peut être plus tard. De plus, à la différence des graphiques de jeu à l'OEM (Sapphire, XFX, Asus, etc.) les pratiques de production, l'étude approfondie du matériel de Radeon Instinct par la propre production d'AMD et maintenance après-vente. Cette émule l'approche NVIDIA pour renforcer les liens avec l'industrie et de contrôle sur le produit, la marque.

Pour moins comprendre les lecteurs de la ligne graphique produit AMD, Fidji est l'architecture du GPU de la génération précédente, Polaris est actuellement employé l'architecture RX 480/470/460, Vega est le plus susceptible d'appliquer à RX 490, le nouveau Fury ou RX 5 Département de l'architecture de la prochaine génération. Vega et Vega 10 et Vega 11 est divisé en deux caractéristiques, ont été identifiés Vega 10 est l'utilisation de HBM2 (deuxième génération de mémoire HBM) du noyau haut de gamme. Il est rapporté que la prochaine version du légendaire RX 490 ou la nouvelle Fury utilisera Vega 10.

La feuille de route de GPU d'AMD: Vega puis de 28nm à Polaris

plate-forme logicielle ROCm

Dans le calcul des logiciels d'apprentissage de profondeur, AMD a publié le ROCm.  Elle est appelée la « Radeon Open Compute plate-forme » ( « plate-forme informatique open source Radeon »), comme son nom, est AMD superordinateur et pour le développement à grande échelle de la plate-forme informatique de calcul par le GPU open source qui est indépendante du langage de programmation. AMD a déclaré: ROCm ils choisissent la philosophie UNIX, les résultats de développement de logiciels minimalistes et modulaires au GPU Computing. La nouvelle ROCm permet aux développeurs de sélectionner les outils et l'exécution de langue (durée de fonctionnement de la langue), et même le développement.

Comme avec tous les projets sur le marché de l'apprentissage machine raisonnable, ROCm peut prendre en charge plusieurs GPU, y compris les GPU et les systèmes multi-serveurs au sein de la même scène. Il peut profiter de la technologie peer-Sync RDMA pour simplifier multi-GPU "Crossfire." la conception ROCm ne doit pas considérer que les extensions serveur à grande échelle, compilateur également construit (compilateurs), la langue et de soutien pour les applications CUDA exécution.

En outre, AMD a également développé une bibliothèque MIOpen apprentissage en profondeur pour tirer parti de l'architecture GCN. MIOpen avec le C ++ STL, NCCL sont dans les mêmes niveaux, sa fonction est de relier le langage de programmation ROCm et la plate-forme, une architecture commune et tensorflow de même Caffe.

positionnement MIOpen, est le plus bas ROCm. Moyen MIOpen, C ++, STL, etc. NCCL, le cadre supérieur est Caffe et comme tensorflow

revendications AMD, avec MIOpen, la perte de charge dans la performance correspond à l'accélérateur MI8 Da Taitan X (X Titan Pascal), et MI25 est au-delà de 30%, autant que celle-ci.

A gauche: à base MIOpen contraste de convolution GEMM. A droite: Titan deux générations et MI8, MI25 comparaison des performances dans MIOpen.

Il semble que ce marché mars calcul de l'apprentissage machine AMD est grave. Avenir, la vision d'AMD devrait être, MI série des accélérateurs matériels, plate-forme logicielle ROCm et Zen à base CPU 32-core et serveur 64-core trois ensemble, fournir un ensemble complet de solutions basées sur la gamme de produits AMD pour les clients supercalculateur. Mais par rapport aux champs AI plantes bleues et vertes établies de longue date, la Fondation AMD est faible, des ressources limitées et le temps d'admission a beaucoup en retard.

Lei Feng réseau que, l'objectif d'AMD est pas nécessairement fait en profondeur la façon dont le marché de l'apprentissage réussi, mais Nvidia et Intel arraché de la bouche, saisir les bénéfices du marché. Après tout, le processeur d'AMD et les graphiques de la gamme de cartes d'entreprise a besoin nourricier. « Perdre à la ligne de départ » d'AMD, nous ne pouvons pas continuer à défier Nvidia et Intel dans de nouveaux domaines? Lei Feng réseau continuera de se concentrer sur.

par point de vue pc, extremetech, AnandTech

Module de jeu de commande: télépathie type rechargeant l'univers jusqu'à Mk-
Précédent
Mito dix ans, les États-Unis peuvent continuer?
Prochain
« Après que l'ancien 3 », Han a frappé un autre nouveau film, la balance un peu grand!
Laver le grand jour: Changsha finalement hors du soleil
2018 meilleur drame américain, seulement elle! Acteur a été maintenu en prison pendant 31 ans
Sur le téléphone Cuisines pris: que le téléphone est manger jamais une chose facile
module de commande de lecture: restructuration Cassé, recherche détails du nouveau numéro Jean
« L'action de la mer Rouge », a annoncé une nouvelle fois l'extension, combien il a battu en fait l'adversaire?
« Destiny 2 » version PC ligne de départ pré-chargée sur le pic de la difficulté du raid des tâches
Ces micro-canal « réflexe conditionné », vous l'avez? | Collier de la colonne temps micro-lettre
100 millions + 2 nouveaux modèles: Vous adorez le vélo comme « vélo partagé » 2016 fermé leur
Deux sessions Faits saillants comité Shu Chaîne: Comment les membres de la CCPPC « C-bit » exercice de leurs fonctions
De nombreuses star du cinéma d'arts martiaux, Chow savent que cette personne est le plus Jin Yong
Xu Zheng a annoncé le nouvel ensemble de fichiers de film, travaillera avec Huang Bo Wang Baoqiang une épreuve de force!