Après près de 30 ans de feu de silence! mémoire AI pour calculer comment briser le compte de la force de goulot d'étranglement?

En 2012, l'algorithme d'apprentissage profond exposé en compétition de classification d'image dans une augmentation significative de la performance a déclenché un nouveau cycle de la flèche AI.

D'ici 2015, la profondeur de l'algorithme d'apprentissage pour la croissance rapide de la demande pour les puces a conduit boom économique à puce AI.

Cependant, étreinte concepteurs de puces AI ont vite découvert que l'utilisation de l'architecture classique de calcul Von Neumann de puce AI, même une amélioration spectaculaire dans l'unité de calcul de la force de fonctionnement, mais dans le cas de la performance de la mémoire plus lente, l'écart de performance entre les deux la plus évidente, et l'algorithme d'apprentissage profond énergie pour amener la consommation de manipulation de données est de calculer la consommation d'énergie de quelques centaines de fois ou même de fois, « mur de la mémoire » est de plus en plus importante.

Par conséquent, en se fondant sur les capacités de cloud computing algorithmes logiciels et puissants de l'intelligence artificielle a donné un grand succès, vous pouvez faire une variété de tâches de traitement intelligentes spécifiques, mais face à la puissance, la vitesse, le coût, et bien d'autres défis, tout de l'ère Internet intelligent il un écart énorme.

L'une des technologies de base est de résoudre la puce AI défi « mur de la mémoire », calcul (In-Memory Computing) dans le calcul peut être fait directement dans la mémoire est technique en silence pendant près de 30 ans, sous le boom AI ces dernières années deviennent la mise au point. Que ce soit la conférence universitaire de niveau supérieur, ou des sociétés géantes sont à la recherche de la meilleure solution technique peut être calculée en utilisant la puce de mémoire casser AI « mur de la mémoire ».

Alors, qui est le jeu changeurs ultime?

Mémoire informatique le mieux adapté à l'IA?

informatique mémoire sont nombreux initiés de l'industrie croient est l'architecture de puce AI la plus appropriée, largement favorisé par le milieu universitaire et l'industrie.

2018, la conférence universitaire internationale haut -IEEE Conférence internationale Circuits (Solid State ISSCC) a une mémoire dédiée dans le programme informatique de discussion. 2019 et 2020 documents sur le fonctionnement de la mémoire est une grande épidémie, la mémoire ISSCC2020 calcul avec augmentation du nombre de documents relatifs à sept. Pendant ce temps, le domaine des dispositifs électroniques 2019 top trois documents connexes IEDM conférence ont un programme spécial dans le calcul d'un total de 20 articles existent.

En plus des milieux universitaires, acteurs de l'industrie sont de plus en plus mise en page de la technologie. IBM est calculée en fonction de sa mémoire unique de changement de phase au sein de la technologie ont déjà accumulé depuis plusieurs années, TSMC est vigoureusement la promotion basée sur la mémoire ReRAM du programme informatique, Intel, Bosch, Micron, Lam Research, Applied Materials, Microsoft, Amazon, Softbank Investment la puce de mémoire est calculée sur la base de la flash NOR.

En fait, l'utilisation de la mémoire pour effectuer le calcul dans l'étude était depuis longtemps, dans les années 1990, les chercheurs ont publié des documents pertinents. Mais personne ne réalisent vraiment la raison d'atterrissage d'industrialisation, d'une part est le défi de la conception plus large, plus critique est pas killer application. Avec l'épidémie à grande échelle de la profondeur de l'apprentissage, de la mémoire au sein de l'industrialisation de la technologie informatique a commencé à tomber.

processus d'industrialisation de la mémoire informatique d'atterrissage, la technologie de mémoire et le savoir-fondateur d'étudier de près l'expérience entrepreneuriale.

En 2011, Guo Xin Jie est diplômé de l'Université de Pékin École des sciences de l'information et de la technologie, la microélectronique, après l'obtention du diplôme Guo Xin Jie a commencé l'Université de Californie, Santa Barbara (UCSB) études de doctorat, son mentor, le professeur Dmitri B.Strukov est calculé mémoire Daniel domaine universitaire, en 2008, HP a terminé le premier memristor a été préparé en 2010, il a rejoint l'Université de Californie, Santa Barbara. Guo Xin Jie est également devenu le premier lot de professeur de doctorat Dmitri B.Strukov, a commencé une étude basée sur des puces d'ordinateur à l'intérieur de la mémoire flash NOR.

Dmitri B. Strukov lui a dit, FLASH a été commercial pendant plusieurs décennies, la technologie est mature, à faible coût, est le plus proche de l'industrialisation de la direction, mais l'inconvénient est aussi parce que l'étude FLASH a commencé plus tôt, les attentes de la recherche universitaire pour le calcul de la mémoire interne FLASH supérieur, a publié un article difficile. 2013, avec la profondeur de l'apprentissage boom recherche a balayé le monde universitaire, avec le soutien de mentors, Guo Xin Jie a commencé à essayer au développement de la puce basée sur des calculs internes mémoire flash NOR.

A pris quatre ans, après six attaché du ruban adhésif, Guo Xin Jie a finalement mis au point en 2016 sur l'étude approfondie de calcul au sein de la puce flottante monde mémoire porte premier réseau de neurones 3 couches, pour la première fois de vérifier la mémoire de calcul transistors à grille flottante basée sur l'apprentissage en profondeur applications utilitaires. Un an plus tard, elle a marqué dans la mémoire à grille flottante supplémentaires puce informatique de réseau de neurones d'apprentissage profond sept couches.

Aussi en 2016, les étudiants Guo Xin Jie, mais aussi le roi Saude son mari, ont également vu la valeur des puces informatiques de mémoire AI, sélectionnez et Guo Xin Jie continuent de se livrer à la mémoire de travail de recherche dans le calcul dans la phase de post-doctorat. 2017, les Etats-Unis ont commencé à la recherche et le développement agressive financée par la technologie informatique dans la mémoire, et son mentor projet Wang Saude a également reçu 600 millions de dollars en financement. Guo Xin Jie deux croit que le temps est venu, il a entreprise à domicile, et a gagné l'illumination Star, soutien à l'investissement personne associée Zhao Yi innovation.

En Octobre 2017, dépôt connu de la science et de la technologie a été créé à Pékin, en raison de la accumulé une riche expérience, les connaissances stockées sur la première technologie de silicium dans les 10 mois après la mise en place. est également connu en même temps, plus la technologie informatique de mémoire est de plus en plus reconnue dans le développement de la science et de la technologie pour maintenir la cueillette de la vitesse, et en Décembre 2018 a obtenu un tour d'ange de financement gagné + iFly des investisseurs plomb, en Août 2019 a été attribué col SMIC Juyuan un casting de près de milliards de tour de table.

carte wafer test Source: Technologie savoir exist

Wang a dit dans la technologie informatique Saude avec confiance dans AI dans la mémoire, il a accepté Lei interview réseau Feng: « Plus les paramètres des algorithmes AI, la mémoire plus importante dans l'avantage calcul parce que la mémoire de calcul est stocké dans une opération de mémoire. nombre, l'autre entrée d'opérande après le résultat de l'opération peut être obtenue, de sorte que plus les paramètres, économisant plus de transfert de données, les avantages les plus évidents. mémoire dans le calcul peut être considéré comme un gros marteau, les clous de l'algorithme AI, au début de l'algorithme est étage un petit clou, sur la déduction de temps, l'ongle se développera de plus en plus ».

PDG Wang Technology Saude connu pour exister

La technologie de stockage solution connue consiste à redessiner la mémoire à partir du sol, en utilisant les caractéristiques physiques des NOR cellules de mémoire flash, la transformation de la matrice de mémoire, il est possible de remodeler des circuits périphériques pour plus de données, alors que l'opérateur qui est également stocké dans la mémoire, de telle sorte que chaque cellule peut être une opération arithmétique analogique de sortie et peut entraîner directement, pour le calcul de la mémoire.

Vu sous cet angle, la mémoire dans le calcul est un bon moyen de briser le goulot d'étranglement « mur mémoire », mais le chemin de la technologie Pourquoi est calculée dans une variété de mémoire, le choix de la technologie de dépôt connu est NOR FLASH?

Pourquoi NOR-FLASH?

En fait, les calculs ne mémoire pas beaucoup la mémoire, en plus de FLASH, il y a cent millions de résistances, mémoire à changement de phase, mémoire ferroélectrique, une mémoire de spin, SRAM et similaires, mais ont chacun leurs propres avantages et inconvénients.

Dans l'ensemble, NOR FLASH est le plus approprié pour l'industrialisation de la direction, de nombreux investissements américains start-up géant Mythique est également utilisé dans NOR FLASH. Quant à savoir pourquoi faire mémoire NOR FLASH dans le calcul d'être optimiste sur l'industrie, Wang Saude dit :. « Regardez séparé des caractéristiques de l'appareil, NOR avantages FLASH non seulement en termes de puissance et de maturité, de grande précision est un grand avantage du problème majeur actuel il n'y a pas moins de 28nm NOR FLASH technologie, mais basée sur les processus en cours dans la mémoire NOR FLASH d'avantages par rapport aux solutions informatiques traditionnelles est assez élevé ».

Utilisation NOR FLASH unité peut réaliser le stockage en poids et 8 bits 8 bits 8 bits * matrice analogiques les opérations de multiplication-addition. NOR FLASH seule matrice peut être réalisé dans des opérations parallèles de multiplication de matrice 2.000.000 et addition, par rapport au débit calculé DRAM et SRAM, etc. 100-1000 largeur de bande de mémoire fois plus élevée.

Technologie dépôt de dépôt connu considéré comme l'un de la technologie à puce

« Calcul comparées en utilisant des circuits numériques, utilisés pour le calcul de la mémoire NOR FLASH réduit la consommation d'énergie de traitement de données, plus NOR FLASH multiplication en ajoutant la consommation d'énergie est très faible, cela va amener la consommation d'énergie de centaines ou même des milliers de fois réduit. « représentation Wang Saude.

Bien sûr, en tenant compte du circuit périphérique de la consommation d'énergie, la mémoire flash NOR pour calculer la réduction finale peut être réalisée en plusieurs dizaines de fois à des centaines de fois entre. Améliorer les différents algorithmes et applications qui peuvent être obtenus sont différents.

Wang Saude introduction, la situation actuelle dans le peut être supporté dans une seule puce à environ 300M re-apprendre la technologie informatique de mémoire NOR FLASH les paramètres de profondeur de droite, peut être calculée sans mémoire supplémentaire. Actuellement, la taille du modèle de la demande est la voix habituellement intelligente en taille à quelques centaines de K, du côté de la taille de l'image du modèle de raisonnement est habituellement comprise entre quelques méga-octets à quelques dizaines de mégaoctets, alors NOR puces de mémoire flash pour répondre à la scène le calcul de la plupart des AI .

modèle de calcul peut prendre en charge la précision de la mémoire peut être atteint maintenant mainstream 8 bits. Wang a dit Saude, étude approfondie 8 bits peut couvrir la plupart des applications, même si certaines scènes ont besoin d'une limite supérieure de 16 bits, nous avons des solutions dans la recherche et le développement. Nous espérons que l'avenir est calculé pour couvrir le dépôt dans les 60% à 70% des demandes AI.

Il convient de noter que le niveau de leader technologique mémoire de connaissances scientifiques et technologiques dans l'industrie 3--4 années. Dr Guo Xin Jie en 2012, en 2013 a commencé à étudier la technologie informatique de mémoire est basée sur la NORFLASH, d'autres entreprises ont commencé en 2018 à l'investissement R & D de base. En tant que nouvelles technologies de pointe, la recherche et le développement dans le calcul de la mémoire a besoin de beaucoup d'accumulation de la technologie, il y a beaucoup de stands doivent pas à l'étape par étape, même si l'autre société a investi des ressources importantes en cas de fuite de la technologie ne semble pas, au moins, nous avons trois ou quatre ans le temps d'acquérir des connaissances scientifiques et technologiques sauvegarder les résultats actuels.

Parmi ces défis de conception, comprenant des circuits de commande, des circuits analogiques, la programmation, la conception de la fiabilité, la conception architecturale. Analog Design est un très grand défi en raison de la FLASH est une simulation, mais les algorithmes sont basés sur le développement d'un circuit numérique, ce qui ajoute beaucoup de calcul analogique besoins exigeants.

Saude Wang a dit: « Bien que la mémoire à puce calculer théoriquement sans avoir à correspondre complètement une puce existante dans la fonction, mais l'industrie des algorithmes AI sont basés sur le développement de l'architecture de puce existante, et le dépôt donc connu des produits technologiques doivent adapter à ces méthodes d'affaires et d'obtenir une grande précision, qui a connu un temps d'itérations tapeout, ces avantages de l'expérience accumulée et de la technologie deviennent également gisement connu de la technologie ".

Processus « dans le processus d'itération, nous devons résoudre l'erreur provoquée par le processus, la température, la programmation, le bruit, etc., mais aussi de résoudre certains des problèmes rencontrés dans le fonctionnement analogique, le processus de résolution de problèmes est une société innovante. Comme le professeur Wei Shaojun la a déclaré: l'innovation produit est le thème éternel des sociétés de conception de puces, « il a ajouté.

Cela explique aussi pourquoi la technologie de sélection gisement connu NOR FLASH, mémoire FLASH NOR conception de puces de calcul à partir de zéro prend un temps très long, NOR FLASH été en mesure de progresser plus vite que NAND FLASH, parce que le NOR-FLASH est en place maturité solution qui peut être optimisé en fonction des programmes existants, lancements de produits plus rapides.

Qui briser les?

Nous avons connu un certain nombre de techniques et le ruban gommé après itération, la technologie de dépôt connu fin du mois dernier ont libéré deux puce vocale intelligente MemCore001 / MemCore001P, soutien reconnaissance vocale intelligente, voix réduction du bruit, la reconnaissance et d'autres applications voiceprint vocales intelligentes. la consommation d'énergie de la puce de fonctionnement inférieure à 300uA, la consommation d'énergie de secours est inférieure à 10 uA.

Selon la technologie de stockage de documents connus, MemCore001 / MemCore001P fréquence typique de fonctionnement de 24MHz (horloge de fonctionnement) et 2MHz (horloge de réveil), MemCore001P en mode de faible puissance, en utilisant une puce d'horloge à basse puissance séparé, les autres puces par interruption interaction collaborative, ce qui réduit la consommation d'énergie globale du système.

la taille de la puce de série MemCore001

MemCore001 / MemCore001P 2Mo construit un espace de stockage de paramètre de réseau d'apprentissage profond, qui peut stocker jusqu'à plus de 32 et une couche arithmétique (identiques ou différents) algorithme de réseau d'apprentissage en profondeur, aux structures de soutien de réseau multiples DNN / RNN / LSTM / TDNN analogues.

En tant que coprocesseur, MemCore001 / MemCore001P compatible MCU architecture Cortex-Bras-M4 / M3 / M33 / MCU série basée M0 sur une architecture RISC V.

Cependant, la puce que vous voulez tomber, mais aussi de calculer l'avantage matériel de mémoire dans l'avantage du terrain. Wang a dit que le Saude produit peut tomber juste un peu d'avantage ne suffit pas, le sol dépend si les besoins du marché. Bien sûr, vous voulez tomber le plus tôt possible, de faire permettent maintenant des algorithmes commerciaux ne changent aussi peu que possible tout en adaptant nos jetons le plus rapidement possible, il est très important, ce qui oblige les entreprises à travailler ensemble et algorithmes constamment en train d'atterrissage comprendre les besoins, laissez le logiciel et le matériel qui travaillent ensemble, jouent le plus grand rôle.

Il a en outre souligné que la plate-forme logicielle permet aux développeurs de plus facilement lorsque la migration de l'algorithme et le débogage. Mais la mémoire dans le travail de calcul est relativement simple, comme les architectures informatiques traditionnelles nécessitent des millions de cycles pour terminer, calculer un cycle peut être complété dans la mémoire, si la mémoire dans le compilateur de calcul est à gros grains, moins difficile à développer .

Par conséquent, l'existence de partenaires technologiques et de connaissances a développé les solutions de système correspondantes, y compris la voix intelligente et algorithme de reconnaissance intelligente de la parole de réduction du bruit peut être directement intégré dans la puce, fournie par les développeurs d'appel facile.

Comme la plupart des autres puce AI, dépôt connu de la technologie MemCore001 / temps MemCore001P au cours de l'algorithme de migration ont également besoin de recyclage. A cette époque, comment attirer les clients dans le calcul de la mémoire à puce?

Wang Saude a déclaré: « mise à niveau si ma puce peut apporter très évident, ou utiliser l'original ne peut pas être utilisé débarqua après nos puces peuvent tomber, de sorte que seuls les gens prêts à essayer une scène beaucoup, vous avez besoin d'explorer, mais il y a déjà. l'intention des clients prêts à utiliser nos produits ".

Le leader des connaissances de l'informatique technique stockées dans la mémoire peut aussi être une autre façon de dire: « le développement précoce, à cause du manque de l'usine de plaquettes de support et des outils EDA, beaucoup de notre travail de développement deviendra automatique du manuel, mais tout en permettant des méthodes de conception connues existent pour établir un puces d'ordinateur mémoire science et la technologie école. « représentation Wang Saude.

Cette technologie marque leader dépôt connu peut devenir un jeu au sein de la puce exist AI, l'objectif de la technologie de dépôt est connu pour atteindre l'objectif de 50 millions de jetons expédiés en trois ans. À cet égard, Wang Saude a exprimé son optimisme, il estime que les expéditions sur le marché des consommateurs de 50 millions ne sont pas beaucoup plus, si vous avez choisi la bonne direction, les livraisons d'un produit dans quelques années seront en mesure d'atteindre des dizaines de millions.

50 millions d'envois signifie que la société peut atteindre la rentabilité dans cet objectif, la nécessité matérielle et logicielle d'itération se poursuivent. Wang a révélé Saude, l'entreprise tous les trois à quatre mois seront enregistrées une fois par an ou même deux va lancer un nouveau produit. Des échantillons de puce visuelle seront enregistrées l'année prochaine et l'année suivante devrait être lancé officiellement.

Lei Feng réseau Résumé

En tant que principale force motrice pour le développement de l'intelligence artificielle, puce AI peut devenir la clé dans la mesure pour répondre aux besoins des algorithmes AI. Pour répondre aux besoins des algorithmes AI aurait besoin pour relever le défi de base mur de mémoire à puce AI, conservés dans le calcul de ses propriétés et est capable de stocker simultanément l'informatique est considérée comme un moyen de résoudre les problèmes de mur de la mémoire, mais son algorithme de calcul de la rencontre de simulation numérique la demande croissante, la conception du circuit externe, la conception de logiciels, erreur de processus est un défi.

Entre la mémoire de l'informatique d'entreprise, il est clairement pas la concurrence, mais nous attendons tous avec impatience pour calculer la puce de mémoire AI peut se produire généralement des applications, et de promouvoir le développement rapide et durable de l'atterrissage AI. Lei Feng réseau

Apple Crayon ou sera équipé de caméras, sortie MacDevitt OFO représentants légaux et les cadres, Jingdong va obtenir 1,4 milliard de yuans de récompense des employés | Lei Feng Matin
Précédent
2020 nouvelle subvention des véhicules de l'énergie ne reculera pas pente forte, le ministère a demandé à la chaussée en liaison avec le réseau intelligent reliant voiture « ligne ensemble. »
Prochain
Limite Replay: Je sers? Ouverture à négocier? Nous continuons à nous tombons censés? Emmêlés triple ......
Le Mécanisme conjoint de prévention et de contrôle du Conseil des affaires d'État a tenu une conférence de presse sur l'amélioration du travail de prévention et de contrôle de l'épidémie dans des dom
Guerre journal « peste » | Femme expédition blessée Medic: maintenant à la maison besoin de moi, je dois aller
sifflet entraîneur, les passagers moment de silence pour pleurer la mort de la gare routière Jining
Tiède brise du printemps de deuil Zhonghun, Texas abaissé à moitié et plus, spontanément gens silence
Jinan Ressorts Plaza abaissé à la moitié des trois minutes publiques de silence pour rendre héros rétrograde hommage
sirène raid aérien retentirent, montagne héros Jinan véhicules de passage des piétons se sont arrêtés pour se lamenter
Méfiez-vous des logiciels d'infiltration! Heureusement, 15 de Swiss café App notifié en réponse à: empêcher les pirates trichent premier gratuitement tasse
sacs aspirateur, cuiseurs à riz de sucre, machines à laver vertical, vieux appareils marché bataille est venu | super vues
KR8 hebdomadaire | développement de l'Amazonie du jeu, Baidu fournisseur d'électricité en direct en ligne, Huawei tranquillement atteint l'équipement médical
3 prix des voitures, un million + km, réponses Peng Chi Heng Jun poney Robo course de normalisation Taxi
Tencent Technology Comment les bonnes actions?