Apr�s pr�s de 30 ans de feu de silence! m�moire AI pour calculer comment briser le compte de la force de goulot d'�tranglement?

En 2012, l'algorithme d'apprentissage profond expos� en comp�tition de classification d'image dans une augmentation significative de la performance a d�clench� un nouveau cycle de la fl�che AI.

D'ici 2015, la profondeur de l'algorithme d'apprentissage pour la croissance rapide de la demande pour les puces a conduit boom �conomique � puce AI.

Cependant, �treinte concepteurs de puces AI ont vite d�couvert que l'utilisation de l'architecture classique de calcul Von Neumann de puce AI, m�me une am�lioration spectaculaire dans l'unit� de calcul de la force de fonctionnement, mais dans le cas de la performance de la m�moire plus lente, l'�cart de performance entre les deux la plus �vidente, et l'algorithme d'apprentissage profond �nergie pour amener la consommation de manipulation de donn�es est de calculer la consommation d'�nergie de quelques centaines de fois ou m�me de fois, � mur de la m�moire � est de plus en plus importante.

Par cons�quent, en se fondant sur les capacit�s de cloud computing algorithmes logiciels et puissants de l'intelligence artificielle a donn� un grand succ�s, vous pouvez faire une vari�t� de t�ches de traitement intelligentes sp�cifiques, mais face � la puissance, la vitesse, le co�t, et bien d'autres d�fis, tout de l'�re Internet intelligent il un �cart �norme.

L'une des technologies de base est de r�soudre la puce AI d�fi � mur de la m�moire �, calcul (In-Memory Computing) dans le calcul peut �tre fait directement dans la m�moire est technique en silence pendant pr�s de 30 ans, sous le boom AI ces derni�res ann�es deviennent la mise au point. Que ce soit la conf�rence universitaire de niveau sup�rieur, ou des soci�t�s g�antes sont � la recherche de la meilleure solution technique peut �tre calcul�e en utilisant la puce de m�moire casser AI � mur de la m�moire �.

Alors, qui est le jeu changeurs ultime?

M�moire informatique le mieux adapt� � l'IA?

informatique m�moire sont nombreux initi�s de l'industrie croient est l'architecture de puce AI la plus appropri�e, largement favoris� par le milieu universitaire et l'industrie.

2018, la conf�rence universitaire internationale haut -IEEE Conf�rence internationale Circuits (Solid State ISSCC) a une m�moire d�di�e dans le programme informatique de discussion. 2019 et 2020 documents sur le fonctionnement de la m�moire est une grande �pid�mie, la m�moire ISSCC2020 calcul avec augmentation du nombre de documents relatifs � sept. Pendant ce temps, le domaine des dispositifs �lectroniques 2019 top trois documents connexes IEDM conf�rence ont un programme sp�cial dans le calcul d'un total de 20 articles existent.

En plus des milieux universitaires, acteurs de l'industrie sont de plus en plus mise en page de la technologie. IBM est calcul�e en fonction de sa m�moire unique de changement de phase au sein de la technologie ont d�j� accumul� depuis plusieurs ann�es, TSMC est vigoureusement la promotion bas�e sur la m�moire ReRAM du programme informatique, Intel, Bosch, Micron, Lam Research, Applied Materials, Microsoft, Amazon, Softbank Investment la puce de m�moire est calcul�e sur la base de la flash NOR.

En fait, l'utilisation de la m�moire pour effectuer le calcul dans l'�tude �tait depuis longtemps, dans les ann�es 1990, les chercheurs ont publi� des documents pertinents. Mais personne ne r�alisent vraiment la raison d'atterrissage d'industrialisation, d'une part est le d�fi de la conception plus large, plus critique est pas killer application. Avec l'�pid�mie � grande �chelle de la profondeur de l'apprentissage, de la m�moire au sein de l'industrialisation de la technologie informatique a commenc� � tomber.

processus d'industrialisation de la m�moire informatique d'atterrissage, la technologie de m�moire et le savoir-fondateur d'�tudier de pr�s l'exp�rience entrepreneuriale.

En 2011, Guo Xin Jie est dipl�m� de l'Universit� de P�kin �cole des sciences de l'information et de la technologie, la micro�lectronique, apr�s l'obtention du dipl�me Guo Xin Jie a commenc� l'Universit� de Californie, Santa Barbara (UCSB) �tudes de doctorat, son mentor, le professeur Dmitri B.Strukov est calcul� m�moire Daniel domaine universitaire, en 2008, HP a termin� le premier memristor a �t� pr�par� en 2010, il a rejoint l'Universit� de Californie, Santa Barbara. Guo Xin Jie est �galement devenu le premier lot de professeur de doctorat Dmitri B.Strukov, a commenc� une �tude bas�e sur des puces d'ordinateur � l'int�rieur de la m�moire flash NOR.

Dmitri B. Strukov lui a dit, FLASH a �t� commercial pendant plusieurs d�cennies, la technologie est mature, � faible co�t, est le plus proche de l'industrialisation de la direction, mais l'inconv�nient est aussi parce que l'�tude FLASH a commenc� plus t�t, les attentes de la recherche universitaire pour le calcul de la m�moire interne FLASH sup�rieur, a publi� un article difficile. 2013, avec la profondeur de l'apprentissage boom recherche a balay� le monde universitaire, avec le soutien de mentors, Guo Xin Jie a commenc� � essayer au d�veloppement de la puce bas�e sur des calculs internes m�moire flash NOR.

A pris quatre ans, apr�s six attach� du ruban adh�sif, Guo Xin Jie a finalement mis au point en 2016 sur l'�tude approfondie de calcul au sein de la puce flottante monde m�moire porte premier r�seau de neurones 3 couches, pour la premi�re fois de v�rifier la m�moire de calcul transistors � grille flottante bas�e sur l'apprentissage en profondeur applications utilitaires. Un an plus tard, elle a marqu� dans la m�moire � grille flottante suppl�mentaires puce informatique de r�seau de neurones d'apprentissage profond sept couches.

Aussi en 2016, les �tudiants Guo Xin Jie, mais aussi le roi Saude son mari, ont �galement vu la valeur des puces informatiques de m�moire AI, s�lectionnez et Guo Xin Jie continuent de se livrer � la m�moire de travail de recherche dans le calcul dans la phase de post-doctorat. 2017, les Etats-Unis ont commenc� � la recherche et le d�veloppement agressive financ�e par la technologie informatique dans la m�moire, et son mentor projet Wang Saude a �galement re�u 600 millions de dollars en financement. Guo Xin Jie deux croit que le temps est venu, il a entreprise � domicile, et a gagn� l'illumination Star, soutien � l'investissement personne associ�e Zhao Yi innovation.

En Octobre 2017, d�p�t connu de la science et de la technologie a �t� cr�� P�kin, en raison de la accumul� une riche exp�rience, les connaissances stock�es sur la premi�re technologie de silicium dans les 10 mois apr�s la mise en place. est �galement connu en m�me temps, plus la technologie informatique de m�moire est de plus en plus reconnue dans le d�veloppement de la science et de la technologie pour maintenir la cueillette de la vitesse, et en D�cembre 2018 a obtenu un tour d'ange de financement gagn� + iFly des investisseurs plomb, en Ao�t 2019 a �t� attribu� col SMIC Juyuan un casting de pr�s de milliards de tour de table.

carte wafer test Source: Technologie savoir exist

Wang a dit dans la technologie informatique Saude avec confiance dans AI dans la m�moire, il a accept� Lei interview r�seau Feng: � Plus les param�tres des algorithmes AI, la m�moire plus importante dans l'avantage calcul parce que la m�moire de calcul est stock� dans une op�ration de m�moire. nombre, l'autre entr�e d'op�rande apr�s le r�sultat de l'op�ration peut �tre obtenue, de sorte que plus les param�tres, �conomisant plus de transfert de donn�es, les avantages les plus �vidents. m�moire dans le calcul peut �tre consid�r� comme un gros marteau, les clous de l'algorithme AI, au d�but de l'algorithme est �tage un petit clou, sur la d�duction de temps, l'ongle se d�veloppera de plus en plus �.

PDG Wang Technology Saude connu pour exister

La technologie de stockage solution connue consiste � redessiner la m�moire � partir du sol, en utilisant les caract�ristiques physiques des NOR cellules de m�moire flash, la transformation de la matrice de m�moire, il est possible de remodeler des circuits p�riph�riques pour plus de donn�es, alors que l'op�rateur qui est �galement stock� dans la m�moire, de telle sorte que chaque cellule peut �tre une op�ration arithm�tique analogique de sortie et peut entra�ner directement, pour le calcul de la m�moire.

Vu sous cet angle, la m�moire dans le calcul est un bon moyen de briser le goulot d'�tranglement � mur m�moire �, mais le chemin de la technologie Pourquoi est calcul�e dans une vari�t� de m�moire, le choix de la technologie de d�p�t connu est NOR FLASH?

Pourquoi NOR-FLASH?

En fait, les calculs ne m�moire pas beaucoup la m�moire, en plus de FLASH, il y a cent millions de r�sistances, m�moire � changement de phase, m�moire ferro�lectrique, une m�moire de spin, SRAM et similaires, mais ont chacun leurs propres avantages et inconv�nients.

Dans l'ensemble, NOR FLASH est le plus appropri� pour l'industrialisation de la direction, de nombreux investissements am�ricains start-up g�ant Mythique est �galement utilis� dans NOR FLASH. Quant � savoir pourquoi faire m�moire NOR FLASH dans le calcul d'�tre optimiste sur l'industrie, Wang Saude dit :. � Regardez s�par� des caract�ristiques de l'appareil, NOR avantages FLASH non seulement en termes de puissance et de maturit�, de grande pr�cision est un grand avantage du probl�me majeur actuel il n'y a pas moins de 28nm NOR FLASH technologie, mais bas�e sur les processus en cours dans la m�moire NOR FLASH d'avantages par rapport aux solutions informatiques traditionnelles est assez �lev� �.

Utilisation NOR FLASH unit� peut r�aliser le stockage en poids et 8 bits 8 bits 8 bits * matrice analogiques les op�rations de multiplication-addition. NOR FLASH seule matrice peut �tre r�alis� dans des op�rations parall�les de multiplication de matrice 2.000.000 et addition, par rapport au d�bit calcul� DRAM et SRAM, etc. 100-1000 largeur de bande de m�moire fois plus �lev�e.

Technologie d�p�t de d�p�t connu consid�r� comme l'un de la technologie � puce

� Calcul compar�es en utilisant des circuits num�riques, utilis�s pour le calcul de la m�moire NOR FLASH r�duit la consommation d'�nergie de traitement de donn�es, plus NOR FLASH multiplication en ajoutant la consommation d'�nergie est tr�s faible, cela va amener la consommation d'�nergie de centaines ou m�me des milliers de fois r�duit. � repr�sentation Wang Saude.

Bien s�r, en tenant compte du circuit p�riph�rique de la consommation d'�nergie, la m�moire flash NOR pour calculer la r�duction finale peut �tre r�alis�e en plusieurs dizaines de fois � des centaines de fois entre. Am�liorer les diff�rents algorithmes et applications qui peuvent �tre obtenus sont diff�rents.

Wang Saude introduction, la situation actuelle dans le peut �tre support� dans une seule puce � environ 300M re-apprendre la technologie informatique de m�moire NOR FLASH les param�tres de profondeur de droite, peut �tre calcul�e sans m�moire suppl�mentaire. Actuellement, la taille du mod�le de la demande est la voix habituellement intelligente en taille � quelques centaines de K, du c�t� de la taille de l'image du mod�le de raisonnement est habituellement comprise entre quelques m�ga-octets � quelques dizaines de m�gaoctets, alors NOR puces de m�moire flash pour r�pondre � la sc�ne le calcul de la plupart des AI .

mod�le de calcul peut prendre en charge la pr�cision de la m�moire peut �tre atteint maintenant mainstream 8 bits. Wang a dit Saude, �tude approfondie 8 bits peut couvrir la plupart des applications, m�me si certaines sc�nes ont besoin d'une limite sup�rieure de 16 bits, nous avons des solutions dans la recherche et le d�veloppement. Nous esp�rons que l'avenir est calcul� pour couvrir le d�p�t dans les 60% � 70% des demandes AI.

Il convient de noter que le niveau de leader technologique m�moire de connaissances scientifiques et technologiques dans l'industrie 3--4 ann�es. Dr Guo Xin Jie en 2012, en 2013 a commenc� � �tudier la technologie informatique de m�moire est bas�e sur la NORFLASH, d'autres entreprises ont commenc� en 2018 � l'investissement R & D de base. En tant que nouvelles technologies de pointe, la recherche et le d�veloppement dans le calcul de la m�moire a besoin de beaucoup d'accumulation de la technologie, il y a beaucoup de stands doivent pas � l'�tape par �tape, m�me si l'autre soci�t� a investi des ressources importantes en cas de fuite de la technologie ne semble pas, au moins, nous avons trois ou quatre ans le temps d'acqu�rir des connaissances scientifiques et technologiques sauvegarder les r�sultats actuels.

Parmi ces d�fis de conception, comprenant des circuits de commande, des circuits analogiques, la programmation, la conception de la fiabilit�, la conception architecturale. Analog Design est un tr�s grand d�fi en raison de la FLASH est une simulation, mais les algorithmes sont bas�s sur le d�veloppement d'un circuit num�rique, ce qui ajoute beaucoup de calcul analogique besoins exigeants.

Saude Wang a dit: � Bien que la m�moire � puce calculer th�oriquement sans avoir � correspondre compl�tement une puce existante dans la fonction, mais l'industrie des algorithmes AI sont bas�s sur le d�veloppement de l'architecture de puce existante, et le d�p�t donc connu des produits technologiques doivent adapter � ces m�thodes d'affaires et d'obtenir une grande pr�cision, qui a connu un temps d'it�rations tapeout, ces avantages de l'exp�rience accumul�e et de la technologie deviennent �galement gisement connu de la technologie ".

Processus � dans le processus d'it�ration, nous devons r�soudre l'erreur provoqu�e par le processus, la temp�rature, la programmation, le bruit, etc., mais aussi de r�soudre certains des probl�mes rencontr�s dans le fonctionnement analogique, le processus de r�solution de probl�mes est une soci�t� innovante. Comme le professeur Wei Shaojun la a d�clar�: l'innovation produit est le th�me �ternel des soci�t�s de conception de puces, � il a ajout�.

Cela explique aussi pourquoi la technologie de s�lection gisement connu NOR FLASH, m�moire FLASH NOR conception de puces de calcul � partir de z�ro prend un temps tr�s long, NOR FLASH �t� en mesure de progresser plus vite que NAND FLASH, parce que le NOR-FLASH est en place maturit� solution qui peut �tre optimis� en fonction des programmes existants, lancements de produits plus rapides.

Qui briser les?

Nous avons connu un certain nombre de techniques et le ruban gomm� apr�s it�ration, la technologie de d�p�t connu fin du mois dernier ont lib�r� deux puce vocale intelligente MemCore001 / MemCore001P, soutien reconnaissance vocale intelligente, voix r�duction du bruit, la reconnaissance et d'autres applications voiceprint vocales intelligentes. la consommation d'�nergie de la puce de fonctionnement inf�rieure � 300uA, la consommation d'�nergie de secours est inf�rieure � 10 uA.

Selon la technologie de stockage de documents connus, MemCore001 / MemCore001P fr�quence typique de fonctionnement de 24MHz (horloge de fonctionnement) et 2MHz (horloge de r�veil), MemCore001P en mode de faible puissance, en utilisant une puce d'horloge � basse puissance s�par�, les autres puces par interruption interaction collaborative, ce qui r�duit la consommation d'�nergie globale du syst�me.

la taille de la puce de s�rie MemCore001

MemCore001 / MemCore001P 2Mo construit un espace de stockage de param�tre de r�seau d'apprentissage profond, qui peut stocker jusqu'� plus de 32 et une couche arithm�tique (identiques ou diff�rents) algorithme de r�seau d'apprentissage en profondeur, aux structures de soutien de r�seau multiples DNN / RNN / LSTM / TDNN analogues.

En tant que coprocesseur, MemCore001 / MemCore001P compatible MCU architecture Cortex-Bras-M4 / M3 / M33 / MCU s�rie bas�e M0 sur une architecture RISC V.

Cependant, la puce que vous voulez tomber, mais aussi de calculer l'avantage mat�riel de m�moire dans l'avantage du terrain. Wang a dit que le Saude produit peut tomber juste un peu d'avantage ne suffit pas, le sol d�pend si les besoins du march�. Bien s�r, vous voulez tomber le plus t�t possible, de faire permettent maintenant des algorithmes commerciaux ne changent aussi peu que possible tout en adaptant nos jetons le plus rapidement possible, il est tr�s important, ce qui oblige les entreprises � travailler ensemble et algorithmes constamment en train d'atterrissage comprendre les besoins, laissez le logiciel et le mat�riel qui travaillent ensemble, jouent le plus grand r�le.

Il a en outre soulign� que la plate-forme logicielle permet aux d�veloppeurs de plus facilement lorsque la migration de l'algorithme et le d�bogage. Mais la m�moire dans le travail de calcul est relativement simple, comme les architectures informatiques traditionnelles n�cessitent des millions de cycles pour terminer, calculer un cycle peut �tre compl�t� dans la m�moire, si la m�moire dans le compilateur de calcul est � gros grains, moins difficile � d�velopper .

Par cons�quent, l'existence de partenaires technologiques et de connaissances a d�velopp� les solutions de syst�me correspondantes, y compris la voix intelligente et algorithme de reconnaissance intelligente de la parole de r�duction du bruit peut �tre directement int�gr� dans la puce, fournie par les d�veloppeurs d'appel facile.

Comme la plupart des autres puce AI, d�p�t connu de la technologie MemCore001 / temps MemCore001P au cours de l'algorithme de migration ont �galement besoin de recyclage. A cette �poque, comment attirer les clients dans le calcul de la m�moire � puce?

Wang Saude a d�clar�: � mise � niveau si ma puce peut apporter tr�s �vident, ou utiliser l'original ne peut pas �tre utilis� d�barqua apr�s nos puces peuvent tomber, de sorte que seuls les gens pr�ts � essayer une sc�ne beaucoup, vous avez besoin d'explorer, mais il y a d�j�. l'intention des clients pr�ts � utiliser nos produits ".

Le leader des connaissances de l'informatique technique stock�es dans la m�moire peut aussi �tre une autre fa�on de dire: � le d�veloppement pr�coce, � cause du manque de l'usine de plaquettes de support et des outils EDA, beaucoup de notre travail de d�veloppement deviendra automatique du manuel, mais tout en permettant des m�thodes de conception connues existent pour �tablir un puces d'ordinateur m�moire science et la technologie �cole. � repr�sentation Wang Saude.

Cette technologie marque leader d�p�t connu peut devenir un jeu au sein de la puce exist AI, l'objectif de la technologie de d�p�t est connu pour atteindre l'objectif de 50 millions de jetons exp�di�s en trois ans. � cet �gard, Wang Saude a exprim� son optimisme, il estime que les exp�ditions sur le march� des consommateurs de 50 millions ne sont pas beaucoup plus, si vous avez choisi la bonne direction, les livraisons d'un produit dans quelques ann�es seront en mesure d'atteindre des dizaines de millions.

50 millions d'envois signifie que la soci�t� peut atteindre la rentabilit� dans cet objectif, la n�cessit� mat�rielle et logicielle d'it�ration se poursuivent. Wang a r�v�l� Saude, l'entreprise tous les trois � quatre mois seront enregistr�es une fois par an ou m�me deux va lancer un nouveau produit. Des �chantillons de puce visuelle seront enregistr�es l'ann�e prochaine et l'ann�e suivante devrait �tre lanc� officiellement.

Lei Feng r�seau R�sum�

En tant que principale force motrice pour le d�veloppement de l'intelligence artificielle, puce AI peut devenir la cl� dans la mesure pour r�pondre aux besoins des algorithmes AI. Pour r�pondre aux besoins des algorithmes AI aurait besoin pour relever le d�fi de base mur de m�moire � puce AI, conserv�s dans le calcul de ses propri�t�s et est capable de stocker simultan�ment l'informatique est consid�r�e comme un moyen de r�soudre les probl�mes de mur de la m�moire, mais son algorithme de calcul de la rencontre de simulation num�rique la demande croissante, la conception du circuit externe, la conception de logiciels, erreur de processus est un d�fi.

Entre la m�moire de l'informatique d'entreprise, il est clairement pas la concurrence, mais nous attendons tous avec impatience pour calculer la puce de m�moire AI peut se produire g�n�ralement des applications, et de promouvoir le d�veloppement rapide et durable de l'atterrissage AI. Lei Feng r�seau

Route de la soie

Apprenez � conna�tre la Chine

Apr�s pr�s de 30 ans de feu de silence! m�moire AI pour calculer comment briser le compte de la force de goulot d'�tranglement?