Il est que vous connaissez le mot-cl� volatile en principe Java de mise en uvre

avant-propos

Nous savons que le r�le du mot-cl� volatile est entre plusieurs threads pour assurer la visibilit� des variables, il est au cur du paquet java.util.concurrent, pas volatile pas de classes concurrentes pour notre utilisation.

Cet article d�taille comment interpr�ter ce que le mot-cl� volatile pour assurer la visibilit� des variables entre plusieurs threads Avant cela, il est n�cessaire d'expliquer la connaissance du cache du processeur, de ma�triser cette partie de la connaissance nous faire une meilleure compr�hension du principe volatil, ainsi en utilisant mieux et avec plus de pr�cision le mot-cl� volatile.

cache CPU

cache du processeur appara�t principalement pour r�soudre la vitesse du processeur et la vitesse d'acc�s m�moire ne correspond pas � la contradiction, parce que la vitesse de traitement du processeur est beaucoup plus rapide que la m�moire de lecture et une vitesse d'�criture, par exemple:

L'un des principaux acc�s � la m�moire est g�n�ralement des dizaines � des centaines de cycles d'horloge
Une cache d'�criture L1 n�cessite seulement un ou deux cycles d'horloge
cache L2 est une �criture que des dizaines de besoin de cycles

Une diff�rence significative de la vitesse d'acc�s, provoque la CPU peut prendre beaucoup de temps � attendre l'arriv�e des donn�es ou pour �crire des donn�es � la m�moire.

Sur cette base, le lecteur est maintenant dans la plupart des cas ne sont pas acc�der directement � la m�moire du processeur (CPU RAM ne sont pas connect�s � la broche), est remplac� par le cache du processeur, le cache du processeur est une m�moire temporaire situ�e entre la CPU et la m�moire, il Cependant, la capacit� de m�moire plus petite que la m�moire est beaucoup plus rapide que la vitesse de commutation. Le cache de donn�es est une petite partie des donn�es en m�moire, mais ceci est une petite partie de la CPU est sur le point de visiter un peu de temps, lorsque le CPU appelle beaucoup de donn�es, vous pouvez commencer � lire le cache, acc�l�rant ainsi la vitesse de lecture.

Conform�ment � l'ordre de lecture comment �troitement li� � la CPU, la m�moire cache du processeur peut �tre divis� en:

Cache: Cache court L1, situ� � c�t� du noyau du CPU, est combin� avec le cache du processeur CPU le plus �troitement
Acronyme moiti� de cache L2, deux sous-interne et externe des puces, la puce m�moire cache secondaire m�me vitesse et de fr�quence, la m�moire cache secondaire � puce externe, seule la fr�quence de la vitesse: cache secondaire
cache � trois niveaux: appel� Cache L3, une CPU haut de gamme uniquement

Chacune des donn�es stock�es dans le cache sont tous une partie du cache, le co�t de fabrication et la difficult� technique de ces trois est relativement diminue le cache, de sorte que sa capacit� est relativement incr�ments.

Lorsque le processeur de lire des donn�es, d'abord � partir d'un cache, sinon, trouver du cache secondaire, ou s'il n'y a pas de recherche � nouveau parmi les trois ou la m�moire cache. En g�n�ral, chaque niveau a un taux de succ�s de cache d'environ 80%, ce qui signifie que 80% du montant total des donn�es peut �tre trouv�e dans le cache, la quantit� totale de donn�es que seulement 20% de celui-ci a besoin du cache secondaire, trois m�moire ou cache de lecture.

L'utilisation du cache du processeur apport�

Avec un mot d'image CPU- quelque chose > cache du processeur - > La relation entre la m�moire principale pour lire des donn�es:

Lorsque le syst�me est en marche, la CPU ex�cute le processus de calcul est la suivante:

Les programmes et les donn�es sont charg�es dans la m�moire principale

Les instructions et les donn�es sont charg�es dans le cache du processeur

l'ex�cution d'instructions du processeur, les r�sultats de cache �crits

write-back � la m�moire principale cache de donn�es

Si le serveur est un processeur single-core, ces �tapes n'ont pas de probl�mes, mais si le serveur est CPU multi-core, la question est donc, de mettre en cache le mod�le conceptuel processeur Intel Core i7 � titre d'exemple (photo prise � en profondeur la compr�hension des syst�mes informatiques � ):

Imaginez la situation suivante:

Nuclear lire un octet 0, selon le principe de localisation, qui est �galement octets adjacents sont lus dans le coeur du cache 0

3 nucl�aire a fait le m�me travail ci-dessus, de sorte que le noyau nucl�aire 0 et 3 ont les m�mes donn�es de cache

0 octets modify nucl�aire qui, apr�s avoir �t� modifi�, les octets sont r��crites 0 cache nucl�aire, mais ces informations ne sont r��crites � la m�moire principale

L'acc�s � l'�me 3 octets, parce que le noyau 0 ne sauvegarde pas de donn�es d'�criture � la m�moire principale, les donn�es ne sont pas synchronis�es

Pour r�soudre ce probl�me, les fabricants de CPU ont d�velopp� une r�gle: Quand un octet modifi� cache CPU, d'autres CPU du serveur sera inform� que leur cache sera consid�r�e comme non valide. Ainsi, dans le cas ci-dessus, le noyau 3 se trouvent dans le cache de donn�es est invalide, le noyau 0 va �crire imm�diatement son propre retour de donn�es � la m�moire principale, et le noyau 3 Relire les donn�es.

Java bytecode le d�montage, le niveau assembleur pour voir ce qui a �t� fait sur le mot-cl� volatile

Avec la base th�orique de ce qui pr�c�de, nous pouvons �tudier comment mot-cl� volatile � la fin est atteint. Tout d'abord, �crire un code simple:

/ **

* @Author mai Changjei

* /

public � classe �LazySingleton {

priv� � statique � volatil �= LazySingleton instance nul ;

public � statique �LazySingleton getInstance () {

si �(Instance == nul ) {

instance = nouveau �LazySingleton ();

}

retour �par exemple;

}

public � statique � vide �main (String args) {

LazySingleton.getInstance ();

}

D'abord, regardez le fichier du code d�compilation, regardez la g�n�ration de code octet:

Rien de sp�cial. Vous savez, les instructions de bytecode, comme la figure de getstatic, ifnonnull, nouveau, et correspondent en fin de compte au niveau du syst�me d'exploitation, sont convertis en une seule instruction pour ex�cuter, machines de PC que nous utilisons, des serveurs d'applications d'architecture du processeur sont g�n�ralement est l'architecture IA-32, l'architecture de jeu d'instructions qui utilise une CISC (jeu d'instructions complexe), et le langage d'assemblage mn�monique est cet ensemble d'instructions.

Par cons�quent, �tant donn� que le niveau de bytecode, nous ne voyons pas d'indices, alors jetez un oeil sur le code suivant pour convertir les instructions de montage pourrait voir des indices. Le code de Windows ci-dessus pour voir le code assembleur correspondant est pas difficile (Tucao un, parler est facile, pour cette question que je cherchais toutes sortes d'informations, presque pr�t � installer la machine virtuelle et engager dans un syst�me Linux), hsdis d'acc�s les moyens de passage de l'outil de t�l�chargement direct puis extrait le t�l�chargement est termin�, et les hsdis-amd64.dll hsdis-amd64.lib deux fichiers peuvent �tre plac�s, au-dessous \ jre le chemin du serveur% JAVA_HOME% \ bin \:

Ensuite, ex�cutez la fonction principale, avant d'ex�cuter la fonction principale, ajoutez les param�tres de la machine virtuelle suivants:

-server -Xcomp -XX: + UnlockDiagnosticVMOptions -XX: + PrintAssembly -XX: CompileCommand = compileonly, * LazySingleton.getInstance

Pour ex�cuter la fonction principale, les instructions de montage de g�n�ration de code:

Java HotSpot (TM) 64 bits avertissement serveur VM: PrintAssembly est activ�, tourner sur DebugNonSafepoints pour gagner la sortie suppl�mentaire

CompilerOracle: compileonly * LazySingleton.getInstance

d�sassembleur Loaded de D: \ JDK \ jre \ bin \ server \ hsdis-amd64.dll

D�codage proc�d� compil� 0x0000000002931150:

code:

Argument 0 est unknown.RIP: Taille de code 0x29312a0: 0x00000108

# {M�thode} 'getInstance' '() LORG / XRQ / test / conception / singleton / LazySingleton,' dans 'org / XRQ / test / conception / singleton / LazySingleton'

# �(Sp de l'appelant)

0x00000000029312a0: mov dword ptr , EAX

0x00000000029312a7: pousser rbp

0x00000000029312a8: sub rsp, 10H; * entr�e de synchronisation

; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ -1 (ligne 13)

0x00000000029312ac: mov r10,7ada9e428h; {oop (un 'java / lang / Class' = 'org / XRQ / test / conception / singleton / LazySingleton')}

0x00000000029312b6: mov r11d, dword ptr

; * Exemple Getstatic

; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ 0 (ligne 13)

0x00000000029312ba: Test r11d, r11d

0x00000000029312bd: je 29312e0h

0x00000000029312bf: mov r10,7ada9e428h; {oop (un 'java / lang / Class' = 'org / XRQ / test / conception / singleton / LazySingleton')}

0x00000000029312c9: mov r11d, dword ptr

0x00000000029312cd: mov rax, r11

0x00000000029312d0: SHL rax, 3h; * exemple getstatic

; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ 16 (ligne 17)

0x00000000029312d4: add rsp, 10h

0x00000000029312d8: RBP pop

0x00000000029312d9: Test dword ptr , eax; {} poll_return

0x00000000029312df: ret

0x00000000029312e0: mov rax, QWORD ptr

0x00000000029312e4: mov r10, rax

0x00000000029312e7: add r10,10h

0x00000000029312eb: cmp r10, QWORD ptr

0x00000000029312ef: jnb 293135bh

0x00000000029312f1: mov QWORD ptr , R10

0x00000000029312f5: prefetchnta octet �ptr

0x00000000029312fd: mov r11d, 0e07d00b2h; {oop ( 'org / XRQ / test / conception / singleton / LazySingleton')}

0x0000000002931303: mov r10, QWORD ptr

0x000000000293130b: mov QWORD ptr , R10

0x000000000293130e: mov dword ptr , 0e07d00b2h

; {Oop ( 'org / XRQ / test / conception / singleton / LazySingleton')}

0x0000000002931315: mov dword ptr , R12d

0x0000000002931319: mov RBP, rax; * nouveau �; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ 6 (ligne 14)

0x000000000293131c: mov RDX, RBP

0x000000000293131f: appel 2907c60h; OopMap {RBP = Oop off = 132}

; * Invokespecial < initialisation >

; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ 10 (ligne 14)

; {} Optimisation virtual_call

0x0000000002931324: mov r10, RBP

0x0000000002931327: SHR r10,3h

0x000000000293132b: mov r11,7ada9e428h; {oop (un 'java / lang / Class' = 'org / XRQ / test / conception / singleton / LazySingleton')}

0x0000000002931335: mov dword ptr , R10d

0x0000000002931339: mov r10,7ada9e428h; {oop (un 'java / lang / Class' = 'org / XRQ / test / conception / singleton / LazySingleton')}

0x0000000002931343: SHR r10,9h

0x0000000002931347: mov r11d, 20b2000h

0x000000000293134d: mov octet �ptr , R12l

0x0000000002931351: Ajouter verrouillage dword ptr , 0h; * exemple putstatic

; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ 13 (ligne 14)

0x0000000002931356: JMP 29312bfh

0x000000000293135b: mov RDX, 703e80590h; {oop ( 'org / XRQ / test / conception / singleton / LazySingleton')}

0x0000000002931365: nop

0x0000000002931367: appel 292fbe0h; OopMap {off = 204}

; * nouveau �; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ 6 (ligne 14)

; {} Runtime_call

0x000000000293136c: JMP 2931319h

0x000000000293136e: mov RDX, rax

0x0000000002931371: JMP 2931376h

0x0000000002931373: mov RDX, rax; * nouveau �; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ 6 (ligne 14)

0x0000000002931376: add rsp, 10h

0x000000000293137a: RBP pop

0x000000000293137b: JMP 2932b20h; {} runtime_call

0x0000000002931380: mov RBX, 0h; {} no_reloc

0x000000000293138a: JMP 293138ah; {} runtime_call

0x000000000293138f: JMP 292fca0h; {} runtime_call

0x0000000002931394: appel 2931399h

0x0000000002931399: sous QWORD ptr , 5H

0x000000000293139e: JMP 2909000h; {} runtime_call

0x00000000029313a3: HLT

0x00000000029313a4: HLT

0x00000000029313a5: HLT

0x00000000029313a6: HLT

0x00000000029313a7: HLT

Tant du code assembleur, vous ne savez pas o� le CPU falsifi�, rien est facile, acc�dez � 59,60 deux lignes:

0x0000000002931351: Ajouter verrouillage dword ptr , 0h; * exemple putstatic

; - org.xrq.test.design.singleton.LazySingleton :: getInstance @ 13 (ligne 14)

La raison pour laquelle est parce que le positionnement des deux lignes ici indiquent la fin d'une ligne 14, ligne 14 qui est l'affectation de variable d'instance locale volatile. Retour ajouter dword ptr Apr�s, la compilation 0h des �tats sont normaux, ce qui signifie le pointeur de la pile � deux octets registre +0, la cl� est d'ajouter serrure ici en face de l'instruction, une analyse d�taill�e du r�le de verrou derri�re elle et pourquoi la bo�te d'instruction instruction et serrure � garantie la visibilit� de la m�moire du mot-cl� volatile.

instruction de verrouillage a

Ont dit avant l'architecture IA-32, l'architecture du processeur sur la question qui nous int�resse peut vous v�rifier, ici pour en savoir plus sur la description manuel d'instructions IA-32 de la serrure, aucun manuel IA-32 peut aller � cette adresse pour t�l�charger IA-32 T�l�charger manuel, une version chinoise du manuel.

Je extrait sur les manuels IA-32 qui d�crivent le r�le de l'instruction sur la serrure (parce que le r�le des instructions de verrouillage dans le manuel �parpill�s un peu partout, pas dit sp�cifiquement dans un chapitre ou une section):

Lors de la modification des op�rations de m�moire, le pr�fixe LOCK est utilis� pour appeler une lecture verrouill�e - modification - op�ration d'�criture, ce m�canisme de communication fiable entre des processeurs dans un syst�me multiprocesseur, d�crit comme suit:

(1) Au d�but des Pentium et les processeurs IA-32, g�n�re un signal de verrouillage pr�fixe # LOCK fait que le processeur d'instructions en cours, ce qui provoque toujours un verrou de bus explicite se produit

(2) Dans Pentium4, Inter processeurs Xeon s�rie et P6, les op�rations de verrouillage sont g�r�es par le verrouillage de bus de la m�moire cache ou verrous. S'il y a un acc�s � la m�moire cache et affecte une seule ligne de cache, l'op�ration est appel�e un verrou de cache, sans �tre bloqu� dans la m�moire du bus syst�me et le syst�me de la zone r�elle. Pendant ce temps, d'autres Pentium4, Intel Xeon, ou processeurs de la s�rie P6 sur cette �criture de bus de retour cache de donn�es modifi�es tous et les faire �chouer, afin d'assurer la coh�rence de la m�moire du syst�me. Si aucun acc�s � la m�moire cache et / ou il couvre une limite de ligne de cache, le processeur produira signal LOCK #, et ne r�pond pas au bus pendant le fonctionnement de la demande de commande de verrouillage

32 bits IA-32 supports de processeur d'une op�ration de m�moire de syst�me atomes de zone verrouill�e. Ces op�rations sont utilis�es pour g�rer les structures de donn�es partag�es (comme s�maphores, descripteur, table de page syst�me ou segment), deux ou plusieurs processeurs peuvent �galement �tre modifi�s dans les m�mes donn�es de domaine ou flag ces structures de donn�es. Le processeur utilise un m�canisme permettant de mettre en oeuvre trois interd�pendants verrouill� op�rations atomiques:

1, afin d'assurer que le fonctionnement atomique

2, le verrouillage du bus, et en utilisant le signal de verrouillage # BLOCAGE pr�fixe d'instruction

3, un protocole de coh�rence de cache pour assurer l'ex�cution de l'op�ration atomique (verrouillage du cache) structure de donn�es dans le cache. Ce m�canisme existe dans le Pentium4, Intel Xeon et les processeurs de la famille P6

processeurs IA-32 est pourvu d'un signal LOCK #, il est activ� automatiquement lors de certaines op�rations de m�moire critique, pour verrouiller le bus syst�me. Lorsque le signal de sortie d�livr� par le processeur de commande ou la demande d'un autre agent de bus est bloqu�. D'autres applications logicielles peuvent �tre sp�cifi�es par la s�mantique requise pr�fixe LOCK LOCK est ajout� � l'avance avant l'instruction.

Dans Intel386, Intel486, processeur Pentium instruction explicitement verrouillage entra�nera le signal LOCK #. Un concepteur de mat�riel pour assurer la disponibilit� du mat�riel du syst�me, signal de verrouillage # pour contr�ler l'acc�s � la m�moire entre les processeurs.

Pour Pentinum4, Intel Xeon et les processeurs de la famille P6, si la zone de m�moire cache est accessible � l'int�rieur du processeur, il est g�n�ralement pas question signal de verrouillage de #, bien au contraire, applique uniquement au cache du processeur de verrouillage.

Est explicitement appliqu� la s�mantique LOCK, le logiciel peut �tre modifi� dans la zone de m�moire d'instructions suivante en utilisant le pr�fixe LOCK. Lorsque le pr�fixe LOCK avant que d'autres instructions sont plac�es dans la m�moire ou l'instruction ne fait pas �criture (c.-�-destination op�rande dans le registre), produisent une exception de codes d'op�ration ill�gal (#UD).

[1] essai de bits et des instructions de modification (BTS, BTR, BTC)

[2] l'instruction de permutation (XADD, cmpxchg, CMPXCHG8B)

[3] assumer automatiquement l'instruction pr�fixe BLOCAGE a XCHG

[4] en suivant les instructions simples op�rande arithm�tiques et logiques: INC, DEC, NOT, NEG

[5] Les instructions arithm�tiques et logiques suivantes nombre de double op�ration: ADD, ADC, SUB, SBB, AND, OR, XOR

Une instruction de verrouillage veillera � ce que la zone de m�moire d'op�rande de destination o� le verrou, mais le syst�me pourrait expliquer un peu plus grande zone ferm� � cl�.

Le logiciel devrait utiliser la m�me adresse pour acc�der � la longueur de l'op�rande et de la quantit� du signal (transmission de signal entre le processeur de la m�moire partag�e utilis�e). Par exemple, si un traitement de texte � utiliser pour acc�der � un s�maphores, les autres processeurs ne devraient pas �tre utilis�s pour acc�der � un octet s�maphores.

Pas de bus affecte l'int�grit� de la zone de m�moire de verrouillage align�. Le verrouillage de la s�mantique continue de se r�unir le nombre de cycles de bus n�cessaires pour mettre � jour l'ensemble op�rande. Toutefois, nous vous recommandons d'utiliser le verrouillage doit �tre align� sur leurs fronti�res naturelles, afin d'am�liorer les performances du syst�me:

Boundary [1] tout acc�s � 8 bits (verrouill� ou d�verrouill�)

16 fronti�re [2] pour acc�der au mot verrouill�

[3] verrouillage limite l'acc�s double mot de 32 bits

64 limite [4] d'acc�s verrouill� � quatre caract�res

Pour toutes les autres op�rations de m�moire et tous les �v�nements ext�rieurs visibles, l'op�ration de verrouillage est atomique. Toutes les tables de pages et les op�rations peuvent �tre verrouill�es aller chercher sur l'instruction. Verrouill� instructions peuvent �tre utilis�es pour synchroniser des donn�es d'�criture du processeur et d'autres donn�es lues fonctionnement du processeur.

l'architecture IA-32 pr�voit plusieurs m�canismes utilis�s pour renforcer ou d'affaiblir le mod�le de commande de m�moire pour g�rer les situations de programmation sp�ciale. Ceux-ci comprennent:

[1] instruction I / O, le verrouillage de commande, l'instruction s�rialis�e pr�fixe LOCK et analogues, pour forcer la commande forte sur un processeur

[2] des instructions fournissent des capacit�s de tri SFENCE s�rie et de certains types particuliers d'op�rations de m�moire (introduites dans le Pentium III) et des instructions de LFENCE, des instructions de MFENCE (et des processeurs int�gr�s Pentium4 Intel Xeon)

... (Il y a aussi deux ne pas �crire)

Ces m�canismes peuvent �tre utilis�s de la mani�re suivante.

Mapp�s en m�moire des dispositifs sur le bus, et d'autres unit�s I / O sont g�n�ralement tr�s sensibles � leurs tampons d'�criture s�quentielles, l'instruction I / O (instructions IN et OUT instruction) command� de la mani�re suivante pour effectuer un tel solide op�ration d'�criture de l'acc�s . Avant d'effectuer un I / O instruction, le processeur attend jusqu'� ce que toutes les instructions sont termin�s et tous les tampons sont la m�moire sont �crites. Seulement fetch et table de page recherche peut traverser les E / S des instructions, suivez les instructions pour attendre l'ex�cution d'instructions E / S est termin�e avant de commencer.

Ruminant instruction IA-32 manuel pour verrouiller le r�le de ces paragraphes la description, nous pouvons tirer plusieurs fonctions de commande verrouiller:

Verrouiller le bus, l'autre requ�tes de lecture et d'�criture m�moire CPU sont bloqu�es jusqu'� ce que le verrou est lib�r�, mais les processeurs r�els ult�rieurs ont verrou de remplacement de verrouillage du cache du bus, le bus car la surcharge de verrouillage est relativement grande, l'autre CPU ne peut pas acc�der � la p�riode de verrouillage du bus m�moire

Apr�s l'op�ration d'�criture de verrouillage r�digera donn�es modifi�es, tout en permettant une autre ligne de cache CPU correspondante est invalid�e afin de recharger les derni�res donn�es de la m�moire principale

barri�re de m�moire n'est pas en mesure d'effectuer une fonction similaire � la barri�re de la m�moire, l'instruction de barri�re emp�che r�ordonnancement deux fois

(1) en raison de l'efficacit� d'�criture, le verrouillage r�el des processeurs plus tard ont la m�moire cache au lieu de bloquer le bus, en accord avec ce sc�nario et plus de donn�es sont mises en cache par le protocole de coh�rence de cache pour garantir que nous regardons ce qui est mis en cache, protocole de coh�rence.

protocole de coh�rence de cache

Avant de parler la coh�rence du cache, d'abord parler du concept d'une ligne de cache:

cache segment�e (ligne) d'un segment correspondant � un espace de stockage, que nous appelons la ligne de cache, qui est la plus petite m�moire cache du processeur de l'unit� peut �tre allou�, la taille de 32 octets, 64 octets, 128 octets allant ce d�pendant de l'architecture du processeur, est g�n�ralement de 64 octets. Lorsque la CPU voir une instruction de lecture de la m�moire, l'adresse de m�moire qui sera transmis � un cache de donn�es, un contr�le de cache de donn�es pour voir si elle a cette adresse m�moire cache correspondant au segment, sinon mettre l'ensemble du segment du cache de la m�moire (ou le cache de niveau sup�rieur) est charg�. Notez ici que la premi�re charge l'ensemble du segment de cache, ce qui est mentionn� ci-dessus sur le principe de la localit�

Au-del�, # LOCK verrouille le bus, en fait, est irr�aliste, car trop faible l'efficacit� du bus de verrouillage. Par cons�quent, il est pr�f�rable de le faire: utiliser plusieurs jeux de cache, mais leur comportement semble �tre un seul jeu de cache. protocole cache est con�u coh�rence pour le faire, comme son nom l'indique, ce type d'accord est de faire plusieurs ensembles de coh�rence du contenu mis en cache.

Il existe une vari�t� de protocole de coh�rence de cache, mais la plupart du mat�riel informatique traitement quotidien sont � renifler (fouiner) � accord, son id�e de base est le suivant:

Tout transfert de m�moire se produit sur un bus partag�, et tout processeur peut voir ce bus: cache lui-m�me est ind�pendant, mais la m�moire est des ressources partag�es, tous les acc�s m�moire passent par l'arbitrage (la m�me instruction le cycle, une seule CPU peut lire et �crire la m�moire cache).

cache CPU traite non seulement avec le bus � temps pour faire le transfert de m�moire, mais les donn�es conserv�es se produisant sur le reniflement d'�change de bus, suivi d'autres caches faire. Alors, quand un nom de cache du processeur, il appartient � lire et � la m�moire d'�criture, d'autres processeurs sont notifi�s, afin de faire leur propre cache pour suivre le rythme. Tant qu'un processeur, une �criture de m�moire, d'autres processeurs savent imm�diatement que la m�moire n'est plus valide dans leur segment de cache.

protocole MESI est le plus courant du protocole de coh�rence de cache, le protocole MESI, chaque ligne de cache a quatre �tats, repr�sent�s par le bit 2 est disponible, ils sont les suivants:

Ici I, S et M ont le concept d'un �tat correspondant �: �chec / non charg�, segment de cache propre et sale. Ainsi, ces nouvelles connaissances que l'�tat E, au nom d'un acc�s exclusif � l'Etat pour r�soudre le � Avant de commencer � modifier un morceau de m�moire, nous devons dire aux autres processeurs, � cette question: que lorsque la ligne de cache est dans l'�tat E ou M le processeur peut �crire, que seulement dans ces deux �tats, le processeur est exclusif � cette ligne de cache. Lorsque le processeur d'�crire une ligne de cache, si elle ne dispose pas de droits exclusifs, il faut d'abord envoyer une demande � Je veux des droits exclusifs � au bus, qui informera l'autre processeur pour les copier ont l'�chec m�me segment de cache ( Si l�-bas). Seulement apr�s avoir obtenu des droits exclusifs, le processeur peut commencer � modifier les donn�es - et cette fois le savoir processeur que ce n'est une copie de la ligne de cache, dans mon propre cache, donc il n'y aura pas de conflits.

A l'inverse, s'il y a d'autres processeurs que vous voulez lire la ligne de cache (bient�t savoir, comme cela a �t� le bus renifler), ligne de cache exclusive ou modifi� doit d'abord revenir � l'�tat de � partage �. Si la ligne de cache est modifi�e, il a mis aussi le contenu �crit de nouveau � la m�moire.

En regardant en arri�re � l'instruction de verrouillage pour lire et �crire des variables volatiles

Je crois � l'interpr�tation de la serrure, la r�alisation du principe du mot-cl� volatile doit �tre claire de celui-ci. Premier coup d'oeil sur une carte:

Le travail de m�moire est en fait la m�moire de travail des registres CPU et caches d'abstraction, ou chaque fil de la m�moire de travail peut �tre comprise simplement comme les registres CPU et les caches.

Ensuite, lorsque le fil d'�criture et de deux fil-A Threab-B fonctionnent simultan�ment une variable de m�moire principale volatile i, une �criture de la variable Fil-A i, alors:

Thread Une commande BLOCAGE #
Vous pouvez verrouiller commande # bus (ligne ou cache de verrouillage) �mis, tout en permettant le contenu de la ligne de cache dans le cache thread-B D�faut
�criture fil-A retour � la m�moire principale des changements r�cents i

Discussion-B lit variable i, alors:

Discussion-B a trouv� une ligne de cache correspondant � l'adresse est verrouill�e, en attendant la sortie de la serrure, le protocole de coh�rence de cache veillera � ce que lit la derni�re valeur

On peut voir, lire et lire des variables ordinaires mot-cl� volatile est fondamentalement aucune diff�rence par rapport � la diff�rence principalement dans les variables d'op�ration d'�criture.

post-scriptum

Avant le r�le du mot-cl� volatile me confondre personnellement il y a quelques erreurs, apr�s une connaissance approfondie du r�le du mot-cl� volatile, se sentant une compr�hension profonde de beaucoup volatile. Je crois que vous voyez l'article ici, tant que pr�t � penser, pr�t � �tudier, me comme soudainement r�alis�, le sentiment �clair� ^ _ ^

Documents de r�f�rence

"IA-32 Architectures Software Developer est Manuel Volume 3: Guide de programmation du syst�me"
� L'art de programmation Java en m�me temps �
� Compr�hension en profondeur de la machine virtuelle Java: JVM fonctionnalit�s avanc�es et les meilleures pratiques. �
Voir PrintAssembly petite note volatile code assembleur
coh�rence de m�moire cache (cache Coherency) Mise en route
Parlez de haute concurrence (trente-quatre) mod�le de m�moire Java ces choses (b) comprendre le fonctionnement du cache du processeur

Route de la soie

Apprenez � conna�tre la Chine

Il est que vous connaissez le mot-cl� volatile en principe Java de mise en uvre