Home Tests Hardware Test Nehalem: Bloomfield i7-920 et 965 - Quelques détails de l’Architecture Nehalem

03

Nov

2008

Test Nehalem: Bloomfield i7-920 et 965 - Quelques détails de l’Architecture Nehalem

Écrit par Julien Arrachart   
Hits

Quelques détails de l'Architecture Nehalem

Une des principales nouveautés dans cette architecture, c'est le remplacement du FSB par le QPI. Il ne s'agit pas d'un simple changement de nom, mais bien d'une refonte du système.
Sur vos ordinateurs, le FSB est un bus qui fait la liaison de communication entre le processeur et la mémoire vive, jusqu'à maintenant chez Intel il était placé dans le northbridge.
Le principal problème, du moins inconvénient dirons-nous, c'est la bande passante du FSB qui pouvait parfois limiter celle de la mémoire, et qui peut être surchargée lors des transferts.
Alors, pour palier en partie a cette limitation, Intel a augmenté la fréquence de son FSB, passant de 1066 à 1333 puis 1600 MHz sur les dernières cartes mères Core 2.
Mais sur le Nehalem, il n'est plus question de parler de FSB ! Le contrôleur mémoire n'est plus dans le northbridge, mais directement dans le processeur. Cela permet de faire transiter les données plus rapidement, sans être limité par la bande passante.
communication-memoire
La bande passante du QPI est différente au sein même des processeurs Bloomfield. Sur le I7-965, la version Extrême, le QPI atteint 6.4 GT/s, contre tout de même 4.8 GT/s pour le I7-920 et 940.
Il faut aussi prendre en considération que le lien QPI est bidirectionnel. Au final, le I7-965 permet d'avoir une bande passante deux fois plus rapide que le FSB 1600 MHz, on arrive à 25.6 Gb/s contre 12.8 Gb/s. Les transferts de données de la mémoire vont désormais directement vers le CPU.
Mais cette fonctionnalité n'est pas une nouveauté, AMD l'a déjà utilisé bien avant, et même actuellement sur son Phenom par exemple, mais sous un autre nom, l' « Hyper Transport », tout comme pour Intel avec les Xeon et l'Itanium. Elle refait de nouveau surface chez Intel avec le Nehalem.

Après le dual Channel, voici le Tri-Channel

Afin d'augmenter aussi la bande passante de la mémoire vive, Intel a décidé de faire du TRI-Channel, de la mémoire vive sur 3 canaux, au lieu de 2 canaux pour le Dual-Channel. Dans la théorie, cela permet d'atteindre des débits encore plus importants, mais en pratique il faudra vérifier le gain de performance supplémentaire. Ainsi, la plupart des cartes mères commercialisées auront 6 ports de mémoire, voir 3 ou 4 ports, mais elles seront un peu plus rares.
Comme on est en plein discours sur la mémoire vive, faisons un point sur la tension. Si certaines cartes mères disposaient un autocollant sur ses ports mémoires, signalant que l'utilisation d'une tension mémoire supérieure à 1.6V pouvait endommager le processeur, cela ne pose plus de problème sur les versions actuelles. Il sera possible d'utiliser des barrettes mémoires ayant une tension certifiée au-dessus des 1.6V.
Pour les kits mémoires, c'est une pluie d'annonces. Les différents constructeurs sont bien sûr au rendez-vous et nous présentent leurs futurs kits mémoires, tel que Corsair, Gskill, A-Data, OCZ et on pourrait en citer plusieurs autres. Mais qu'ont-ils de différent ces nouveaux kits ? Ce qu'ils apportent de plus, tout simplement l'utilisation du Tri-Channel en 3 x 2 Go ou 3 X 1 Go ou bien plus encore en quantité.
Pour faire le test du Nehalem, nous avons reçu le kit Corsair 3 x 2 Go en PC-16000, affichant des timings de 8.8.8.24 pour 1.65V. Mais nous reviendrons en détail dans un prochain article complet sur cette mémoire.

SMT, ou plus couramment appelé « Hyper Threading »

Voici une autre apparition sur le Nehalem, nous n'appellerons pas cela une nouveauté, puisque le SMT, qui est plus connu sous le nom de « Hyper Threading » a été utilisé pour la première fois sur le Pentium 4 et les Xeon. Depuis, Intel a abandonné cette fonction sur son architecture Core 2, mais elle revient sur le devant de la scène.
smt
Pour expliquer de la façon la plus simple, le SMT consiste à faire fonctionner 2 Threads simultanément par core, en émulant un core logique. (Étant donné les 4 cores physiques d'un Quad, il y aura 8 cores logiques). Cela permet de partager les instructions sur plusieurs cores logiques, au lieu d'accéder aux requêtes l'une après l'autre, le SMT permet d'accéder à deux requêtes simultanément par core.
En théorie, tout comme dans la pratique, cela a montré des gains de rapidité surtout dans les logiciels multimédias, mais sous certains logiciels cela pouvait aussi causer des ralentissements.

Le Cache L3 fait son apparition

En plus de la mémoire cache L1 et L2, le L3 (3e cache) fait son entrée, avec une capacité de 8 Mo, elle sera partagée entre les 4 cores du Quad. Contrairement au Cache L1 et L2 qui sont directement dans les cores, avec un total de 128 Kb et 1 Mo. (32kb et 256 kb par core).
cache2
Le fonctionnement de la mémoire cache, comme son nom l'indique, consiste à stocker les informations d'une autre mémoire plus lente, dans le but d'optimiser les temps d'accès, puisque la mémoire cache est plus rapide.
uncore
L'architecture du Bloomfield est en quelque sorte divisée en deux parties. Dans la partie core, on a les 4 cores physiques du Quad, ainsi que leur mémoire cache L1 et L2 qu'ils possèdent chacun.
Le cache L3 se partage entre les 4 cores, tout comme le QPI, IMC..., ils se situent dans la partie Uncore, les deux parties communiquent donc ensemble.
En plus de ces changements apportés à cette architecture, c'est l'arrivée du jeu d'instruction SSE 4.2 au lieu du 4.1 sur les Core 2. Il s'agit d'instructions visant à améliorer l'usage multimédia.
Il y a aussi le mode « Turbo », une fonctionnalité déjà implantée pour les ordinateurs portables. Il consiste à augmenter légèrement les fréquences des cores lors de fortes charges sous des logiciels ne tirant pas profit du Multi-core, ce qui devrait en théorie augmenter un petit peu les performances.
D'ailleurs, on peut vérifier que cette fonctionnalité est bien activée, car lorsque nous avons effectué les tests du SuperPI à la fréquence d'origine, le coefficient d'origine bloqué à 20 est passé à 21, ce qui augmente par « défaut » la fréquence de fonctionnement du processeur de 133 MHz. Cela devrait donc apporter un petit gain de performance supplémentaire, toujours bon à prendre.
Des changements et des nouveautés, il y en a eu plein, qui se cachent sous des noms assez complexes, surtout dans le domaine des « Instructions ». Nous avons donc fait un point juste sur les principaux thèmes de cette architecture, chose qui a déjà été faite plus en détail depuis maintenant quelques jours sur divers sites. Ce qui vous intéresse le plus à l'heure actuellement, c'est surtout l'overclocking et les performances du Bloomfield !


 

Articles

Test Danger Den Double Wide Tower - 21 Black Series Edition

Test Danger Den Double Wide Tower - 21 Black Series Edition

Aujourd'hui nous allons tester le boîtier Danger Den Double Wide Tower...

Lire la suite

Test Asus Sabertooth X58

Test Asus Sabertooth X58

Asus que l’on ne présente plus, met à jour sa gamme...

Lire la suite

GOOC 2010 France : La Finale !

GOOC 2010 France : La Finale !

C'est la finale du GOOC 2010 France. Et c'est parti ! Notre...

Lire la suite
HitParade