CentraleSupélecDépartement informatique
Plateau de Moulon
3 rue Joliot-Curie
F-91192 Gif-sur-Yvette cedex
1CC1000 - Systèmes d'Information et Programmation - TD : Comparaison d'ordinateurs

Considérez les trois ordinateurs Dell décrits dans le tableau suivant.

 

ModèleLatitude 3440Precision Mobile 7780Precision 7960
TypeOrdinateur portableStation de travail portableStation de travail
ProcesseurIntel Core i5-1335UIntel Core i9-13950HXIntel Xeon w9-3495X
Mémoire (RAM)8GB - 3 200 MT/s - DDR4 (1 × 8GB)32GB - 5 600 MHz - DDR5 (1 × 32GB)512 GB - 4 800 MHz - GDDR6 (8 × 64 GB)
GPUIntel Iris Xe Graphics G7 80EUs (integrated)NVIDIA RTX 3500NVIDIA RTX A6000
DisqueSSD 256 GBSSD 1 TBRAID 5 : 4 × SSD 4To
Taille14" - 1920 × 108015.6" - 3840 × 2160--
Poids1.5 kg2.5 kg--
Prix900 €4 600 €32 100 €
Spécificationscliquez icicliquez icicliquez ici

 

Le premier ordinateur est un portable léger adapté à une utilisation personnelle et/ou bureautique. Le deuxième est une station de travail portable qui permet d'exécuter des applications nécessitant du calcul et du graphisme. Le troisième est un serveur puissant capable de travailler sur des calculs massifs tels que l'apprentissage profond.

 

Ordinateurs comparés en 2020
ModèleLatitude 3410Precision Mobile 7550Precision 7920
TypeOrdinateur portableStation de travail portableStation de travail
ProcesseurIntel Core i5-10210UIntel Core i9-10885H2 × Intel Xeon Gold-5220
Mémoire (RAM)8Go 2667MHz DDR4 (1 × 8Go)32Go 2933MHz DDR4 (2 × 16Go)128Go 2933 MHz DDR4 (8 × 16Go)
GPUUHD620 (integrated)NVIDIA Quadro T2000Nvidia Quadro GV100
DisqueSSD 128 GoSSD 512 GoRAID 5 : 8 × SSD 1 To - SATA
Taille14" 1366 × 76815.6" - 3840 × 2160--
Poids1.6 kg2.5 kg--
Prix500 €1 500 €7 500 €
Spécificationscliquez icicliquez icicliquez ici

 

Regardez les spécifications des deux premiers ordinateurs (lien dans la dernière ligne du tableau). Combien d'écrans peuvent être utilisés simultanément sur les deux ordinateurs portables, sans tenir compte des caractéristiques de la carte graphique ?



ÉLÉMENTS DE RÉPONSE

  • Latitude 3440 : 3 écrans
    • Écran de l'ordinateur.
    • Port HDMI 1.4 : possibilité de brancher un écran.
    • Port USB 3.2 Gen 2 Type-C avec DisplayPort : possibilité de brancher un écran.
  • Precision Mobile 7780 : 7 écrans
    • Écran de l'ordinateur.
    • Ports HDMI 2.0a or 2.1 : possibilité de brancher un écran.
    • USB 3.2 Gen 2 Type-C port avec DisplayPort : possibilité de brancher un écran.
    • 2 x Thunderbolt 4 ports avec USB Type-C : on peut brancher deux écrans 4K à chaque port.

Quels sont les taux de transfert de données sur les connexions disponibles des deux ordinateurs portables ?



ÉLÉMENTS DE RÉPONSE

  • Latitude 3440
    • USB 3.2 Gen 1 : 5 Gbit/s
    • USB 3.2 Gen 2 Type-C : 10 Gbit/s
    • RJ45 (Ethernet) : 10/100/1000 Mbit/s
    • Wifi : jusqu'à 2400 Mbit/s
    • Bluetooth 5.3 : jusqu'à 2 Mbit/s
    • WWAN module : jusqu'à 1 Gbit/s DL - 150 Mbit/s UL
  • Precision Mobile 7780 : add/change
    • Thunderbolt 4 ports with USB Type-C : 40 Gbit/s
    • WWAN module : jusqu'à 3 Gbit/s DL - 250 Mbit/s UL

 

Nous voulons maintenant comparer les processeurs (CPU) des trois ordinateurs. La table suivante résume les points clés. Une comparaison exhaustive et officielle est disponible ici.

 

 Intel Core i5-1335UIntel Core i9-13950HXIntel Xeon w9-3495X
Nombre de cœurs2 + 88 + 1656
Fréquence de base1.7 GHz2.20 GHz1.90 Ghz
Fréquence turbo4.60 GHz5.50 Ghz4.80 Ghz
Cache12 MB36 MB105 MB
Puissance15W55W350W
Taille mémoire max64 GB128 GB4 TB
Canaux mémoire max228
Prix recommandé$340.00$590.00$5889.00
Geekbench 5 single-core score (cpu-monkey)162821081734
Geekbench 5 multi-core score (cpu-monkey)72401975956911

 

Ordinateurs comparés en 2020
 Intel Core i5 10210UIntel Core i9 10885HIntel Xeon Gold 5220
Nombre de cœurs4818
Fréquence de base1.6 GHz2.40 GHz2.20 Ghz
Fréquence turbo4.20 GHz5.30 Ghz3.90 Ghz
Cache6 MB16 MB25 MB
Puissance15 W45 W125 W
Taille mémoire max64 GB128 GB1 TB
Fréquence mémoire max2 667 MHz2 933 MHz2 667 Mhz
Canaux mémoire max226

 

  • Discutez les différences entre les trois processeurs. Pourriez-vous dire ce que signifient les différentes caractéristiques énumérées dans le tableau ?
  • Examinez les limites du CPU en matière de mémoire. Ces limitations sont-elles respectées dans la configuration matérielle des trois ordinateurs ? Peut-on encore ajouter de la mémoire aux trois configurations ?

ÉLÉMENTS DE RÉPONSE

Voici une description des caractéristiques :

  • Nombre de cœurs. Un cœur est une unité de calcul d'un CPU. Un cœur peut lire et exécuter des instructions d'un programme. Un CPU multicœur peut exécuter plusieurs instructions en même temps.
  • Fréquence de base. Fréquence de l'horloge du CPU dans des conditions d'utilisation normales.
  • Fréquence turbo. Fréquence de l'horloge du processeur en cas d'utilisation intensive. La technologie Turbo Boost augmente dynamiquement la fréquence de l'horloge pour gérer une charge de travail importante. La fréquence de l'horloge est définie en fonction de la chaleur du système et du nombre de cœurs utilisés. La fréquence d'horloge ne peut pas dépasser celle spécifiée par la fréquence turbo.
  • Cache. Indique la quantité de mémoire cache intégrée dans la puce du processeur.
  • Puissance. Niveau moyen de chaleur générée en cas d'utilisation intensive lorsque le CPU fonctionne à sa fréquence de base.
  • Taille mémoire max. Quantité maximale de mémoire que le CPU peut adresser.
  • Canaux mémoire max. Nombre maximal de modules de mémoire pouvant être reconnus par le CPU.
  • Geekbench. Un benchmark, c'est-à-dire un ensemble de tests de performance, qui donne un score de performance à un CPU. Les scores figurant dans le tableau sont tirés du site web cpu-monkeys.

En général, une fréquence d'horloge plus élevée signifie un processeur plus rapide. Cependant, de nombreux autres facteurs peuvent affecter les performances. Le CPU dispose de plusieurs moyens pour optimiser l'exécution des instructions du programme. La technologie actuelle permet de répartir intelligemment l'exécution des instructions entre les cœurs de l'ordinateur. Il est donc possible qu'un ancien processeur ayant une fréquence d'horloge plus élevée soit moins performant qu'un processeur plus récent ayant une vitesse d'horloge plus faible.

La taille de la mémoire cache est également importante.

Les benchmarks sont utilisés pour comparer les performances des CPUs. Le tableau montre que l'Intel Core i9 a un meilleur score que l'Intel Xeon (qui coûte plus cher) lorsqu'un seul cœur est utilisé. Ceci est vrai pour le benchmark sélectionné, un autre peut donner un résultat différent. Les scores de performance doivent être considérés avec prudence.

En ce qui concerne la deuxième question, nous constatons que les trois configurations matérielles respectent les limites de la mémoire. En fait, les deux premiers ordinateurs n'utilisent qu'un seul canal de mémoire, nous pouvons donc ajouter un module supplémentaire, car les CPU respectifs supportent deux canaux.

Enfin, vous avez peut-être remarqué que les deux premiers ordinateurs ont deux types de cœurs. Vous pouvez le voir dans les spécifications détaillées. Les processeurs Intel sont généralement équipés de cœurs P (ou cœurs de performance) et de cœurs E (ou cœurs efficaces). Les premiers sont utilisés pour les charges de travail lourdes ; ils sont plus performants, mais ils coûtent plus cher et génèrent plus de chaleur (ils consomment donc plus d'énergie). Les seconds sont utilisés pour les tâches d'arrière-plan qui ne nécessitent pas une grande puissance de calcul. Ils sont moins performants, mais ils coûtent moins cher et génèrent moins de chaleur. L'objectif d'avoir deux types de cœurs est de trouver un équilibre entre les performances, le coût et la consommation d'énergie du CPU.


 

Maintenant nous considérons le GPU (graphics processing unit). La table suivante décrit les caractéristiques des GPU des trois ordinateurs.

 

 Intel Iris Xe Graphics G7 80EUs (integrated)NVIDIA RTX 3500NVIDIA RTX A6000
Nombre de cœurs (CUDA)805 12010 752
Fréquence d'horloge1 250 MHz1 545 MHz2 505 MHz
Mémoire8 GB (partagée)12 GB48 GB
FP16 performance768.0 GFLOPS15.82 TFLOPS38.7 TFLOPS
FP32 performance384.0 GFLOPS15.82 TFLOPS38.7 TFLOPS
FP64 performance96.0 GFLOPS247.2 GFLOPS1.21 TFLOPS
Tensor cores (Apprentissage profond)--160336
Consommation d'énergie max< 15W100W300 W

 

Ordinateurs comparés en 2020
 UHD620 (integrated)NVIDIA Quadro T2000Nvidia Quadro GV100
Nombre de cœurs (CUDA)19210245120
Fréquence d'horloge1150 MHz1785MHz1627MHz
Mémoire32GB(partagée)4GB32GB
FP16 performance768.0 GFLOPS7.3 TFLOPS29,6 TFLOPS
FP32 performance384.0 GFLOPS3.6 TFLOPS14,8 TFLOPS
FP64 performance96.0 GFLOPS114.2 GFLOPS7,4 TFLOPS
Tensor cores (Apprentissage profond)----640
Tensor performance----118,5 TFLOPS
Consommation d'énergie max< 15W60W250 W

 

Comparez les caractéristiques des trois GPU. Pourriez-vous dire ce que signifient les différentes caractéristiques énumérées dans le tableau ?


ÉLÉMENTS DE RÉPONSE

  • Les GPU exécutent simultanément des calculs identiques (parallélisme des données) sur un vecteur de données et produisent un vecteur de sorties correspondant. Leur fonction première est le rendu d'images tridimensionnelles, mais ils sont également utilisés pour exécuter des applications avec beaucoup de calculs où le parallélisme des données est impliqué.
  • Dans le premier ordinateur, le GPU est intégré au CPU. Par conséquent, le CPU et le GPU partagent la même mémoire. Bien que l'intégration du GPU dans le CPU se traduise par des performances moindres, pour la plupart des utilisateurs, il s'agit d'une solution pratique et bon marché. Les joueurs et les développeurs d'applications graphiques ont besoin d'une configuration avec un GPU dédié.
  • Les deuxième et troisième ordinateurs sont équipés de GPU NVIDIA dédiés. Ces GPU disposent d'une mémoire dédiée.
  • Les GPU NVIDIA se composent de plusieurs cœurs CUDA. CUDA (Compute Unified Device Architecture) est une plateforme NVIDIA qui permet de développer des applications pour les GPU. Un cœur CUDA exécute une opération en virgule flottante par cycle d'horloge. Par conséquent, le nombre de cœurs et la fréquence d'horloge sont de bons indicateurs des performances d'un GPU.
  • FP16, FP32 et FP64 correspondent respectivement à la précision d'un float sur 16 bits, 32 bits et 64 bits.
  • Les performances FP16, FP32 et FP64 se réfèrent au nombre d'opérations en virgule flottante par seconde. Ce nombre est mesuré en GFLOPS (Giga floating point operations per second) ou en TFLOPS (Tera floating point operations per second). Les valeurs du tableau sont importantes pour la comparaison, mais elles sont théoriques. Pour obtenir une comparaison concrète, il est préférable de rechercher des benchmarks.
  • Les cœurs CUDA étant limités à l'exécution d'une opération par cycle d'horloge, NVIDIA a développé des cœurs plus avancés, appelés cœurs tenseurs. Ils peuvent calculer des opérations matricielles entières par cycle d'horloge et apporter de nouvelles applications d'apprentissage profond aux GPU.

 

Considérons une batterie d'ordinateur portable typique de 50 Wh. Les écrans de ces ordinateurs portables consomment de 10 à 20 W en fonction de leur taille et de leur luminosité.

Sachant que les trois composants le plus énergivores dans un ordinateur portable sont le CPU, l'écran et le GPU, discutez de l'autonomie et de la consommation d'énergie des deux ordinateurs portables.


ÉLÉMENTS DE RÉPONSE

  • Le premier ordinateur portable consomme 15W pour le processeur et son GPU intégré et 10W pour l'écran, il peut tenir plus de 2 heures avec une charge élevée (si la batterie n'est pas défectueuse).
  • Le deuxième ordinateur portable consomme 45W (processeur) + 60W (GPU) + 20W (écran) = 125W. Sans batterie auxiliaire, nous avons moins de 30 minutes d'autonomie en cas de charge élevée.

Dans les architectures informatiques modernes, la fréquence de chaque composant est automatiquement ajustée "à la volée" en fonction des besoins réels, afin d'économiser de l'énergie et de réduire la quantité de chaleur générée par les circuits.


 

 

[Pour les plus avancés]

Le stockage du Precision 7960 est RAID 5 : 4 x SSD 4To. Qu'est-ce que le RAID ?


ÉLÉMENTS DE RÉPONSE

RAID est un acronyme qui signifie Redundant Array of Independent Disks (regroupement redondant de disques indépendants). Il s'agit d'une technologie qui permet de stocker des données sur plusieurs disques afin d'éviter la perte de données en cas de défaillance d'un disque. L'un des avantages du RAID est d'augmenter la tolérance aux pannes d'un système d'information.

Il existe différentes versions de RAID, appelées niveaux, chacune identifiée par un numéro.

  • RAID 0, également connu sous le nom de volume agrégé par bandes (striping en anglais). Dans cette configuration, les données sont divisées en différentes partitions indépendantes (également appelées bandes) ; les partitions sont ensuite stockées uniformement sur plusieurs disques. La configuration est illustrée ici. L'avantage de cette configuration est la performance : nous pouvons lire des données en parallèle à partir de plusieurs disques. L'inconvénient est que nous pouvons perdre un ensemble de partitions de données si le disque sur lequel elles sont stockées tombe en panne.
  • RAID 1, également connu sous le nom de disques en miroir (mirroring en anglais). Dans cette configuration, un ensemble de données est stocké de manière redondante (ou en miroir) sur plusieurs disques. La configuration est illustrée ici. Cette configuration garantit la tolérance aux pannes, mais au prix de l'utilisation de nombreux disques pour stocker un seul jeu de données.
  • RAID 4. Dans cette configuration, les données sont divisées en différentes partitions indépendantes, puis réparties uniformément sur plusieurs disques, comme dans le RAID 0. Contrairement au RAID 0, un disque supplémentaire stocke les données de parité. Lorsqu'un disque tombe en panne, les partitions qui y sont stockées peuvent être recalculées en utilisant les autres partitions et les données de parité. La configuration est illustrée ici.

Il existe d'autres niveaux. Leur examen n'entre pas dans le cadre de ce cours. Pour plus d'informations, voir ici.

Il est important de noter que les disques RAID sont considérés par le système d'exploitation comme un seul disque.