Considérez les trois ordinateurs Dell décrits dans le tableau suivant.
Modèle | Latitude 3440 | Precision Mobile 7780 | Precision 7960 |
---|---|---|---|
Type | Ordinateur portable | Station de travail portable | Station de travail |
Processeur | Intel Core i5-1335U | Intel Core i9-13950HX | Intel Xeon w9-3495X |
Mémoire (RAM) | 8GB - 3 200 MT/s - DDR4 (1 × 8GB) | 32GB - 5 600 MHz - DDR5 (1 × 32GB) | 512 GB - 4 800 MHz - GDDR6 (8 × 64 GB) |
GPU | Intel Iris Xe Graphics G7 80EUs (integrated) | NVIDIA RTX 3500 | NVIDIA RTX A6000 |
Disque | SSD 256 GB | SSD 1 TB | RAID 5 : 4 × SSD 4To |
Taille | 14" - 1920 × 1080 | 15.6" - 3840 × 2160 | -- |
Poids | 1.5 kg | 2.5 kg | -- |
Prix | 900 € | 4 600 € | 32 100 € |
Spécifications | cliquez ici | cliquez ici | cliquez ici |
Le premier ordinateur est un portable léger adapté à une utilisation personnelle et/ou bureautique. Le deuxième est une station de travail portable qui permet d'exécuter des applications nécessitant du calcul et du graphisme. Le troisième est un serveur puissant capable de travailler sur des calculs massifs tels que l'apprentissage profond.
Ordinateurs comparés en 2020
Modèle | Latitude 3410 | Precision Mobile 7550 | Precision 7920 |
---|---|---|---|
Type | Ordinateur portable | Station de travail portable | Station de travail |
Processeur | Intel Core i5-10210U | Intel Core i9-10885H | 2 × Intel Xeon Gold-5220 |
Mémoire (RAM) | 8Go 2667MHz DDR4 (1 × 8Go) | 32Go 2933MHz DDR4 (2 × 16Go) | 128Go 2933 MHz DDR4 (8 × 16Go) |
GPU | UHD620 (integrated) | NVIDIA Quadro T2000 | Nvidia Quadro GV100 |
Disque | SSD 128 Go | SSD 512 Go | RAID 5 : 8 × SSD 1 To - SATA |
Taille | 14" 1366 × 768 | 15.6" - 3840 × 2160 | -- |
Poids | 1.6 kg | 2.5 kg | -- |
Prix | 500 € | 1 500 € | 7 500 € |
Spécifications | cliquez ici | cliquez ici | cliquez ici |
Regardez les spécifications des deux premiers ordinateurs (lien dans la dernière ligne du tableau). Combien d'écrans peuvent être utilisés simultanément sur les deux ordinateurs portables, sans tenir compte des caractéristiques de la carte graphique ?
ÉLÉMENTS DE RÉPONSE
- Latitude 3440 : 3 écrans
- Écran de l'ordinateur.
- Port HDMI 1.4 : possibilité de brancher un écran.
- Port USB 3.2 Gen 2 Type-C avec DisplayPort : possibilité de brancher un écran.
- Precision Mobile 7780 : 7 écrans
- Écran de l'ordinateur.
- Ports HDMI 2.0a or 2.1 : possibilité de brancher un écran.
- USB 3.2 Gen 2 Type-C port avec DisplayPort : possibilité de brancher un écran.
- 2 x Thunderbolt 4 ports avec USB Type-C : on peut brancher deux écrans 4K à chaque port.
Quels sont les taux de transfert de données sur les connexions disponibles des deux ordinateurs portables ?
ÉLÉMENTS DE RÉPONSE
- Latitude 3440
- USB 3.2 Gen 1 : 5 Gbit/s
- USB 3.2 Gen 2 Type-C : 10 Gbit/s
- RJ45 (Ethernet) : 10/100/1000 Mbit/s
- Wifi : jusqu'à 2400 Mbit/s
- Bluetooth 5.3 : jusqu'à 2 Mbit/s
- WWAN module : jusqu'à 1 Gbit/s DL - 150 Mbit/s UL
- Precision Mobile 7780 : add/change
- Thunderbolt 4 ports with USB Type-C : 40 Gbit/s
- WWAN module : jusqu'à 3 Gbit/s DL - 250 Mbit/s UL
Nous voulons maintenant comparer les processeurs (CPU) des trois ordinateurs. La table suivante résume les points clés. Une comparaison exhaustive et officielle est disponible ici.
Intel Core i5-1335U | Intel Core i9-13950HX | Intel Xeon w9-3495X | |
Nombre de cœurs | 2 + 8 | 8 + 16 | 56 |
Fréquence de base | 1.7 GHz | 2.20 GHz | 1.90 Ghz |
Fréquence turbo | 4.60 GHz | 5.50 Ghz | 4.80 Ghz |
Cache | 12 MB | 36 MB | 105 MB |
Puissance | 15W | 55W | 350W |
Taille mémoire max | 64 GB | 128 GB | 4 TB |
Canaux mémoire max | 2 | 2 | 8 |
Prix recommandé | $340.00 | $590.00 | $5889.00 |
Geekbench 5 single-core score (cpu-monkey) | 1628 | 2108 | 1734 |
Geekbench 5 multi-core score (cpu-monkey) | 7240 | 19759 | 56911 |
Ordinateurs comparés en 2020
Intel Core i5 10210U | Intel Core i9 10885H | Intel Xeon Gold 5220 | |
Nombre de cœurs | 4 | 8 | 18 |
Fréquence de base | 1.6 GHz | 2.40 GHz | 2.20 Ghz |
Fréquence turbo | 4.20 GHz | 5.30 Ghz | 3.90 Ghz |
Cache | 6 MB | 16 MB | 25 MB |
Puissance | 15 W | 45 W | 125 W |
Taille mémoire max | 64 GB | 128 GB | 1 TB |
Fréquence mémoire max | 2 667 MHz | 2 933 MHz | 2 667 Mhz |
Canaux mémoire max | 2 | 2 | 6 |
- Discutez les différences entre les trois processeurs. Pourriez-vous dire ce que signifient les différentes caractéristiques énumérées dans le tableau ?
- Examinez les limites du CPU en matière de mémoire. Ces limitations sont-elles respectées dans la configuration matérielle des trois ordinateurs ? Peut-on encore ajouter de la mémoire aux trois configurations ?
ÉLÉMENTS DE RÉPONSE
Voici une description des caractéristiques :
- Nombre de cœurs. Un cœur est une unité de calcul d'un CPU. Un cœur peut lire et exécuter des instructions d'un programme. Un CPU multicœur peut exécuter plusieurs instructions en même temps.
- Fréquence de base. Fréquence de l'horloge du CPU dans des conditions d'utilisation normales.
- Fréquence turbo. Fréquence de l'horloge du processeur en cas d'utilisation intensive. La technologie Turbo Boost augmente dynamiquement la fréquence de l'horloge pour gérer une charge de travail importante. La fréquence de l'horloge est définie en fonction de la chaleur du système et du nombre de cœurs utilisés. La fréquence d'horloge ne peut pas dépasser celle spécifiée par la fréquence turbo.
- Cache. Indique la quantité de mémoire cache intégrée dans la puce du processeur.
- Puissance. Niveau moyen de chaleur générée en cas d'utilisation intensive lorsque le CPU fonctionne à sa fréquence de base.
- Taille mémoire max. Quantité maximale de mémoire que le CPU peut adresser.
- Canaux mémoire max. Nombre maximal de modules de mémoire pouvant être reconnus par le CPU.
- Geekbench. Un benchmark, c'est-à-dire un ensemble de tests de performance, qui donne un score de performance à un CPU. Les scores figurant dans le tableau sont tirés du site web cpu-monkeys.
En général, une fréquence d'horloge plus élevée signifie un processeur plus rapide. Cependant, de nombreux autres facteurs peuvent affecter les performances. Le CPU dispose de plusieurs moyens pour optimiser l'exécution des instructions du programme. La technologie actuelle permet de répartir intelligemment l'exécution des instructions entre les cœurs de l'ordinateur. Il est donc possible qu'un ancien processeur ayant une fréquence d'horloge plus élevée soit moins performant qu'un processeur plus récent ayant une vitesse d'horloge plus faible.
La taille de la mémoire cache est également importante.
Les benchmarks sont utilisés pour comparer les performances des CPUs. Le tableau montre que l'Intel Core i9 a un meilleur score que l'Intel Xeon (qui coûte plus cher) lorsqu'un seul cœur est utilisé. Ceci est vrai pour le benchmark sélectionné, un autre peut donner un résultat différent. Les scores de performance doivent être considérés avec prudence.
En ce qui concerne la deuxième question, nous constatons que les trois configurations matérielles respectent les limites de la mémoire. En fait, les deux premiers ordinateurs n'utilisent qu'un seul canal de mémoire, nous pouvons donc ajouter un module supplémentaire, car les CPU respectifs supportent deux canaux.
Enfin, vous avez peut-être remarqué que les deux premiers ordinateurs ont deux types de cœurs. Vous pouvez le voir dans les spécifications détaillées. Les processeurs Intel sont généralement équipés de cœurs P (ou cœurs de performance) et de cœurs E (ou cœurs efficaces). Les premiers sont utilisés pour les charges de travail lourdes ; ils sont plus performants, mais ils coûtent plus cher et génèrent plus de chaleur (ils consomment donc plus d'énergie). Les seconds sont utilisés pour les tâches d'arrière-plan qui ne nécessitent pas une grande puissance de calcul. Ils sont moins performants, mais ils coûtent moins cher et génèrent moins de chaleur. L'objectif d'avoir deux types de cœurs est de trouver un équilibre entre les performances, le coût et la consommation d'énergie du CPU.
Maintenant nous considérons le GPU (graphics processing unit). La table suivante décrit les caractéristiques des GPU des trois ordinateurs.
Intel Iris Xe Graphics G7 80EUs (integrated) | NVIDIA RTX 3500 | NVIDIA RTX A6000 | |
Nombre de cœurs (CUDA) | 80 | 5 120 | 10 752 |
Fréquence d'horloge | 1 250 MHz | 1 545 MHz | 2 505 MHz |
Mémoire | 8 GB (partagée) | 12 GB | 48 GB |
FP16 performance | 768.0 GFLOPS | 15.82 TFLOPS | 38.7 TFLOPS |
FP32 performance | 384.0 GFLOPS | 15.82 TFLOPS | 38.7 TFLOPS |
FP64 performance | 96.0 GFLOPS | 247.2 GFLOPS | 1.21 TFLOPS |
Tensor cores (Apprentissage profond) | -- | 160 | 336 |
Consommation d'énergie max | < 15W | 100W | 300 W |
Ordinateurs comparés en 2020
UHD620 (integrated) | NVIDIA Quadro T2000 | Nvidia Quadro GV100 | |
Nombre de cœurs (CUDA) | 192 | 1024 | 5120 |
Fréquence d'horloge | 1150 MHz | 1785MHz | 1627MHz |
Mémoire | 32GB(partagée) | 4GB | 32GB |
FP16 performance | 768.0 GFLOPS | 7.3 TFLOPS | 29,6 TFLOPS |
FP32 performance | 384.0 GFLOPS | 3.6 TFLOPS | 14,8 TFLOPS |
FP64 performance | 96.0 GFLOPS | 114.2 GFLOPS | 7,4 TFLOPS |
Tensor cores (Apprentissage profond) | -- | -- | 640 |
Tensor performance | -- | -- | 118,5 TFLOPS |
Consommation d'énergie max | < 15W | 60W | 250 W |
Comparez les caractéristiques des trois GPU. Pourriez-vous dire ce que signifient les différentes caractéristiques énumérées dans le tableau ?
ÉLÉMENTS DE RÉPONSE
- Les GPU exécutent simultanément des calculs identiques (parallélisme des données) sur un vecteur de données et produisent un vecteur de sorties correspondant. Leur fonction première est le rendu d'images tridimensionnelles, mais ils sont également utilisés pour exécuter des applications avec beaucoup de calculs où le parallélisme des données est impliqué.
- Dans le premier ordinateur, le GPU est intégré au CPU. Par conséquent, le CPU et le GPU partagent la même mémoire. Bien que l'intégration du GPU dans le CPU se traduise par des performances moindres, pour la plupart des utilisateurs, il s'agit d'une solution pratique et bon marché. Les joueurs et les développeurs d'applications graphiques ont besoin d'une configuration avec un GPU dédié.
- Les deuxième et troisième ordinateurs sont équipés de GPU NVIDIA dédiés. Ces GPU disposent d'une mémoire dédiée.
- Les GPU NVIDIA se composent de plusieurs cœurs CUDA. CUDA (Compute Unified Device Architecture) est une plateforme NVIDIA qui permet de développer des applications pour les GPU. Un cœur CUDA exécute une opération en virgule flottante par cycle d'horloge. Par conséquent, le nombre de cœurs et la fréquence d'horloge sont de bons indicateurs des performances d'un GPU.
- FP16, FP32 et FP64 correspondent respectivement à la précision d'un float sur 16 bits, 32 bits et 64 bits.
- Les performances FP16, FP32 et FP64 se réfèrent au nombre d'opérations en virgule flottante par seconde. Ce nombre est mesuré en GFLOPS (Giga floating point operations per second) ou en TFLOPS (Tera floating point operations per second). Les valeurs du tableau sont importantes pour la comparaison, mais elles sont théoriques. Pour obtenir une comparaison concrète, il est préférable de rechercher des benchmarks.
- Les cœurs CUDA étant limités à l'exécution d'une opération par cycle d'horloge, NVIDIA a développé des cœurs plus avancés, appelés cœurs tenseurs. Ils peuvent calculer des opérations matricielles entières par cycle d'horloge et apporter de nouvelles applications d'apprentissage profond aux GPU.
Considérons une batterie d'ordinateur portable typique de 50 Wh. Les écrans de ces ordinateurs portables consomment de 10 à 20 W en fonction de leur taille et de leur luminosité.
Sachant que les trois composants le plus énergivores dans un ordinateur portable sont le CPU, l'écran et le GPU, discutez de l'autonomie et de la consommation d'énergie des deux ordinateurs portables.
ÉLÉMENTS DE RÉPONSE
- Le premier ordinateur portable consomme 15W pour le processeur et son GPU intégré et 10W pour l'écran, il peut tenir plus de 2 heures avec une charge élevée (si la batterie n'est pas défectueuse).
- Le deuxième ordinateur portable consomme 45W (processeur) + 60W (GPU) + 20W (écran) = 125W. Sans batterie auxiliaire, nous avons moins de 30 minutes d'autonomie en cas de charge élevée.
Dans les architectures informatiques modernes, la fréquence de chaque composant est automatiquement ajustée "à la volée" en fonction des besoins réels, afin d'économiser de l'énergie et de réduire la quantité de chaleur générée par les circuits.
Le stockage du Precision 7960 est RAID 5 : 4 x SSD 4To. Qu'est-ce que le RAID ?
ÉLÉMENTS DE RÉPONSE
RAID est un acronyme qui signifie Redundant Array of Independent Disks (regroupement redondant de disques indépendants). Il s'agit d'une technologie qui permet de stocker des données sur plusieurs disques afin d'éviter la perte de données en cas de défaillance d'un disque. L'un des avantages du RAID est d'augmenter la tolérance aux pannes d'un système d'information.
Il existe différentes versions de RAID, appelées niveaux, chacune identifiée par un numéro.
- RAID 0, également connu sous le nom de volume agrégé par bandes (striping en anglais). Dans cette configuration, les données sont divisées en différentes partitions indépendantes (également appelées bandes) ; les partitions sont ensuite stockées uniformement sur plusieurs disques. La configuration est illustrée ici. L'avantage de cette configuration est la performance : nous pouvons lire des données en parallèle à partir de plusieurs disques. L'inconvénient est que nous pouvons perdre un ensemble de partitions de données si le disque sur lequel elles sont stockées tombe en panne.
- RAID 1, également connu sous le nom de disques en miroir (mirroring en anglais). Dans cette configuration, un ensemble de données est stocké de manière redondante (ou en miroir) sur plusieurs disques. La configuration est illustrée ici. Cette configuration garantit la tolérance aux pannes, mais au prix de l'utilisation de nombreux disques pour stocker un seul jeu de données.
- RAID 4. Dans cette configuration, les données sont divisées en différentes partitions indépendantes, puis réparties uniformément sur plusieurs disques, comme dans le RAID 0. Contrairement au RAID 0, un disque supplémentaire stocke les données de parité. Lorsqu'un disque tombe en panne, les partitions qui y sont stockées peuvent être recalculées en utilisant les autres partitions et les données de parité. La configuration est illustrée ici.
Il existe d'autres niveaux. Leur examen n'entre pas dans le cadre de ce cours. Pour plus d'informations, voir ici.
Il est important de noter que les disques RAID sont considérés par le système d'exploitation comme un seul disque.