Adios al cuello de botella entre CPU-GPU Nvidia

Hola a todos,el otro día me encontré con esta noticia de Nvidia.

Tecnología NVLink®-C2C Ofrece un modelo de memoria CPU + GPU sin interrupciones con hasta cinco veces el Ancho de banda de PCIe 5.0, lo que garantiza un acceso y transferencia de datos ultrarrápido.

Por lo que se ve han unificado la memoria de CPU y GPU y pueden acceder a la misma memoria.
El aparato se llama:

NVIDIA DGX Spark - 4TB

Es un aparato de IA que tiene una potencia igual a una grafica Nvidia 4090, pero este tiene un consumo de 250W, la Nvidia 4090 consume casi los 1000W, lo malo es el precio sobre 4500 euros, el problema es que tiene que integrar la gráfica con el microprocesador (SOC).
Hace unas cuantas semanas se lo comente a Mikrios que al precio que tienen las graficas Nvidia y el espacio que ocupa deberían traer las cpu integrada…,casualidad
Memoria CPU + GPU sin interrupciones con hasta cinco veces el Ancho de banda de PCIe 5.0.
Este aparato lo fabricaran también: AMD,ACER,MSI,DELL,HP entre otros, era solo comentar esta noticia.

Salud y Saludos

Hola.
¿ Donde 4500€ ? ,yo tengo 2 4090 + una 5080 y mas una 5090; y la mas cara ha sido la 5090 por unos 3000€ y poco.

El cuello de botella aún se puede dar, si la pcie es gen4 o menor , después el ancho de banda (la mejor creo que va por 512) .

Desde antiguo había dos chip set (no recuerdo si era el norte y el sur) ,actualmente hay uno, lo demás va directo a la cpu, memoria, pcie gen5 a cpu,gen4 cpu, etc; lo que no va lo hace por el chipset a través de un hub, también determinado dispositivos van por tipo share, o sea compartidos.
Otros son condicionales, es decir si usas un M2 a gen5 y cpu, el pcie en vez de x16 puede pasar a x8, otros lo pasan a gen4 .
He estado mirando una marca que no ocupe o comparta los gen5 ya sea pcie como M2 y bien Asus está limitado, Gigabyte lo mismo, pero sorpresa , me encuentro una (varias) MSI que no comparte el pcie x16 a cpu con nadie además tiene otro pcie gen 5 a por 8, lo mismo con M2, no los comparte ,por lo que puedo utilizar un M2 a 14700Mbs , en esas condiciones si dispongo de ancho de banda en las conexiones (bien para video no importa mucho, ya con un gen 4 va bien y no se nota, pero para IA, si se nota, ademas requiere mas ram (si reparte esta en partes expertas (como la IA china) .
Por esa parte la memoria aumentara su consumo y quizás o no quede o se venda mas cara (he visto una de x16 a 800€) .
Bajo mi punto de vista las ddr5 son lentas ,por culpa de la latencia (usan dos bloques de 32bits para formar un 64bits) , ya en eso y las IA’s y sus requisitos, en Nvidia contrato varias empresas para crear la proxima generación (entre ellas está samsung que fue la primera empresa del mundo en sacar los módulos de memoria tal como los conocemos y no venir soldadas en placa base u otras tarjetas, pues bien creo que esa empresa anuncio el cambio (no se si a ddr6 o ddr7 ) para las placas base.
Por otro lado la no existencia por parte de AMD de un chipset, para AMD, puede usar los que quiera, según la necesidad.
Las CPU, según modelo pueden llevar incorporada una GPU, Los modelos que tengo son 3 i9 14900K + i9 13900k + i3 + i9 285k y por parte de AMD he comprado una amd ryzen 9 9950x3d 4,3GHZ (734,49€) para la placa una AMD ASUS Rog crosshair x870 Hero ( 748,09€)
; y otras placas para hacer pruebas .
En memoria sobre unos 20 módulos para varias placas., aunque necesitaría unas 4 a 8 módulos mas .
En ddr3 tengo para ws unos 8 módulos (para 4 canales) y otros 8 mas usando .
En todo caso las CPU excepto la WS, todas llevan gráfica incorporada.

La 4090 no puede consumir 1000W , ya que usa un 12VHPWR (como máximo 600W) , pero si puede haber un pico o algún esporádico superior a 600W .

Las que tengo yo, están modificadas y pueden llevar mas de 1000W sin problemas (ya que he añadido otro conector XT90 en paralelo a el 12VHPWR) y sobre todo evitar daños en conectores (además los conectores no van crimpados si no que van soldados, permaneciendo la resistencia de conexionado estable y sin variaciones.


1ª 4090 con distribución de carga con conector XT90
2ª4090 Con refrigeración liquida por las dos caras ,con conector 12VHPWR mas Conector XT90 (placa Asus con R.liquida en GPU+CPU+VRM placa base.

Los 4 conectores sensores limitan la potencia a la gráfica.

Es posible que saquen alguna dedicada , en plan bestia (lo comento porque he diseñado una CPU en forma de cubo y no solo tiene la oblea en la base, si no que en vertical, lleva circuitos ( o sea 4 caras del cubo con circuitos como memorias ya integradas de muy alta velocidad, mas caches , etc) .

Saludos

2 Likes

Hola mikrios ,ya sabéis que pregunto cosas raras, tengo alguna.
Las características del aparato:
CPU GB10 Grace Blackwell 20-core Arm
GPU NVIDIA Blackwell integrada
Memoria LPDDR5X 128 gigas (compartida y accesible con cpu-gpu) con el sistema NVLink-C2C, este sistema también sirve para conectar varios módulos como si fuera un clúster,doblando la cpu y la memoria,velocidad de conexión entre módulos es de 200 Gbps
una ssd de 4TB
1 PFLOPS en rendimiento de IA FP4
200 Watios de consumo,antes he puesto 250w.
Tiene conexión HDMI 2.1b
3 x USB 3.2 Gen 2x2 Tipo-C,20
LAN 10 GbE
1 connectX CX-7 200Gbps(2xQSFP) entre módulos .
La CPU y GPU aceden a la misma memoria quitando interrupciones o ciclos de trabajo ,entre estas dos.

No me interesa esta maquina (bueno por 1000 Euros si),solo me preguntaba si se implantara esta tecnológica a los pc, placa con dos zócalos uno para Cpu y otra para Gpu con memoria compartida y accesible quitando ciclos de trabajo en la comunicación entre Cpu y Gpu al poder leer directamente desde la memoria compartida.

Tecnología NVLink®-C2C Ofrece un modelo de memoria CPU + GPU sin interrupciones con hasta cinco veces el Ancho de banda de PCIe 5.0, lo que garantiza un acceso y transferencia de datos ultrarrápido.

Salud y Saludos

1 Like

En eso todo vale

El cambiar el hardware , así me he encontrado información de equipos (que me envían por e-mail ) .

Si tiene éxito suele pasar a ser convencional y quedarse como un estándar, en cambio otras o bien siguen la rama industrial, etc… y solo lo usan determinadas empresas y no son para el publico en general .

Como estándar podemos poner como ejemplo a pci frente Vesa local bus , quedando esta primera como estándar( la Vesa Local bus, era un bus con tarjetas muy largas) , en discos el sata en vez de un pata y así con muchas mas cosas , que no suele usarse a nivel de usuario , pero si a nivel de empresa Ejemplo el Vroc ( raid sobre CPU) , etc y montados en rack de 19" ).

Creo que interrupciones tiene que tener y me parece que lo que puede ganar ahí es la render , en video quizás ni se note el usar integrada o no , para otras labores efectos etc, si es necesario una externa, por su nº de cores, su memoria (ddr6,ddr7,etc) .

Donde se puede saber eso es con comparativas entre pcie y C2C ,teniendo en cuenta que las CPU pueden llevar varías pcie y sumarlas (no se si sirve de ejemplo el usar varias gráficas pcie compartiendo con la cpu) .

Por otro lado a veces gana uno pero no quiere decir que sea el mejor (ejemplo un bus en paralelo (pata , scsi ) contra uno serie Sata , el sata no necesita tanto cobre para enviar datos ,como el pata o el scsi, o otro tipos como fibre channel ,etc (aunque antes scsi era necesario para video y sumando le un disco de 10.000 rpm ) .

Algunas de esas tecnologías no llegan a ser conocidas por el publico en general (un ejemplo en mi trabajo usaba NRZ , con modulación QAM, crc, compresión de datos ,etc ) , para usuarios los tipos de los pcs, wifi, bluetooh,etc .

Saludos y Felices fiestas navideñas .

2 Likes

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.