NVIDIA DGX Spark: El ordenador personal de IA DGX, diseñado para crear y ejecutar inteligencia artificial
Exigencias de computación de IA en escritorio: el creciente tamaño y complejidad de los modelos de IA generativa está haciendo que el desarrollo en sistemas locales sea cada vez más complicado. La creación de prototipos, el ajuste y la inferencia de modelos grandes de forma local requieren grandes cantidades de memoria y un rendimiento de cómputo significativo. A medida que empresas, proveedores de software, organismos públicos, startups e investigadores refuerzan sus iniciativas de IA, la demanda de recursos de computación para IA sigue aumentando.
Modelos de 200 000 millones de parámetros sobre tu escritorio: NVIDIA® DGX Spark™ forma parte de una nueva categoría de ordenadores diseñados desde cero para crear y ejecutar IA. Impulsado por el superchip NVIDIA GB10 Grace Blackwell y basado en la arquitectura NVIDIA Grace Blackwell, NVIDIA DGX Spark ofrece hasta 1 petaFLOP (rendimiento teórico FP4 TOPS utilizando la función de sparsity) de potencia de IA para manejar cargas de trabajo de gran envergadura.
Con 128 GB de memoria unificada del sistema, los desarrolladores pueden experimentar, ajustar o realizar inferencias con modelos de hasta 200 000 millones de parámetros. Además, gracias a la tecnología de red NVIDIA ConnectX™, es posible conectar dos superordenadores DGX Spark para realizar inferencias con modelos de hasta 405 000 millones de parámetros. Gracias a su extraordinario rendimiento y capacidades en un formato compacto, NVIDIA DGX Spark permite a desarrolladores, investigadores, científicos de datos y estudiantes seguir ampliando los límites de la IA generativa.
Para ofrecer a los desarrolladores un entorno familiar, NVIDIA DGX Spark utiliza la misma arquitectura de software que impulsa las fábricas de IA a nivel industrial. Con NVIDIA DGX OS basado en Ubuntu Linux y preconfigurado con el conjunto de software de IA más reciente de NVIDIA, junto con acceso a los programas de desarrolladores NVIDIA NIM™ y NVIDIA Blueprints, los usuarios pueden comenzar de inmediato con herramientas comunes como PyTorch, Jupyter y Ollama para crear prototipos, ajustar e inferir en el DGX Spark, y transferir fácilmente el trabajo al centro de datos o la nube.
Basado en NVIDIA Grace Blackwell: en el corazón del NVIDIA DGX Spark se encuentra el superchip NVIDIA GB10 Grace Blackwell, diseñado sobre la arquitectura del mismo nombre y optimizado para un formato de escritorio. El GB10 incluye una potente GPU NVIDIA Blackwell con núcleos tensoriales de quinta generación y compatibilidad con FP4, capaz de ofrecer hasta 1 petaFLOP de potencia de cómputo para IA. También integra una CPU Grace de 20 núcleos Arm de alto rendimiento para acelerar el preprocesamiento de datos y la orquestación, agilizando el ajuste e inferencia de modelos. El superchip GB10 utiliza NVIDIA NVLink™-C2C, que proporciona un modelo de memoria coherente CPU+GPU con cinco veces el ancho de banda de PCIe Gen 5.
Trabaja con modelos de IA de gran tamaño: con 128 GB de memoria unificada y compatibilidad con el formato de datos FP4, el NVIDIA DGX Spark puede manejar modelos de hasta 200 000 millones de parámetros, lo que permite a los desarrolladores de IA crear prototipos, ajustar e inferir modelos de gran escala directamente en su escritorio. Gracias a la tecnología de red integrada NVIDIA ConnectX, es posible conectar dos sistemas DGX Spark para trabajar con modelos aún mayores, como Llama 3.1 405B.
Desarrolla localmente, despliega en cualquier lugar a escala: NVIDIA DGX Spark ofrece a organizaciones y desarrolladores un potente y económico entorno de experimentación para crear prototipos de modelos, liberando recursos valiosos de sus clústeres, mejor reservados para el entrenamiento y la implementación en producción. Al aprovechar la arquitectura de software de la plataforma NVIDIA AI, los usuarios de DGX Spark pueden trasladar fácilmente su trabajo desde el escritorio a DGX Cloud o a cualquier infraestructura de centro de datos o nube acelerada, facilitando como nunca antes la creación de prototipos, el ajuste y la iteración.
Resumen de características principales
- Basado en el superchip NVIDIA GB10 Grace Blackwell
- GPU NVIDIA Blackwell con tecnología de Núcleos Tensor de quinta generación
- CPU NVIDIA Grace con arquitectura Arm de 20 núcleos de alto rendimiento
- Hasta 1 petaFLOP de rendimiento de IA con FP4
- 128 GB de memoria unificada y coherente del sistema
- Compatibilidad con modelos de hasta 200 000 millones de parámetros
- Red NVIDIA ConnectX™ para enlazar dos sistemas y trabajar con modelos de hasta 405 000 millones de parámetros
- 4 TB de almacenamiento NVMe
- Formato compacto de escritorio
Formulario de inicio de sesión y registro