Después de un año 2024 récord, Nvidia comienza el año 2025 con fuerza, presentando una serie de productos que podrían solidificar su dominio en los campos del desarrollo de inteligencia artificial y los juegos. El director ejecutivo, Jensen Huang, subió al escenario del CES en Las Vegas para mostrar nuevo hardware. y ofertas de software que abarcan todo, desde supercomputadoras personales con IA hasta tarjetas de juegos de próxima generación. El anuncio más importante de Nvidia: Project DIGITS, una supercomputadora personal con IA de 3.000 dólares que incluye un petaflop de potencia informática en una caja del tamaño de una computadora de escritorio. Construida alrededor del nuevo (y hasta ahora secreto) superchip GB10 Grace Blackwell, esta máquina puede manejar modelos de IA con hasta 200 mil millones de parámetros mientras consume energía de una toma de corriente estándar. .Para cargas de trabajo más pesadas, los usuarios pueden vincular dos unidades para abordar modelos de hasta 405 mil millones de parámetros. Para el contexto, el modelo Llama 3.2 más grande, el LLM de código abierto más avanzado de Meta, tiene 405 mil millones de parámetros y no se pueden ejecutar en hardware de consumo. Hasta ahora, requería alrededor de 8 Superchips Nvidia A100/H100, cada uno de los cuales costaba alrededor de $ 30 000, por un total de más de $ 240 000 solo en hardware de procesamiento. Dos de las nuevas IA de nivel de consumo de Nvidia las supercomputadoras costarían 6.000 dólares y serían capaces de ejecutar el mismo modelo cuantificado. “La IA será la corriente principal en todas las aplicaciones de todas las industrias. Con Project DIGITS, el Superchip Grace Blackwell llega a millones de desarrolladores”, dijo Jensen Huang, director ejecutivo de Nvidia, en una publicación de blog oficial. «Colocar una supercomputadora de IA en los escritorios de cada científico de datos, investigador de IA y estudiante les permite participar y dar forma a la era de la IA». Para aquellos que aman los detalles técnicos, el chip GB10 representa un importante logro de ingeniería nacido de una colaboración con MediaTek. El sistema en chip combina la última arquitectura de GPU de Nvidia con 20 núcleos ARM de bajo consumo conectados a través de la interconexión NVLink-C2C. Cada unidad DIGITS tiene 128 GB de memoria unificada y más. hasta 4 TB de almacenamiento NVMe. Nuevamente, para ponerlo en contexto, las GPU más potentes hasta la fecha incluyen alrededor de 24 GB de VRAM (la memoria necesaria para ejecutar modelos de IA) cada una, y el Superchip H100 comienza con 80 GB de VRAM.
Los planes de Nvidia para dominar los agentes de IA
Las empresas se apresuran a implementar agentes de IA, y Nvidia lo sabe, razón por la cual probablemente desarrolló Nemotron, una nueva familia de modelos que viene en tres tamaños, y anunció hoy su expansión con dos nuevos modelos: Nvidia NIIM para resumen y comprensión de videos y Nvidia Cosmos para brindarle a Nemotron capacidades de visión: la capacidad de comprender instrucciones visuales. Hasta ahora, los LLM solo se basaban en texto. Sin embargo, los modelos se destacaron en las siguientes instrucciones: chat, llamadas a funciones, codificación y tareas matemáticas. Están disponibles a través de Hugging Face y el sitio web de Nvidia, con acceso empresarial a través de la plataforma de software AI Enterprise de la compañía. Nuevamente, para el contexto, en En el LLM Arena, el Llama Nemotron 70b de Nvidia ocupa un lugar más alto que el Llama 405b original desarrollado por Meta. También supera a diferentes versiones de Claude, Gemini Advanced, Grok-2 mini y GPT-4o.El impulso de los agentes de Nvidia ahora también está relacionado con la infraestructura. La compañía anunció asociaciones con los principales proveedores de tecnología de agentes como LangChain, LlamaIndex y CrewAI para crear planos en Nvidia AI Enterprise. Estas plantillas listas para implementar abordan tareas específicas que facilitan a los desarrolladores la creación de agentes altamente especializados. Un nuevo PDF El plan para podcasts tiene como objetivo competir con NotebookLM de Google, mientras que otro plan ayuda a crear agentes de resumen y búsqueda de videos. Los desarrolladores pueden probar estos planos a través de la nueva plataforma Nvidia Launchables, que permite la creación de prototipos y la implementación con un solo clic.
¡Jugadores, regocíjense! Las nuevas tarjetas GeForce RTX 5000 son una bestia del rendimiento
Nvidia dejó sus anuncios de juegos para el final y presentó la tan esperada Serie GeForce RTX 5000. El modelo insignia RTX 5090 alberga 92 mil millones de transistores y ofrece 3352 billones de operaciones de IA por segundo, el doble del rendimiento del RTX 4090 actual. Toda la línea cuenta con Tensor Cores de quinta generación y RT Cores de cuarta generación. Las nuevas tarjetas presentan DLSS 4, que puede aumentar la velocidad de fotogramas hasta 8 veces mediante el uso de IA para generar múltiples fotogramas por renderizado. Blackwell, el motor de la IA, ha llegado para los jugadores de PC, los desarrolladores y los creativos”, dijo Jensen Huang, “al fusionar el renderizado neuronal impulsado por la IA y el trazado de rayos, Blackwell es la innovación en gráficos por computadora más importante desde que introdujimos el sombreado programable hace 25 años. «Las nuevas tarjetas también emplean modelos transformadores para superresolución, lo que promete gráficos muy realistas y mucho más rendimiento por su precio, que no es barato, por cierto: $ 549 por la RTX 5070, con el 5070 Ti a $ 749, el 5080 a $ 999 y el 5090 a $ 1,999. Si no tienes esa cantidad de dinero y quieres jugar, no te preocupes. AMD también anunció hoy su serie Radeon RX 9070. Las tarjetas se basan en la nueva arquitectura RDNA 4 utilizando un proceso de fabricación de 4 nm y cuentan con aceleradores de IA dedicados para competir con los núcleos tensores de Nvidia. Si bien las especificaciones completas aún se mantienen en secreto, los últimos chips Ryzen AI de AMD ya alcanzan 50 TOPS en el máximo rendimiento. Lamentablemente, Nvidia sigue siendo el rey de las aplicaciones de IA gracias a su tecnología CUDA, la arquitectura de IA patentada de Nvidia. Para abordar esto, AMD se ha asociado con HP y Asus para la integración de sistemas. y más de 100 marcas de plataformas empresariales utilizarán la tecnología AMD Pro hasta 2025. Se espera que las tarjetas Radeon lleguen al mercado en el primer trimestre de 2025, lo que le dará a Nvidia una batalla interesante tanto en juegos como en aceleración de IA. Editado por Sebastian Sinclair
Boletín Generalmente Inteligente
Un viaje semanal de IA narrado por Gen, un modelo de IA generativa.