Publi

Mercury 2 de Inception Labs: El Modelo de Lenguaje Más Rápido

Resumen de Características

  • Velocidad: Mercury 2 genera aproximadamente 1,000 tokens por segundo, superando a Claude Haiku 4.5 y GPT-5 Mini.
  • Resultados en Pruebas: Mercury 2 alcanzó un 90% en el AIME 2026.
  • Modelos Comparativos: DiffusionGemma de Google tiene una velocidad similar pero un rendimiento inferior en benchmarks.
  • Accesibilidad: Mercury 2 es un modelo API de pago y cerrado; DiffusionGemma es gratuito y de código abierto en Hugging Face.

Comparativa de Modelos

Rendimiento y Velocidad

Inception Labs presentó Mercury 2, anunciándolo como el modelo de lenguaje que más rápido razona en el mundo. Genera alrededor de 1,000 tokens por segundo, comparado con 89 tokens para Claude Haiku 4.5 y 71 para GPT-5 Mini. Esto coloca a Mercury 2 en la misma categoría de velocidad que el modelo DiffusionGemma.

Publicidad

Metodología de Generación

A diferencia de los chatbots tradicionales que generarán palabra por palabra, los modelos de difusión utilizan un enfoque novedoso. Comienzan llenando un bloque de texto con tokens de marcador aleatorios, eliminando el ruido en varias pasadas paralelas, similar a cómo se convierte el estático en una imagen en generadores como Stable Diffusion.

Resultados en Evaluaciones

  • AIME 2026: Mercury 2 logró un 90%, mientras que DiffusionGemma alcanzó un 69.1%; Gemma 4 logró un 88.3%.
  • Benchmark GPQA: Mercury 2 obtuvo un 77% frente al 73.2% de DiffusionGemma.

Impacto en el Rendimiento y Costos

El rendimiento de Mercury 2 se ha validado en escenarios reales. Por ejemplo, Augment Code reemplazó a Claude Opus 4.7 con Mercury 2, logrando una reducción del 82% en latencia y del 90% en costos, manteniendo la calidad de salida.

Estructura de Operación Moderna

Inception se funda en investigaciones del profesor Stefano Ermon, coautor de técnicas de difusión basadas en puntajes. Con un impulso de $50 millones, cuenta con el respaldo de la rama de inversión de Nvidia y de inversores individuales como Andrew Ng y Andrej Karpathy.

Beneficios para el Usuario Final

  • Fluidez en el Trabajo: Los modelos de difusión permiten un flujo más natural durante las sesiones largas.
  • Interacción Ágil: Los usuarios sienten que la IA responde y se adapta rápidamente a sus necesidades.
  • Uso de Subagentes: Arquitecturas modernas dividen el trabajo entre subagentes especializados, mejorando la eficiencia.

Consideraciones Finales

A pesar de sus ventajas, Mercury 2 aún no es de código abierto y su implementación depende de una API o soluciones en la nube. Además, el ecosistema completo aún está evolucionando para ofrecer una experiencia de usuario más fluida.

Casos de Uso Inmediatos

  • Programación en tiempo real.
  • Sistemas de soporte con múltiples agentes.
  • Interfaces de voz sin demoras.
  • Predicciones de acciones siguientes en sistemas sensibles a la latencia.

Conclusión

Los datos compartidos por Inception y evaluaciones independientes muestran que Mercury 2 se encuentra en la categoría de «rápido y bueno» para modelos de difusión, reduciendo la necesidad de hardware especializado a GPUs comunes.

Boletín Diario

Comienza cada día con las principales noticias y características originales.

Descargo de responsabilidad: Los puntos de vista y opiniones expresadas en este artículo pertenecen a su autor y no necesariamente reflejan aquellas de CriptoPasion. La opinión del autor es a título informativo y en ninguna circunstancia constituye una recomendación de inversión ni asesoría financiera.