Publi


Una pequeña startup china solo obligó a las compañías tecnológicas más grandes de Estados Unidos a repensar cómo construyen inteligencia artificial. El lanzamiento de Deepseek de su modelo R1, que según los informes coincide o excede las capacidades de los sistemas de IA construidos por los Estados Unidos a una fracción del costo, provocó una venta masiva. Desactivado en acciones tecnológicas que borraron casi $ 600 mil millones del valor de mercado de Nvidia solo. Las ondas de choque golpearon al sector tecnológico de los EE. UU. En el intestino, con líderes en la industria que se apresuran a analizar cómo Deepseek logró tales resultados. Aunque todavía hay preguntas abiertas, después de analizar la El código de código abierto, el consenso, por ahora, es que los desarrolladores chinos son mejores para construir modelos eficientes. Y los titanes tecnológicos de la IA se pusieron sus caras sonrientes y miraron el lado positivo, adoptando la noción de que cualquier avance en la IA fue bueno para la industria. Sam Altman de Openai reconoció el impresionante rendimiento del modelo y prometió acelerar el lanzamiento de «mejores modelos «

Mark Zuckerberg de Meta dijo que su compañía había reunido múltiples «salas de guerra» llenas de ingenieros empeñados en el análisis de la tecnología de Deepseek y la estrategia de la respuesta de Meta. Mientras tanto, el presidente Donald Trump, nunca se pierde un ciclo de noticias, caracterizó el avance de Deepseek como un «despertar» Llame «y un desarrollo» positivo «para la tecnología estadounidense» porque no tiene que gastar tanto dinero «.

Publicidad

La era posterior a la defensa

Ok, ignoremos lo que están diciendo y consideremos lo que probablemente harán para responder al avance de Deepseek. Resulta que varios grandes jugadores de código cerrado ya están escabulléndose a los métodos de Deepseek en sus libros de jugadas, simplemente no llegarán a los titulares Acerca de los prestados de la competencia. Por ejemplo, la perplejidad ya implementó el modelo en su motor de búsqueda, y Groq también lo hizo a disposición de funcionar a tiempos de inferencia de velocidad récord. La mayoría de los grandes nombres en la escena de IA estadounidense, incluido Meta, se están adaptando para detener o pensar en formas de aprovechar su tecnología. A medida que el pánico inicial del mercado disminuye, las acciones de Nvidia se recuperaron 9% hoy, los líderes de tecnología apuntan a un principio económico contradictorio que sugiere que el avance de la eficiencia de Deepseek podría aumentar la demanda de hardware de IA. «Paradoja, este concepto explica por qué la eficiencia tecnológica tiende a expandir el uso en lugar de disminuir el consumo.» A medida que la IA se vuelve más eficiente y accesible, veremos que su uso se dispara, convirtiéndolo en una mercancía de la que no podemos tener suficiente «, dijo Satya Nadela, CEO de Microsoft, el inversor más grande de Operai. A pesar de la caída de un solo día más significativa de Wall Street en la capitalización de mercado, Nvidia ve el avance de Deepseek como una oportunidad. «El pastel se hizo mucho más grande, más rápido. El investigador jefe de NVIDIA, Jim Fan, tuiteó el lunes. «Nosotros, como una humanidad, estamos marchando hacia Universal Agi antes».

En otras palabras, si se aplica la paradoja de Jevons, la demostración de Deepseek de que los modelos de IA de alta calidad se pueden construir con recursos computacionales mínimos no significa que usemos menos GPU en general. En cambio, los grandes se harán más grandes. En el otro extremo del espectro, a medida que disminuya la barrera de entrada, un aumento de los nuevos desarrolladores y empresas saltará al desarrollo de la IA. La explosión en los proyectos totales probablemente impulsará la demanda de cálculo y chip a niveles sin precedentes. Por supuesto, para la IA, no todos los chips son iguales, y el mercado aparentemente ha decidido que Apple Silicon podría tener una ventaja sobre las fichas de Nvidia en este nuevo mundo. Es por eso que AAPL se disparó un 8% esta semana, a pesar de su grado de consumo «» Apple Intelligence «se ridiculiza como un oxímoron. El argumento es que los chips de Apple son más eficientes en energía, diseñados para un uso localizado versus las grandes granjas de servidores que usan chips nvidia y cuentan con una» arquitectura de memoria unificada «, lo que significa la CPU, GPU y El motor neural comparte un solo grupo de memoria ultrarrápida. Esto elimina la necesidad de transferencia de datos entre componentes separados, reduciendo la latencia y aumentando la eficiencia para las cargas de trabajo de IA. Para modelos como Deepseek, que se basan en el acceso rápido a la memoria para operaciones complejas, UMA supuestamente mejora significativamente el rendimiento. Claramente, en la agonía del dilema del innovador, es poco probable que Nvidia cambie su estrategia, lo que es el proveedor dominante del hardware AI gracias Para su monopolización de la arquitectura CUDA, la clave para ejecutar y desarrollar la mayoría de los modelos de IA actualmente disponibles. Deepseek no desafía este monopolio, pero China está trabajando en ello para impulsar la adopción de la alineación de chips de Huawei Ascend. Soportes, Microsoft no parece demasiado preocupado por cambiar su estrategia comercial como proveedor de infraestructura. Sin embargo, OpenAi aplicó un pequeño cambio para contrarrestar las expectativas de los usuarios, dando más usuarios (aquellos que pagan $ 20 al mes) algunas de las características que anteriormente eran Disponible solo para usuarios de Pro (aquellos que pagan $ 200 al mes) para retener a los clientes.

Otra compañía con mucha piel en el juego es Meta, Developers of Llama, la familia más grande y popular de LLMS de código abierto del mundo. Lecun, también miró el lado positivo de ser pantalizado por una pequeña startup en China: «Para las personas que ven el desempeño de Deepseek and Think:» China está superando a los Estados Unidos en AI «.» Estás leyendo esto mal; la lectura correcta IS: 'Los modelos de código abierto están superando a los propietarios' ', Lecun publicó en LinkedIn. No se sorprenda si Meta adopta los métodos de Deepseek para mejorar Llama-4: “Debido a que su trabajo es publicado y abierto, todos pueden beneficiarse de él, Ese es el poder de la investigación abierta y el código abierto ”, escribió Lecun. Durante su llamada de ganancias del cuarto trimestre, el CEO Zuckerberg dijo que Meta planea asignar diez veces más poder informático para desarrollar LLAMA-4 que los recursos asignados para entrenar Llama-3.El. La empresa puede reducir su gasto y aplicar las técnicas de Deepseek, o mantener el gasto mientras aplica esas técnicas y crear un modelo aún más poderoso.

El futuro de la IA podría no depender de la mejor IA

No importa cuán brillante sea el modelo de inferencia de Deepseek de Deepseek, al final, la IA todavía tiene un apetito voraz por dos cosas: potencia (granjas de servidores) y datos (para entrenar y aprender). año, y los costos globales de computación de IA podrían crecer 10 veces en los próximos cinco años. ¿Cómo se transmiten esos costos a las empresas y los consumidores? que las personas cuestionan si los precios premium cobrados por las compañías de código patentadas son justos. ¿Quién quiere pagar $ 20 al mes por la oferta de grado de consumo de OpenAi, fuera de $ 200 al mes por su modelo de alta gama, cuando puede obtenerlo de forma gratuita? “Más empresas están construyendo alternativas de código abierto a las herramientas de IA premium, creando una competencia que beneficia [small and medium-sized enterprises]», Karan Sirdesai, CEO y cofundador de Mira, una red descentralizada de modelos de IA, dijo a Decrypt.» Esta evolución natural hacia soluciones accesibles refleja cómo otras tecnologías se han vuelto democratizadas a través de la dinámica del mercado en lugar de la regulación «. Para los modelos, como los modelos, como los modelos como Deepseek y otras iniciativas de código abierto impulsan a la industria hacia adelante, ya que brindan a los desarrolladores herramientas para posicionarse en mercados que parecen estar completamente dominados por oligopolios y algunas corporaciones masivas. Sin embargo, resulta que «infraestructura descentralizada e infraestructura descentralizada El desarrollo de código abierto ya está creando alternativas competitivas a las herramientas de IA premium ”, dijo. ayudará al mundo a evitar una brecha potencial entre los AI-Haves y los No-Have-Nots. público «, dijo a Decrypt.arya cree que los desarrollos de código abierto como Deepseek ayudan a nivelar la escala y crear condiciones más justas en un mercado tan salvaje como la industria de la IA.» El verdadero impulsor del acceso democratizado es la comunidad de código abierto, que es rápidamente ponerse al día ”, dijo. Editado por Sebastian Sinclair y Josh Quittner

Boletín generalmente inteligente

Un viaje semanal de IA narrado por Gen, un modelo de IA generativo.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.