Google se está preparando para lanzar su tan esperado sistema de IA conversacional Gemini, preparando el escenario para una batalla real de IA con ChatGPT de OpenAI. Según un informe de The Information, Google ha abierto las pruebas de Gemini a empresas seleccionadas, lo que indica su lanzamiento al consumidor podría ser inminente. Gemini es un LLM multimodal, lo que significa que puede recibir de forma nativa entradas de diferentes modalidades, por ejemplo, texto, imagen, audio, etc. «Gemini fue creado desde cero para ser multimodal», dijo el director ejecutivo de Google, Sundar Pichai, en la conferencia de Google. Keynote de i/o de mayo. Aunque aún es temprano, ya estamos viendo capacidades multimodales impresionantes que no se ven en modelos anteriores”, agregó. Esto enfrentaría al titán tecnológico con el exitoso chatbot ChatGPT de OpenAI, que ha estado causando grandes revuelo desde su lanzamiento en noviembre pasado. Desde fintech hasta atención sanitaria, las empresas ya están desembolsando mucho dinero para aprovechar sus asombrosas capacidades conversacionales. Pero Pichai parece imperturbable ante la perspectiva de un duelo de IA. «No me queda del todo claro si podría haber funcionado también», Pichai. dijo a Wired cuando se le preguntó si Google debería haber lanzado un competidor ChatGPT antes. Pichai ha estado aumentando la inversión en lo que él llama el «futuro primero en IA» de Google desde 2016. Pero cree que se necesitaba más tiempo para perfeccionar sus modelos antes del horario estelar. » Me siento muy cómodo acerca de dónde estamos”, dijo. El lanzamiento inicial de Google de su chatbot Bard basado en LaMDA en febrero fue un fracaso después de que erró datos básicos sobre el telescopio James Webb. Pero desde entonces Bard ha recibido una actualización importante para aprovechar el nuevo modelo multimodal PaLM 2 de Google, que «supera significativamente» a su predecesor, como Decrypt pudo confirmar en una comparación. El Bard renovado ya ha demostrado que puede enfrentarse con ChatGPT. Además, en determinadas áreas, siendo gratuito y de mayor acceso. Una prueba de Decrypt encontró que Bard ofrecía traducciones más rápidas y contextuales en comparación con ChatGPT. También aplastó a la competencia a la hora de generar código, soportando más de 20 lenguajes de programación. Pero ChatPGT se ha puesto al día en ese sentido con su herramienta Advanced Data Analytics, que ha convertido el chatbot en una poderosa máquina de codificación que ahora es mucho más avanzada que las capacidades nativas de Bard. Y la integración de Bard con el vasto índice de búsqueda en tiempo real de Google le dio al chatbot una ventaja al responder preguntas sobre eventos actuales. Google también es el principal inversor en Anthropic, la startup detrás de Claude AI, el competidor más poderoso de ChatGPT hasta la fecha. Claude puede manejar más de 100.000 tokens de contexto, lo que significa que los usuarios pueden darle al chatbot 10 veces más información de la que ChatGPT puede manejar. Y los resultados lo sitúan periódicamente entre GPT3.5 y GPT-4 en términos de calidad. Con las grandes capacidades contextuales de Claude, la integración de Bard con Google para el consumidor medio y las capacidades multimodales de Gemini, Google busca dominar el espacio de la IA y tomar el trono que actualmente ocupan OpenAI y Microsoft. Google también está siguiendo un «enfoque ecosistémico» para la IA. integrando capacidades generativas en sus productos como Docs, Maps y Search. Esta misma semana anunció nuevas actualizaciones de IA destinadas a mejorar la forma en que las personas encuentran y digieren información en línea. Con Gemini esperando entre bastidores, el imperio de IA de OpenAI pronto podría enfrentar su mayor desafío hasta el momento. Pero por ahora, parece que Pichai está feliz de adoptar un enfoque lento y constante.