Al igual que OpenAI, Meta, Amazon, entre otras compañías avanzan en el desarrollo de sus LLMs, Google continúa incorporando mejoras en su modelo de IA y anunció esta semana el lanzamiento de Gemini 2.0.
Mientras ChatGPT acaba de llegar a iOS 18.2 para integrarse con Apple Intelligence en los dispositivos compatibles, Google está incorporando su inteligencia artificial en la mayoría de sus servicios con la misión de tomar la delantera en la lucha por atraer la mayor cantidad de usuarios posibles.
Gemini 2.0 trae entre sus novedades cosas realmente interesantes, incluyendo la capacidad para generar audio e imágenes de forma nativa. Sin embargo, lo más importante es que esta actualización incorpora nuevas capacidades multimodales que sientan las bases para la próxima gran novedad de la IA: los agentes.
La llamada inteligencia artificial agentica será la próxima gran novedad que se incorporará en la mayoría de los servicios. Según dijo el CEO de Google, Sundar Pichai, «durante el último año, hemos estado invirtiendo en el desarrollo de más modelos agentivos, lo que significa que pueden comprender más sobre el mundo que lo rodea, pensar varios pasos adelante y tomar medidas en su nombre, con su supervisión».
El ejecutivo celebró la llegada de Gemini 2.0 asegurando que en la compañía están «emocionados de lanzar nuestra próxima era de modelos creados para esta nueva era de agentes: Gemini 2.0, nuestro modelo más capaz hasta el momento. Con los nuevos avances en la multimodalidad, como la salida nativa de imagen y audio, y el uso de herramientas nativas, nos permitirá crear nuevos agentes de IA que nos acerquen a nuestra visión de un asistente universal».
¿Qué es la inteligencia artificial agentica de Gemini 2.0?
La IA agentica se refiere a los bots de IA diseñados para actuar de forma independiente, sin necesidad de intervención humana en cada paso. Esto le permite a la IA tomar decisiones más complejas en función de su comprensión de los objetivos o datos disponibles.
El gran ejemplo de esto por parte de Google lo vemos en el Project Mariner, una extensión de Chrome que se encuentra en etapa experimental y que permitirá a la IA usar el navegador web por usted, o Jules, otro agente pensado para ayudar a los desarrolladores a encontrar y corregir errores en su código.
Con Gemini 2.0 se ha demostrado otro agente capaz de observar la pantalla y ayudar a los usuarios a obtener un mejor desempeño en los videojuegos.
El nuevo Gemini 2.0 ya está disponible para «desarrolladores y testers de confianza», mientras que la compañía ha comenzado a incluir el nuevo modelo en sus productos, incluyendo el asistente Gemini y el buscador Google Search; el producto de la empresa que más ha sido más transformado por la IA, que ahora cuenta con resúmenes de IA que llegan a mil millones de personas según Google.
A partir de hoy, el modelo experimental Gemini 2.0 Flash estará disponible para todos los usuarios de Gemini, mientras que la nueva función llamada investigación profunda solo está disponible en Gemini Advanced, permitiendo acceder a capacidades de razonamiento avanzado y contexto largo para actuar como asistente de investigación, explorando temas complejos y compilando informes en su nombre.
Por Sergio Ramos, editor en Social Geek, y contribuidor en Entrepreneur y Forbes en Español. Experto en temas de tecnología que disfruta aprendiendo sobre startups, emprendimiento e innovación.
El Nacional