Manus, los agentes de IA y por qué la innovación no se limita a los LLM
Manus demuestra, por n-ésima vez, que a esta industria le cuesta discernir el polvo de la paja y que hay que reorientar los esfuerzos de innovación hacia donde realmente está el valor.
La noticia de la semana en el mundo tecnológico está siendo, sin duda, el lanzamiento de Manus, un agente autónomo de inteligencia artificial capaz, según sus creadores, de resolver multitud de tareas de nuestra vida diaria sin nuestra intervención.
Recordemos, antes de nada, que cuando hablamos de “agentes de IA” nos referimos a una aplicación de los grandes modelos de lenguaje (LLM) que va más allá del uso más extendido que hacemos de ellos, que suele ser la mera conversación en la que nos contestan a preguntas, modifican textos o cosas similares.
Los agentes, además de mantener esa capacidad conversacional, pueden ejecutar tareas para nosotros, decidiendo cómo dividir el problema propuesto en pasos más pequeños y, sobre todo, con la posibilidad de interactuar con otros sistemas, como sitios web de terceros o servicios donde compartir archivos, por ejemplo.
Así, si pedimos a un agente de IA que nos organice un viaje de vacaciones a un determinado destino en ciertas fechas, debería ser capaz de cosas como:
consultar webs de guías de viaje para recopilar información útil sobre qué ver y qué hacer en ese país,
buscar horarios en webs de aerolíneas y de trenes para sugerirnos los vuelos y conexiones más adecuados,
encontrar ofertas de coches de alquiler,
consultar el tiempo previsto para esos días y así recomendarnos qué ropa llevar…
Todo esto, de forma autónoma, sin que hayamos tenido que señalarle qué información debe buscar ni dónde debe encontrarla. En teoría, en un futuro los agentes deberían ser capaces de llegar al punto de reservarnos los billetes o los hoteles, bloquear nuestro calendario y cosas así pero lo cierto es que, a día de hoy, ese tipo de capacidades están muy limitadas, en unos casos porque suelen requerir mucho trabajo específico para hacerlas funcionar y, en otros, porque sencillamente fallan mucho más de lo que funcionan.
¿Qué novedades ha traído Manus al mundo de los agentes de IA?
Esa pregunta requiere una explicación en dos partes:
En un primer momento, las reacciones al lanzamiento de Manus fueron de asombro, en parte porque las demos que se pueden ver en su web son muy llamativas y, también, porque esta industria siempre tiene hambre de noticias y hay una maquinaria muy bien engrasada para diseminarlas a gran velocidad, sin pasarlas por un filtro crítico muy exigente. Así, los primeros días se hablaba de que detrás de Manus había un nuevo modelo de lenguaje creado específicamente para resolver tareas de agente o que si era otro gran paso del sector tecnológico chino en esta carrera por el liderazgo de la IA en la que parece que estamos inmersos.
Sin embargo, en cuanto se pudo analizar Manus con un poco de más calma y la información ha fluido desde sus creadores con más claridad, se ha visto que Manus es una implementación ingeniosa y decente de un agente multipropósito, sí, pero que supone poco o ningún avance en el estado del arte. Concretamente, ahora sabemos que Manus no usa un modelo propio y novedoso, sino que tiene por debajo un modelo comercial ampliamente disponible y conocido, Claude Sonnet, de Anthropic. También, que para navegar por la web utiliza una librería de código abierto muy popular para la creación de agentes, browser-use. Así que, como digo, Manus no supone ninguna revolución desde la perspectiva científica o tecnológica, pero eso no significa que no tenga valor.
Entonces, si no supone una gran innovación, ¿en qué sentido es valioso Manus?
Manus supone una demostración palpable de lo que se puede llegar a hacer combinando piezas existentes y es un claro recordatorio de algo que vengo diciendo desde hace ya mucho tiempo: que, cuando hablamos de innovación en Inteligencia Artificial, no debemos limitar nuestras opciones a la creación de nuevos modelos de lenguaje, sino que una gran parte del potencial de valor de esta tecnología está en la capacidad para crear sistemas que resuelvan problemas reales mediante la combinación e integración de otros elementos ya existentes.
Llevamos ya demasiado tiempo enfrascados en la discusión de si este LLM es mejor que este otro o de si la legislación europea supone un freno a nuestra posibilidad de crear nuevos modelos de lenguaje, cuando cada vez está más claro que los LLM tienden a convertirse en una commodity, es decir, a convertirse en productos fácilmente intercambiables unos por otros, porque sus capacidades son muy similares.
Esto se ve con contundencia en cómo cada nuevo avance es rápidamente igualado por el resto del mercado en muy poco tiempo y en cómo, a día de hoy, ninguna de las principales empresas del mercado tiene, en lo tecnológico, una ventaja competitiva clara y defendible sobre las demás, a pesar de los miles de millones invertidos en estos últimos años. Ya le pasó a OpenAI con DeepSeek y le acaba de volver a pasar con Manus, que es una alternativa de bajo coste a su Operator, anunciado hace poco más de un mes.
Así que le estamos prestando menos atención de la que merece a la innovación que podemos generar por encima de los grandes modelos de lenguaje, que es donde realmente está hoy el valor por explotar y donde, además, las barreras de entrada son infinitamente menores.
Manus nos demuestra cómo se puede crear productos útiles y con potencial de mercado innovando en las capas de integración y de aplicación, es decir, resolviendo problemas reales de los usuarios sin que tengan que operar directamente con el modelo de IA que hay por debajo, ni les importe cuál sea ese modelo mientras les resuelva su problema.