OpenAI presenta Operator y ChatGPT Agent: avances prometedores en agentes de IA, pero aún con limitaciones

Operator: asistencia semiautónoma para tareas cotidianas

OpenAI permitió a periodistas probar durante una semana su nuevo agente de IA llamado Operator, un sistema diseñado para realizar tareas autónomas en internet. Según los testimonios, este desarrollo representa el avance más cercano hacia la visión de agentes de IA capaces de automatizar actividades rutinarias, aunque todavía requiere supervisión humana constante.

El modelo que impulsa a Operator combina capacidades visuales de GPT-4o con habilidades de razonamiento mejoradas. En pruebas, demostró eficiencia en acciones básicas como navegación web, clics en botones y llenado de formularios, superando en velocidad a alternativas de Anthropic y Google. Sin embargo, los usuarios debieron intervenir frecuentemente para resolver bloqueos, otorgar permisos o corregir errores.

Pruebas prácticas revelan desafíos

Durante una prueba relacionada con la obtención de un permiso de estacionamiento en San Francisco, Operator mostró capacidad para encontrar el sitio web correcto y la página adecuada.

No obstante, requirió múltiples autorizaciones y asistencia para completar datos personales. Situaciones similares ocurrieron al reservar en restaurantes, donde el agente formuló más de seis preguntas antes de finalizar el proceso.

Un incidente destacado involucró la búsqueda de estacionamientos cercanos, donde Operator alucinó distancias, sugiriendo garajes a 20-30 minutos de caminata (en lugar de pocos minutos como afirmó). Estos errores subrayan por qué OpenAI limita el acceso del sistema a información sensible como contraseñas o tarjetas de crédito.

ChatGPT Agent: un salto hacia la autonomía multifuncional

Paralelamente, OpenAI presentó ChatGPT Agent, un sistema más avanzado que integra herramientas de Operator con capacidades de investigación profunda. Demostrado en un evento en vivo, este agente puede planificar eventos complejos como bodas, coordinando reservas, regalos y logística mediante interacción con APIs de servicios externos.

La arquitectura utiliza una computadora virtual propia que permite navegación web, ejecución de código, manejo de archivos e interacción con aplicaciones personales (previa autorización). A diferencia de Operator, este sistema alterna autónomamente entre modos de operación según los requerimientos de cada tarea.

Mecanismos de seguridad y limitaciones

Ambos sistemas incorporan protocolos de seguridad rigurosos. ChatGPT Agent solicita confirmación para acciones críticas (envío de emails, modificaciones de archivos) e incluye un "modo observación" en sitios sensibles. Sin embargo, su velocidad operativa sigue siendo un punto débil, con procesos que pueden extenderse varios minutos debido a estas verificaciones.

Adopción empresarial y competencia

Algunas plataformas como Instacart, Uber y eBay colaboraron activamente con OpenAI para optimizar la interoperabilidad con Operator. "Los sistemas agentes impactarán significativamente cómo los consumidores interactúan con propiedades digitales", señaló Nitzan Mekel-Bobrov, director de IA de eBay. En contraste, servicios como Expedia, Reddit y YouTube bloquearon el acceso al agente.

Este desarrollo posiciona a OpenAI frente a competidores como Google (Project Mariner), Microsoft Copilot y Anthropic Opus 4, aunque estos últimos se enfocan actualmente en asistencia más que en autonomía plena. Analistas anticipan que la brecha competitiva podría reducirse pronto, dado que Anthropic ya ha publicado avances sobre sus propios agentes.

Perspectivas futuras

Si bien ambos agentes representan hitos tecnológicos, su utilidad práctica aún está limitada por la necesidad de supervisión humana, velocidades variables y riesgos de alucinaciones. OpenAI reconoce que la verdadera autonomía requerirá modelos más confiables que minimicen la intervención del usuario. Hasta entonces, estos sistemas funcionarán mejor como asistentes colaborativos que como reemplazos completos de la gestión humana en tareas críticas.

Video

Tags

    There are no post in the library.