
OpenAI transformó Codex el 16 de abril de 2026 de un asistente de código en una estación de trabajo autónoma completa. La actualización, presentada bajo el nombre «Codex for (almost) everything», añade control visual de la computadora en macOS, un navegador integrado, generación de imágenes, memoria persistente entre sesiones, automatizaciones programables y más de 90 plugins verificados que conectan con GitHub, Slack, Notion, Microsoft 365, Google Workspace, Atlassian y GitLab. Con 4 millones de desarrolladores usando Codex cada semana —el doble que hace dos semanas— OpenAI apuesta a que la categoría de agente de escritorio tiene más recorrido que la de chatbot.
De asistente de código a agente que controla tu Mac
El cambio más radical del update es el computer use en macOS: Codex puede ahora ver tu pantalla, mover el cursor, hacer clic y escribir en cualquier aplicación del sistema operativo. El resultado práctico es que Codex puede interactuar con interfaces visuales que los agentes basados exclusivamente en terminal no pueden tocar —desde Figma y Xcode hasta Slack y cualquier aplicación de diseño o gestión de proyectos.
Una capacidad especialmente relevante: múltiples agentes de Codex pueden ejecutar tareas en paralelo en segundo plano sin interferir con el trabajo que estás haciendo en otras ventanas. Puedes tener un agente revisando PRs de GitHub, otro iterando sobre un diseño en Figma y un tercero ejecutando tests mientras tú escribes en otro archivo. La limitación actual es que computer use solo está disponible en macOS y no en la Unión Europea, el Reino Unido ni Suiza —restricciones que OpenAI atribuye a diferencias regulatorias.
Browser integrado, memoria y automatizaciones largas
El navegador in-app permite a Codex navegar servidores locales y páginas públicas directamente desde su interfaz. En términos prácticos, elimina el ciclo de cambiar entre el editor, el navegador y las herramientas de feedback: Codex puede ver el resultado de un cambio en el frontend, anotar visualmente qué ajustar («hacer este botón 20px más alto») y aplicar el cambio en el mismo flujo.
La memoria persistente —aún en rollout limitado a planes Enterprise y Edu— permite que Codex recuerde preferencias de código, correcciones previas y contexto de proyectos entre sesiones. La diferencia práctica es significativa: no tener que re-explicar el stack tecnológico, las convenciones de naming o los estándares de testing cada vez que abres una conversación nueva.
Las automatizaciones extendidas permiten programar tareas: «revisa si este proceso terminó mañana por la mañana» o «ejecuta los tests cada vez que haga push a esta rama». Los hilos de conversación previos se reutilizan conservando el contexto completo, y el acceso SSH a devboxes remotos —en versión alpha— permite controlar entornos de desarrollo en la nube desde la misma interfaz.
90 plugins curados: la apuesta por calidad sobre cantidad
El ecosistema de plugins de Codex suma más de 90 integraciones verificadas, incluyendo Atlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Databricks, Remotion, Render y servidores MCP para herramientas personalizadas. La estrategia es deliberadamente diferente al modelo abierto: mientras Claude ofrece acceso a más de 3.000 servidores MCP no verificados, OpenAI ha optado por un catálogo curado con controles de seguridad.
El argumento de OpenAI es que los ecosistemas abiertos de herramientas de terceros son vectores de ataques de supply chain —un riesgo real documentado en varios incidentes de 2025 con extensiones de agentes de IA maliciosas. Para empresas con requisitos de cumplimiento estrictos, la selección curada puede ser un argumento de adopción más convincente que la cantidad de integraciones disponibles.
Codex vs Claude Code: el duelo de los agentes de programación
Con el lanzamiento, la comparativa directa con Claude Code de Anthropic es inevitable. Los benchmarks disponibles a abril de 2026 dibujan una imagen de herramientas complementarias más que directamente sustituibles:
- Calidad de código: Claude Code (80,8% en SWE-bench) supera significativamente a Codex (~49%). Para arquitectura de sistemas, refactores de gran escala o razonamiento complejo sobre código, Claude Code mantiene ventaja.
- Automatización de DevOps: Codex (77,3% en Terminal-Bench) supera a Claude Code (65,4%). Para pipelines de CI/CD, automatización de terminal y flujos DevOps, Codex tiene ventaja.
- Diferencial exclusivo de Codex: generación de imágenes integrada con gpt-image-1.5, computer use visual, plugins curados con seguridad verificada.
- Diferencial exclusivo de Claude: ventana de contexto de 1 millón de tokens (beta), ecosistema MCP abierto con 3.000+ servidores, mayor precisión en razonamiento de código complejo.
El 50% de los usuarios de Codex ya le asignaba tareas no relacionadas con código antes de este update, según datos de OpenAI. La actualización formaliza lo que el mercado ya hacía de forma espontánea: usar Codex como un agente de productividad general, no solo como generador de código.
Qué significa para equipos de marketing y empresas no técnicas
El update de Codex tiene implicaciones más allá del desarrollo de software. La capacidad de controlar visualmente aplicaciones, combinada con los plugins de Google Workspace y Microsoft 365, convierte a Codex en una herramienta potencialmente útil para flujos de trabajo que no requieren escribir código: automatizar reportes, mover datos entre hojas de cálculo, gestionar tareas en Notion o revisar documentos en ciclos iterativos.
Para equipos de marketing digital, los casos de uso más directos incluyen la automatización de reporting entre plataformas (Google Analytics → hoja de cálculo → informe formateado), la generación de mockups de anuncios con gpt-image-1.5 directamente desde Codex, y la gestión de flujos en Slack o Atlassian sin cambiar de herramienta.
El desafío es el modelo de precios basado en tokens, que hace más difícil predecir el costo mensual que las suscripciones fijas por usuario. Para organizaciones con uso intensivo de generación de imágenes o automatizaciones paralelas, el add-on de $100 adicionales puede volverse necesario rápidamente. La regla práctica: calcular el costo del tiempo que ahorra antes de comparar con el precio del plan.
Con información de OpenAI, Build Fast with AI y Hacker News / Redacción VinzNetwork
y luego