OpenAI ha presentado GPT-5.3-Codex, un modelo que no se limita a iterar sobre las capacidades de programación de sus predecesores, sino que busca fusionar la competencia técnica con el razonamiento avanzado y el conocimiento profesional.
Esta nueva versión promete un cambio de paradigma: pasar de un asistente que sugiere líneas de código a un «agente» capaz de utilizar un ordenador de manera autónoma para llevar a cabo flujos de trabajo completos.
Lo que distingue a GPT-5.3-Codex es su arquitectura híbrida. El modelo combina el rendimiento de programación de la rama Codex anterior con las capacidades de razonamiento general de GPT-5.2, todo ello ejecutándose un 25% más rápido gracias a mejoras en la infraestructura y el uso de sistemas NVIDIA GB200 NVL72.
Esta velocidad adicional es crítica, ya que el modelo está diseñado para «pensar» y operar durante periodos más largos, abordando tareas que requieren investigación, uso de herramientas externas y ejecución secuencial sin perder el contexto, tal y como lo haría un colega humano.
Un salto cuantitativo en el uso del terminal y el sistema operativo
Para medir la eficacia real de este nuevo enfoque «agéntico», es necesario remitirse a las cifras. Los benchmarks técnicos muestran una mejora sustancial en la capacidad del modelo para interactuar con entornos informáticos reales, más allá del editor de texto.
En la prueba OSWorld-Verified, que evalúa la capacidad de un agente para completar tareas de productividad en un entorno visual de escritorio, GPT-5.3-Codex alcanza una precisión del 64,7%.
Este dato es especialmente relevante si se compara con el 38,2% de su predecesor, acercándose peligrosamente al rendimiento humano promedio en estas tareas, situado en torno al 72%.
Del mismo modo, el dominio de la línea de comandos ha experimentado un avance notable. En el benchmark Terminal-Bench 2.0, el nuevo modelo registra una precisión del 77,3%, superando con holgura el 64,0% de la versión anterior.
Estas estadísticas sugieren que la IA ya no solo sirve para escribir la lógica de un programa, sino para desplegarlo, gestionar dependencias y solucionar errores en tiempo real dentro del sistema.
De hecho, la propia OpenAI ha revelado que el equipo de desarrollo utilizó versiones tempranas de este modelo para depurar el entrenamiento y gestionar el despliegue de la versión final, convirtiéndolo en el primer modelo que ha sido instrumental en su propia creación.
Más allá del código: Diseño web y tareas administrativas
La versatilidad de GPT-5.3-Codex se extiende al desarrollo web y al trabajo administrativo general. En pruebas internas, el modelo fue capaz de construir videojuegos complejos desde cero —como un simulador de buceo y una secuela de un juego de carreras— iterando de forma autónoma a través de millones de tokens.
La mejora en la comprensión de la «intención» del usuario es palpable: ante instrucciones vagas para crear una landing page, el modelo ahora toma decisiones de diseño más maduras, como estructurar precios con descuentos mensuales calculados automáticamente o implementar carruseles de testimonios funcionales, en lugar de generar esqueletos básicos que requieren una fuerte intervención humana.
Sin embargo, OpenAI insiste en que este modelo no es solo para programadores. Al igual que GPT-5.2, la variante Codex mantiene un alto rendimiento en tareas de conocimiento profesional (medido por el benchmark GDPval), lo que le permite generar presentaciones financieras, análisis de hojas de cálculo o documentos de formación.
La diferencia radica en su capacidad de ejecución: puede leer datos, procesarlos y generar el entregable final con una autonomía superior.
Seguridad y disponibilidad
El aumento de capacidades conlleva un mayor escrutinio en seguridad. GPT-5.3-Codex ha sido clasificado como de «alta capacidad» en tareas de ciberseguridad.
Aunque esto implica un potencial uso dual, OpenAI ha implementado su pila de seguridad más completa hasta la fecha y ha destinado 10 millones de dólares en créditos API para acelerar la defensa cibernética.
El modelo ya está disponible para usuarios de los planes de pago de ChatGPT (Plus, Team) en todas las interfaces de Codex, preparándose para un despliegue vía API en el futuro cercano.

