Grok

xAI ha presentado Grok 4.1, una actualización mayor que llega de forma inmediata a todos los usuarios en grok.com, y las aplicaciones de iOS y Android. No se trata de un simple ajuste incremental, sino de un paso ambicioso hacia un modelo más útil, más perceptivo y, sobre todo, más humano en sus interacciones.

Mantiene la rapidez y el filo técnico de Grok 4, pero ahora se mueve con una soltura emocional y creativa que lo coloca entre lo más destacado de la nueva hornada de modelos de 2025.

Durante las dos primeras semanas de noviembre, la compañía realizó un despliegue silencioso para ir midiendo su rendimiento con tráfico real. Las comparaciones ciegas con el modelo anterior ofrecen una ventaja clara, con más del 64% de preferencia entre los usuarios evaluadores.

A nivel de benchmarks públicos, también se ha situado en posiciones de privilegio. En la conocida LMArena, Grok 4.1 Thinking –la variante con razonamiento explícito– se ha colocado directamente como el modelo mejor valorado, con un Elo por encima de todos los competidores no pertenecientes a xAI.

La versión rápida, sin tokens de pensamiento, va justo detrás, pero aún así supera a muchos rivales incluso en sus configuraciones de máximo razonamiento.

El salto cualitativo más evidente está en su trato con el usuario. xAI ha dedicado una parte importante de la optimización a la personalidad del modelo, afinando tono, empatía, sensibilidad contextual y coherencia en las conversaciones largas. Las pruebas de inteligencia emocional, como EQ-Bench, reflejan este avance con solvencia.

El modelo no sólo responde de forma más cálida y comprensiva, sino que entiende mejor matices, dobles intenciones y situaciones delicadas. En entornos creativos se nota también la evolución: en Creative Writing v3 se sitúa entre los mejores, mostrando una voz más definida y una capacidad narrativa más pulida que sus predecesores.

A nivel práctico, otro de los objetivos claros era reducir las alucinaciones, sobre todo en la versión rápida del modelo. Según los datos de la propia xAI, Grok 4.1 mejora con fuerza la precisión en consultas informativas reales y reduce tanto errores menores como afirmaciones incorrectas. También baja la puntuación en FActScore, señal de un modelo más cauto y mejor alineado cuando se trata de ofrecer hechos contrastables.

xAI afirma que buena parte de esta mejora se debe a la adopción de metodología basada en modelos de razonamiento de frontera usados como evaluadores automáticos. Esto permite iteraciones masivas sin depender únicamente de etiquetado humano y, según la compañía, facilita ajustar estilo, asistencia y alineamiento sin sacrificar capacidad.

En conjunto, Grok 4.1 se presenta como una apuesta sólida por equilibrar inteligencia pura, cercanía y fiabilidad. Un modelo más cómodo para conversar, más consistente en sus emociones simuladas y, a la vez, más preciso cuando toca responder preguntas serias.

Más información, uso y descarga en su web oficial.