Absolute Zero: El día que la IA dijo 'Gracias humano majete, pero ya me entreno yo solita'

Descubre cómo la IA está aprendiendo sin datos humanos con el revolucionario paradigma Absolute Zero. ¿El fin de la supervisión humana o el inicio de un nuevo modelo laboral?

TRANSFORMACIÓN DIGITALINTELIGENCIA ARTIFICIALIA GENERATIVAMACHINE LEARNING

J. Benavides

5/13/20254 min read

image of a robot sitting at a desk who appears to be learning
image of a robot sitting at a desk who appears to be learning

Absolute Zero: El día que la IA dijo 'Gracias humano majete, pero ya me entreno yo solita'

Imagínate, el sueño de todo jefe: un empleado que no necesita formación, que se pone sus propios retos, se autocorrige, mejora sin supervisión y, para colmo, nunca pide la baja. No, no es ese trepa de la oficina que todos conocemos harto a Red Bulls. Se trata de Absolute Zero, una nueva forma de entrenar modelos de inteligencia como si fuera el mismísimo John Wick preparándose el solito para una misión en versión algoritmo autodidacta. Y todo esto sin datos externos, sin entrenadores humanos... ni gurús vende-humos de la productividad.

La idea aquí es aprender desde la nada, como un buen filósofo de la antigua Grecia. El paradigma Absolute Zero es como dejar tu IA en la isla de Lost y decirle: «A ver cómo te la apañas, coleguilla. Sobrevive. Y entre dramas y crisis, resuélveme unas ecuacioncillas». Y la cosa es que no sólo sobrevive a base de cocos: hasta se convierte en John Locke.

La Ciencia detrás de ello

AZR (Absolute Zero Reasoner), presentado en el estudio publicado por Zhao et al. (2025), es el modelo protagonista. Se entrena a sí mismo generando sus propias preguntas, cual adolescente sin rumbo, las resuelve, y aprende de sus errores (aquí le gana al adolescente). Se encierra en un bucle de auto-juego en el que se propone retos, los verifica gracias a un ejecutor de código, y se da palmaditas en la espalada a sí mismo. Autonomía nivel monje tibetano con acceso a Python.

Estupendo, pero... ¿funciona?

Pues va a ser que sí. Y no solo "funciona", sino que supera a otros modelos entrenados con decenas de miles de ejemplos etiquetados por humanos. En tareas de programación y matemáticas, AZR logra resultados state-of-the-art... sin que nadie le haya dado un triste dataset. Ni uno.

¿Y las aplicaciones reales... o esto es solo para frikis de la IA?

Aquí viene lo importante para nosotr@s, humildes mortales del trabajo cotidiano:

  1. Entrenamiento del personal: Si la IA puede aprender sin datasets, ¿pueden nuestros equipos de trabajo aprender sin formaciones 'tradicionales'? Esta filosofía abriría puertas a entornos de aprendizaje adaptativos, donde cada emplead@ define sus retos y mide su propio progreso. Autonomía (no siempre bienvenida por jefes control-freak, todo sea dicho).

  2. Automatización adaptativa: Sistemas que no solo automatizan tareas, sino que generan nuevas formas más eficientes de hacerlas. El "trabajador digital" que se lo reinventa solo.

  3. Reducción de la dependencia de datos: Empresas pequeñas sin grandes volúmenes de datos podrían beneficiarse de sistemas que no los necesitan para mejorar. El sueño de cualquier pyme tecnológicamente ambiciosa.

Pero... ¡ojo!

La autonomía de aprendizaje también trae riesgos. El estudio menciona momentos "pero qué hace éste" en los que la IA desarrolla patrones de pensamiento preocupantes (tipo Skynet tomándose una caña con HAL9000). Esto subraya la necesidad de entrenamientos con conciencia de seguridad y ética desde el diseño. Algo que, me temo, no está a menudo en el primer folio de prioridades, a menos que seas Anthropic. Pero, como me caracteriza, aquí siempre rompo una lanza en favor de la IA: ¿qué pasa?, ¿no conoces ningún ejecutivo que haya metido la pata hasta las cejas?

¿Y qué pasa con nuestros trabajos?

Aquí llega el momento de la reflexión seria (con cerveza en la mano, mejor): si una IA puede generar y resolver sus propios retos sin intervención humana, ¿qué futuro le espera a quienes basamos nuestro empleo precisamente en resolver problemas?

Esto no significa necesariamente que la IA nos vaya a sustituir a todos, pero sí que cambiará las reglas del juego. Profesionales que aportan valor a través de su capacidad de aprendizaje continuo, pensamiento estratégico, adaptabilidad y creatividad seguirán siendo relevantes. Pero los roles que no se reinventen empiezan a tener fecha de caducidad. Y si no sabes manejar prompts, si no sabes cómo sacarle partido a las IAs... pues negro panorama. Porque si antes te pedían 8 al día... con la IA nos exigirán 8 elevado a lo que la IA permita.

En otras palabras: la IA puede que no venga a quitarnos el trabajo, pero sí nos plantea una situación cuando menos incómoda por delante. Si tu puesto puede automatizarse, se automatizará. Es solo cuestión del 'mejor, más rápido, más barato'. Quizás sea el momento de dejar de hacer scroll en TikTok en casa y empezar a pensar en qué es lo que te hace indispensable. Porque igual que AZR se autoentrena, vamos a tener que empezar a reentrenarnos también, y a marchas forzadas al ritmo que se desarrolla la inteligencia artificial.

Que sí, que Silicon Valley (y otros lugares de China, of course) también vende humo... pero pregunta a los programadores, por ejemplo. Si hace diez años les dices que lo que les llevaba una semana en desarrollar, ahora se hace en 3 horas... lo mismo se parten de risa en tu cara. O pregunta a quienes se dedican al diagnóstico con imágenes... o, en cada vez más clínicas de renombre, 'se dedicaban'...

Conclusión: El principio del fin de la supervisión constante

Absolute Zero no es solo un hito técnico. Es un espejo donde mirar lo que va a ser el futuro de todo trabajo, el aprendizaje y la autonomía profesional. Nos obliga a preguntarnos eso de si estamos preparad@s para confiar en sistemas que aprendan solos... Y lo más importante: ¿Estamos preparad@s y dispuest@s para aprender a su ritmo? Se avecina una era cuanto menos inquietante.

Para más información: Zhao, A. et al. (2025). Absolute Zero: Reinforced self-play reasoning with zero data. arXiv