LLMs: cerebros artificiales que tod@s necesitamos

Descubre todo sobre los LLMs: cómo funcionan, su entrenamiento, sus aplicaciones y limitaciones. Aprende por qué están revolucionando la tecnología y cómo pueden cambiar el futuro laboral inmediato.

TRANSFORMACIÓN DIGITALIA GENERATIVAINTELIGENCIA ARTIFICIAL

J. Benavides

9/2/20245 min read

LLMs: Cerebros artificiales que tod@s necesitamos

Imagina por un momento que tu ordenador no solo sabe responderte, sino que lo hace con la elocuencia de un poeta, la precisión de un abogado (bueno) y la velocidad de tu sobrino el gamer que tiene dedos de pianista. Eso, my people, es más o menos un Modelo de Lenguaje de Gran Escala (Large Language Model en inglés). ¿Revolución? ¿Maldición? ¿La excusa perfecta para no responder nunca más a mis correos? Vamos a verlo. 😏

¿Qué refostios es un LLM?

A ver, simplificado a nivel de abuelo de Heidi, un LLM es un modelo de inteligencia artificial que ha leído más que cualquier persona que conoces, pero sin noches eternas de bañeras repletas de cafeína. Se la alimenta de datos a lo bestia: libros, artículos, foros de internet, probablemente hasta la carta de amor que escribiste en tu adolescencia a Estefanía la del quinto y que nunca enviaste, pero que de algún modo llegó a manos de OpenAI o Google... El objetivo del LLM es reconocer patrones en el lenguaje y generar respuestas lo más humanas posible a partir de lo aprendido.

Y no, esto no es magia. Es pura estadística, compañeras. ¿Que si tiene sentido lo que dice? Bueno, depende. Si le preguntas por el significado de la vida, puede darte una respuesta existencialista… o decirte que son 42. Lo mismo ambas válidas, si me preguntas a mí.

El divorcio entre programación tradicional y los LLMs

Si le pides a un programa normalito de toda la vida “hazme un café si es de día”, te dirá “sí, señor” y punto. Pero te lo hará de la única manera en que lo has programado. Por el contrario, un LLM no necesita que le digas cómo hacer el café; aprende a prepararlo después de leer millones de recetas y todas las apasionantes discusiones sobre café que hay en Reddit.

Esta es la diferencia clave: la programación tradicional funciona con instrucciones explícitas (si pasa X, haz Y). Los LLMs, en cambio, aprenden de ejemplos, lo que les hace extremadamente flexibles, pero también peligrosamente creativos. A veces demasiado, como cuando se inventan datos con la confianza y empaque del sobrado de tu cuñado en Nochebuena. Sí, en ambos casos eso se llama alucinación.

Historia exprés de los LLMs (o cómo pasamos de bots tontuelos a oráculos digitales)

Si crees que la IA es un invento reciente, siento decepcionarte. En los años 60 ya existía ELIZA, el primer chatbot, que respondía con frases predefinidas. Una pionera con la profundidad emocional de un pedrusco de la torrentera del pueblo. Luego llegaron las redes neuronales, el deep learning y en 2017 los Transformers (no los de Michael Bay, sino los de Google), que revolucionaron la forma en que los modelos de lenguaje procesan la información. Desde entonces, ha sido una carrera armamentística: GPT-2, GPT-3, GPT-4… Gemini, Claude, LLama... hasta los modelos actuales con más parámetros que seguidores de Ronaldo, Messi, Mbappé y Lamín combinados. Vale, vale, los de Ander del Real Unión también los incluimos, que si no me pegan...

¿Cómo demonios funcionan los LLMs?

Lo resumimos en tres pasos:

  1. Tokenización: El modelo parte las frases en pedacitos llamados tokens, como quien destroza galletas para el cheesecake.

  2. Embeddings: Convierte esos tokens en números, organizados en un espacio matemático multidimensional (piensa en un mapa del lenguaje en el que “gato” y “perro” están cerca, pero “sartén” y “anarquía” no tienen nada que ver… o eso esperamos).

  3. Transformers: Aquí es donde la magia ocurre. A través de un mecanismo de atención (tipo “¿qué es realmente importante en esta frase?”), el modelo elige la mejor respuesta posible. O la más graciosa. O la más errónea, porque a veces va de listo.

Pero… ¿se entrenan solos?

Va a ser que no. El día que lo hagan, me quedo sin curro 😱. Entrenar un LLM es como intentar enseñarle buenos modales a adolescentes cabronzuel@s. Se necesita una cantidad absurda de datos, una pila de servidores que te harían llorar a moco tendido con tu factura de la luz, y mucho tiempo... aunque cada vez menos (no es el caso del adolescente).

Primero, el modelo aprende con toneladas de texto. ¡Hala, ahí va eso! Luego, se le ajusta con supervisión humana (yo y muchísimos otros), lo que significa que personas reales 🧑‍💻 le decimos: “Esto es una buena respuesta” o “Compi, esto es una cagada, te lo has inventado de cabo a rabo”. Finalmente, se refina con retroalimentación de usuarios, lo que básicamente significa que tú, cuando te quejas de las chorradas que te suelta ChatGPT, estás ayudando a mejorar el futuro de la IA (o eso nos gusta pensar). Aunque todo esto ya está cambiando con los modelos que 'piensan' y aprenden de sí mismos o de datos sintéticos... pero eso lo dejaremos para otra ocasión, no nos reviente el molondro hoy.

Los LLMs no son perfectos (y menos mal, o esto olería a distopía inmediata)

Sí, son impresionantes. Pero también tienen problemas:

  • Se inventan cosas: Si un LLM fuera una persona, sería esa amiga que te cuenta historias increíbles que nadie puede verificar. O como los de Ancient Aliens...

  • Cuestan una fortuna: Literalmente. Entrenar un modelo como GPT-4 requirió más dinero que el PIB de muchas naciones.

  • Pueden estar (y están) sesgados: Como aprenden de datos humanos, heredan nuestros prejuicios y jodiendas varias. Así que no, no son oráculos imparciales de la verdad. Y, a veces, por corregir esto nos pasamos de largo por el otro lado, como ese modelo de Google que representaba imágenes de gente de clase influyente de la Alemania nazi como personas de raza de color... 😨

¿Para qué sirven en el mundo real?

Aquí es donde se pone interesante. Los LLMs ya están cambiando el juego en muchas áreas:

  • Atención al cliente: Adiós a las respuestas genéricas. Hola a los chatbots con más personalidad que tu jefe (lo que a menudo no es muy complicado, dicho sea de paso).

  • Traducción automática: Mejorando día a día, aunque aun con perlas dignas de libro de anécdotas. Pero lo que se ha avanzado en esto... madre mía.

  • Escritura de código: ¿Tienes un bug? Pregunta a la IA y tal vez te responda con un código que no solo funciona, sino que hasta tiene sentido, no como la que te lía IT cada vez que pides ayuda.

  • Medicina: Ayudando a diagnosticar enfermedades, aunque esperemos que no diagnostique un estornudo como síntoma inequívoco del apocalipsis zombi. 🧟‍♂️

  • Y mil cosas más que ya iremos tratando...

¿Y ahora qué?

La evolución no para. Modelos más rápidos, eficientes y, si todo sale bien, menos mentirosos. Siempre me preguntan cómo me puedo fiar de un LLM, y yo respondo que igual que te fías de lo que le pidas al becario o tu compi de la mesa de al lado... supervisar. También se intenta darles memoria, para que recuerden conversaciones pasadas y dejen de ser como Dory en “Buscando a Nemo”. En ello estamos...

¿Nos llevarán a un futuro utópico de productividad sin esfuerzo o a un mundo donde los LLMs sean los que manden y nosotros solo estemos aquí para enchufarles el cable de carga? Eso, my people, aún está por verse.

Por ahora, aprovechemos lo bueno: dile adiós a responder emails aburridos, textos mal escritos y las excusas para no hacer los deberes. La IA ya está aquí. Ya solo falta que se la incorporen al robot humanoide y también me traiga el café a la mesa. ☕