Cuando escribes una pregunta en ChatGPT y pulsas enter, aparece una respuesta fluida, segura, casi humana. ¿Qué ha pasado por dentro? Entender cómo funcionan estos sistemas no es un capricho técnico: te permite usarlos mejor y, sobre todo, reconocer cuándo no fiarte de ellos. Vamos por partes.

Primero, ubiquémonos: ¿qué es un “LLM”?

Las siglas LLM significan Large Language Model, o modelo de lenguaje grande. ChatGPT, Gemini o Claude son LLMs. Pero conviene situarlos dentro de un mapa más amplio, porque “inteligencia artificial” se usa para cosas muy distintas. Piensa en muñecas rusas, una dentro de otra:

  • Inteligencia artificial: cualquier sistema que simula capacidades humanas, desde reglas simples hasta redes neuronales (un filtro de spam, un buscador).
  • Machine learning: programas que aprenden patrones a partir de datos, sin que nadie los programe regla por regla (las recomendaciones de Netflix o Spotify).
  • Deep learning: redes neuronales con muchas capas, capaces de procesar imágenes, audio y texto (el reconocimiento facial, la transcripción de voz).
  • IA generativa: modelos que crean contenido nuevo (texto, imágenes, código).
  • LLMs: la muñeca más pequeña y especializada. IA generativa aplicada al lenguaje.

Cada categoría está contenida en la anterior. Cuando alguien dice “la IA”, muchas veces se refiere en realidad a esta última muñeca.

El corazón del invento: predecir la siguiente palabra

Aquí viene lo que sorprende a casi todo el mundo. En el fondo, un LLM hace una sola cosa: predecir la siguiente palabra. Una y otra vez.

Imagina la frase:

El abogado presentó la demanda ante el ___

¿Qué palabra viene después? Probablemente “tribunal”. Quizá “juzgado”. Casi seguro no “plátano”. El modelo ha leído tal cantidad de texto que aprendió qué palabras tienden a seguir a cuáles, y a cada candidata le asigna una probabilidad: tribunal (85%), juzgado, juez… Elige una, la añade a la frase y repite el proceso para la siguiente. Así, palabra a palabra, construye párrafos enteros.

“Pero eso es como el autocompletado de mi teléfono”, pensarás. Exacto. Y a la vez, no. La diferencia es de escala:

Autocomplete del móvilLLM
Entrenado con…tus mensajesmiles de millones de documentos
Recuerda…~5 palabrascientos de miles de palabras
Genera…1 palabradocumentos completos

Es el mismo truco, adivinar lo que viene, llevado a una potencia que cambia su naturaleza.

¿Y cómo “recuerda” lo que le dije antes? La ventana de contexto

Si un LLM solo predice la siguiente palabra, ¿cómo mantiene una conversación coherente? Gracias a la ventana de contexto: el texto que el modelo tiene “a la vista” para hacer su predicción. Incluye tu pregunta, lo que ya respondió y las instrucciones previas.

Un detalle con consecuencias prácticas: cada vez que el modelo genera una palabra nueva, vuelve a leer todas las anteriores de la conversación. Por eso, cuanto más larga es la charla, más lento y costoso se vuelve responder. Y por eso, en conversaciones muy largas, los modelos a veces parecen “olvidar” lo que dijiste al principio: simplemente ya no cabe en su ventana.

Por qué esto le importa a un abogado (y a cualquiera)

Quédate con esta idea: un LLM no consulta una base de datos de verdades ni “sabe” derecho. Genera el texto más probable dado lo que le escribiste. La mayoría de las veces, lo más probable coincide con lo correcto. Pero no siempre. Y cuando no coincide, el modelo lo dirá con la misma seguridad impecable. A esa trampa (cuando la IA inventa con aplomo) la llamamos alucinación, y será el tema de un próximo artículo.


Este artículo adapta las primeras láminas de “Fundamentos Técnicos de IA para Abogados”, el material abierto que uso en los talleres de Trifolia. Puedes ver la presentación interactiva completa en educacion.trifolia.cl. Contenido bajo licencia CC BY-NC-SA 4.0.