Available courses

Los Grandes Modelos de Lenguajes (LLMs por sus siglas en ingl茅s) han revolucionado la industria y lo seguir谩n haciendo durante los pr贸ximos a帽os. Si bien su impacto todav铆a no puede medirse a ciencia cierta, ya nadie duda que la aparici贸n de ChatGPT marc贸 un antes y un despu茅s y gracias a esto, la Inteligencia Artificial como campo de estudio est谩 viviendo una tercera primavera.
Entender como funcionan estos modelos sin embargo ya no es cosa solamente de los especialistas en IA sino de todo inform谩tico que se precie. Muchas de las decisiones profesionales pasar谩n por saber si tal o cual modelo sirve para solucionar el problema o no, por saber cuales son las fortalezas y debilidades de cada arquitectura o por entender la forma en la cual estos modelos funcionan.
En este curso te mostramos todo esto de la forma m谩s pr谩ctica posible, gui谩ndote en la implementaci贸n de tu propio ChatGPT.

A partir de 2014 comenzaron a aparecer arquitecturas de modelos de redes neuronales con cientos de capas ocultas. Entrenar este tipo de modelos solo es posibles mediante la aparici贸n de t茅cnicas de normalizaci贸n y algoritmos m谩s robustos que el descenso por gradientes, que minimizan el impacto del los fen贸menos conocidos como explosi贸n y desvanecimiento de los gradientes. Este es el l铆mite entre las redes neuronales tradicionales y lo que posteriormente pas贸 a llamarse Deep Learning. Este curso explora los fundamentos de estos modelos y las t茅cnicas que los hacen posibles, siempre en el 谩mbito de los modelos de lenguajes generativos.

Los modelos de lenguajes generativos modernos est谩n implementados usando Redes Neuronales Profundas. Estas redes tienen pesos o par谩metros que se aprenden durante el entrenamiento y los LLMs modernos tienen de cientos a miles de millones de par谩metros. Este curso te ense帽a los principales fundamentos de las redes neuronales, desde el perceptr贸n hasta la construcci贸n de tu primera red neuronal en Python y aplica estos conocimientos para programar tu primer modelo de lenguajes para generar texto basado en bi-gramas.

Este curso est谩 enfocado en explicar de manera clara y concisa c贸mo funcionan los grandes modelos de lenguaje (LLM) a partir de su dise帽o y arquitectura.聽

Te ense帽aremos desde cero c贸mo funcionan estas tecnolog铆as, explorando su dise帽o, arquitectura y las diferencias clave entre modelos como ChatGPT, Llama, BERT y DeepSeek.