Stanford CS229 | Building Large Language Models

«So, let’s get started. I’ll be talking about building LLMs today…»

Así comienza la clase impartida por Yann Dubois en el curso CS229: Machine Learning de Stanford, durante el verano de 2024.

El seminario ofrece una visión clara y detallada sobre cómo construir un modelo similar a ChatGPT, cubriendo tanto la fase de preentrenamiento como la de post-entrenamiento (SFT/RLHF). En cada sección, se analizan las prácticas más comunes en la recolección de datos, los algoritmos utilizados y los métodos de evaluación.

Esta clase pertenece al programa de inteligencia artificial de Stanford:

👉 https://stanford.io/ai

📝 ¡A preparar un bloc de notas, lápiz, café y a disfrutar!