Mohammad Nasser
Enginyeria Informàtica i Màster en Arquitectura de Computadors, actualment candidat a doctorat
Aquest projecte aborda la necessitat de gestionar els immensos recursos computacionals requerits pels Models de Llenguatge de Gran Escala (LLMs). L'objectiu central és desenvolupar un entorn de treball (framework) que identifiqui la configuració de paral·lelisme més adequada per maximitzar el rendiment de l'entrenament. Mitjançant l'ús de l'eina AstraSim i el seu generador sintètic d'LLMs, la recerca explora l'espai de cerca per recomanar graus òptims de paral·lelisme de dades, tensor, seqüència i canonada (pipeline). Per augmentar la fidelitat de la simulació, el sistema integra un model de xarxa optimitzat que comptabilitza els efectes de la congestió, proporcionant dades crítiques sobre colls d'ampolla i compromisos de disseny (trade-offs) per a investigadors d'IA i enginyers de hardware.
Mohammad Nasser
Enginyeria Informàtica i Màster en Arquitectura de Computadors, actualment candidat a doctorat
Organització
Supervisió
Sergi Abadal Cavalle
Supervisor UPC
El contingut d'aquest lloc web reflecteix únicament els punts de vista del projecte Catedra Chip Chair UPC.
Sergi Tomas Martinez
Investigador/a de Suport a la Recerca
Tomas Gadea Alcaide
Investigador/a de Suport a la Recerca
Bernat Ibañez
Investigador/a de Suport a la Recerca
Antoni Pech Alberich
Investigador/a de Suport a la Recerca
Yilihamujiang Yimamu
Investigador/a Predoctoral
Xavier Querol Bassols
Investigador/a de Suport a la Recerca
Nuria Elizondo Cereza
Investigador/a de Suport a la Recerca
Guillem Pastor Rué
Investigador/a de Suport a la Recerca