Optimització de l’entrenament de càrrega de treball d’IA distribuïda en sistemes informàtics multinode

Optimització de l’entrenament de càrrega de treball d’IA distribuïda en sistemes informàtics multinode

Descripció

Els Large Language Models (LLMs) han demostrat capacitats remarcables en una àmplia varietat de tasques, fet que els situa com un focus central de la recerca actual en intel·ligència artificial. No obstant això, permetre que aquests models operin de manera eficient requereix recursos computacionals molt elevats i un temps d’execució considerable. Un dels principals reptes consisteix a determinar l’estratègia de paral·lelisme òptima per tal de maximitzar el rendiment. Aquest projecte té com a objectiu desenvolupar un marc capaç d’identificar la configuració de paral·lelisme més adequada per a un LLM concret. Mitjançant l’ús d’AstraSim i del seu generador sintètic de LLMs, el marc explora sistemàticament l’espai de cerca per recomanar els graus òptims de paral·lelisme de dades, de tensor, de seqüència i de pipeline. Per tal d’augmentar encara més la precisió de la simulació, el marc integra un model de xarxa optimitzat que té en compte els efectes de congestió i altres limitacions pròpies de la comunicació en entorns distribuïts. Els resultats d’aquest projecte aporten valor a diferents perfils professionals. D’una banda, els investigadors en intel·ligència artificial poden utilitzar-los per obtenir recomanacions sobre les estratègies de paral·lelisme més eficients per entrenar LLMs. D’altra banda, els enginyers de maquinari poden beneficiar-se d’informació sobre els compromisos de disseny i identificar possibles colls d’ampolla associats a diferents opcions arquitectòniques.

Context

En Sergi posseeix un B.Sc. en Intel·ligència Artificial per la Universitat Politècnica de Catalunya (UPC). Durant els seus estudis de grau, va completar un programa internacional d’intercanvi de sis mesos a la KU Leuven (Bèlgica), on es va integrar en el Màster Avançat en Intel·ligència Artificial, amb un enfocament en Enginyeria i Ciències de la Computació. La seva trajectòria professional combina l’aplicació industrial amb la recerca d’avantguarda. A Aquiles Solutions, va aplicar metodologies d’aprenentatge automàtic per resoldre problemes industrials complexos, centrant-se en la presa de decisions i l’optimització basada en dades. Al Barcelona Supercomputing Center, va treballar com a investigador en l’àmbit de la seguretat i la governança de la intel·ligència artificial, dedicant-se al desenvolupament i l’anàlisi de mètriques d’avaluació. La seva recerca es va centrar en millorar la transparència, la seguretat i els marcs de governança de models i conjunts de dades d’IA a gran escala. Finalment, a N3Cat (UPC), va dur a terme recerca per a la seva tesi de grau sobre l’optimització de compiladors de computació quàntica. En aquest projecte, va desenvolupar nous enfocaments per a l’assignació de qubits mitjançant Graph Neural Networks (GNNs) i Reinforcement Learning (RL) amb l’objectiu de millorar l’eficiència del maquinari.

Iniciativa

En Sergi constantment es desafia a sortir de la seva zona de confort per créixer tant personal com professionalment. Aquest projecte li ofereix l’oportunitat d’ “obrir el capó” dels sistemes d’IA, permetent-li establir un pont entre les aplicacions d’alt nivell i les optimitzacions de baix nivell que ha experimentat en projectes anteriors. Atès que els LLMs són actualment el principal motor de la indústria de la IA, millorar-ne l’eficiència i la viabilitat en entorns reals constitueix una prioritat global. Contribuir en aquest àmbit al costat dels investigadors de la UPC i de l’equip de Qualcomm representa  per a ell una oportunitat inestimable. Aprendre d’aquests líders de la indústria és un repte que afronta amb gran entusiasme.

Investigador/a de Suport a la Recerca

Sergi Tomàs Martínez

Grau i Màster en Intel·ligència Artificial

Organització

Supervisió

Sergi Abadal

Supervisor UPC

El contingut d'aquest lloc web reflecteix únicament els punts de vista del projecte Catedra Chip Chair UPC.

Marc de Recomanació Basat en Simulació per a l’Entrenament Escaçable d’IA Distribuïda

Tomàs Gadea Alcaide

Tomàs Gadea Alcaide

Investigador/a de Suport a la Recerca

Algorismes jeràrquics d’optimització de floorplanning per a arquitectures de Sistemes en Xip

Bernat Ibañez

Investigador/a de Suport a la Recerca

Encaminament Global d’Alta Predictibilitat durant el Floorplanning de Xips Complexos

Antoni Pech Alberich

Antoni Pech Alberich

Investigador/a de Suport a la Recerca

Tècniques d’Optimització Matemàtica per al Floorplanning Jeràrquic de Xips Complexos

Yilihamujiang Yimamu

Yilihamujiang Yimamu

Investigador/a Predoctoral

Optimització de l’Entrenament de Càrregues de Treball d’IA Distribuïdes en Sistemes de Computació Multi-node.

Xavier Querol Bassols

Xavier Querol Bassols

Investigador/a de Suport a la Recerca

Desenvolupament d’una Eina Gràfica Interactiva per a l’Optimització i Edició de Floorplanning en Disseny de Xips

Nuria Elizondo Cereza

Nuria Elizondo Cereza

Investigador/a de Suport a la Recerca

Optimització de l’Entrenament de Càrregues de Treball d’IA Distribuïdes en Sistemes de Computació Multi-node

Mohammad Nasser

Mohammad Nasser

Investigador/a Predoctoral

Desenvolupament d’Eines d’Optimització Matemàtica i Heurístiques per al Floorplanning de Xips

Guillem Pastor Rué

Guillem Pastor Rué

Investigador/a de Suport a la Recerca

Sidecar Project

Despertar vocacions científiques i tecnològiques a les escoles i instituts

Últimes notícies

Llegiu les darreres novetats en recerca i les nostres activitats

This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.