Member of Engineering (Reinforcement Learning) - Poolside

Un opportunità per ricercatori e ingegneri che vogliono spingere le frontiere delle capacità di ragionamento e generazione di codice dei Large Language Model tramite Reinforcement Learning, con accesso a migliaia di GPU.

Ruolo
Entrando nel team di Reinforcement Learning avrai responsabilità end-to-end: dalla ricerca di nuovi algoritmi di exploration e training, alla progettazione e scaling di ambienti RL, fino all'implementazione lungo l'intero stack. Gestirai il ciclo completo degli esperimenti, manterrai un aggiornamento continuo sulla ricerca più recente in LLM, RL e generazione di codice, e tradurrai idee di ricerca in codebase pulite e riutilizzabili su cui il resto del team potrà costruire. Progetterai e itererai su pipeline di data generation e training dei modelli, implementerai pipeline RL scalabili su domini multipli e diagnosticherai instabilità e failure dei training run proponendo metodi di mitigazione.

Tecnologie
Python, PyTorch o JAX, training distribuito su larga scala. Solida comprensione dell'architettura Transformer e delle scaling law. Tecniche di mid-training e post-training, algoritmi moderni di Reinforcement Learning, esperienza con modelli di ragionamento e agentici.

Informazioni su Poolside

Poolside è un'azienda AI con sede negli Stati Uniti e team distribuito tra Europa e Nord America, fondata con la missione di raggiungere l'Intelligenza Artificiale Generale accelerando lo sviluppo software. La loro convinzione di fondo è che il percorso più rapido verso l'AGI passi attraverso il reshaping radicale dell'esperienza degli sviluppatori: sistemi agentici, coding assistant avanzati e modelli frontier in grado di amplificare ogni fase del processo di sviluppo. I prodotti Poolside vengono distribuiti direttamente negli ambienti di sviluppo di imprese enterprise con elevati standard di sicurezza, unendo potenza dei modelli e integrazione profonda negli strumenti già in uso dai team engineering.

Il team è composto da un mix multidisciplinare di ricercatori, ingegneri e professionisti del business, accomunati da una profonda cura per ciò che costruiscono insieme. Con accesso a migliaia di GPU e un approccio rigoroso alla ricerca applicata - dall'addestramento di modelli di ragionamento avanzati al reinforcement learning su larga scala - Poolside punta a essere una delle poche aziende capaci di trainare la corsa verso l'AGI. La cultura interna valorizza la curiosità intellettuale, la collaborazione autentica e la spinta costante a migliorare, con momenti di incontro mensili a Parigi e offsite annuali per rafforzare la coesione di un team che lavora in modo distribuito.

Visita il sito web →