Senior Search Applications Performance Engineer
CohereUn ruolo nel team Compass dedicato all'ottimizzazione e allo scaling delle applicazioni di ricerca e dell'infrastruttura sottostante, all'incrocio tra search technology e performance engineering.
Ruolo
Implementerai strategie di monitoraggio e ottimizzazione delle performance per i servizi di Compass e per la loro integrazione con North. Svilupperai e manterrai framework di benchmarking per valutare la qualità dei modelli di ricerca e l'efficienza dell'infrastruttura, collaborando con i modeling team per ridurre i tempi di risposta e il consumo di risorse. Ti occuperai di scalare i servizi mantenendo alta disponibilità e bassa latenza, traducendo i requisiti dei team di prodotto in implementazioni tecniche e progettando nuove superfici di tool per esperienze di ricerca agentica.
Tecnologie
Python e tecnologie di backend search come OpenSearch, ElasticSearch, Weaviate e FastAPI; pipeline di dati e valutazione, profiling di applicazioni su CPU, GPU e nodi autoscalati. Sono apprezzati Kubernetes, Helm, ottimizzazione di inferenza su GPU con ONNX, Triton, vLLM, oltre a esperienza nel dominio search and discovery. Richiesti almeno 4 anni di esperienza in produzione.
Condividi annuncio
Informazioni su Cohere
Cohere è un'azienda globale di AI per le imprese, con sede principale a Toronto e San Francisco e uffici a Londra, New York, Montreal, Parigi, Seoul e in Germania. Sviluppa modelli di base e prodotti end-to-end pensati per risolvere problemi concreti delle aziende, con un approccio in cui sicurezza e privacy dei dati sono al centro di ogni scelta progettuale. Tra i suoi prodotti spicca North, una piattaforma di AI workspace per le imprese che permette di integrare agenti intelligenti nei flussi di lavoro mantenendo il pieno controllo sui dati sensibili.
Il team riunisce ricercatori, ingegneri, designer e altre figure tecniche che collaborano per spingere lo stato dell'arte dei modelli linguistici e agentici, sia attraverso lo sviluppo di prodotto sia tramite Cohere Labs, il braccio di ricerca dedicato all'avanzamento del machine learning e del natural language processing. L'azienda investe molto nella formazione, nella diversità delle prospettive e in un ambiente di lavoro distribuito, offrendo benefit pensati per chi lavora da remoto e cura particolare per il benessere delle persone.
