Data/Infrastructure Advocare Engineer

Hugging Face

Hugging Face cerca il primo Data/Infrastructure Advocate Engineer, una figura ibrida tra engineering e community advocacy focalizzata sull'ecosistema dati della piattaforma. Il ruolo è centrato su Xet, il sistema di storage del Hugging Face Hub per dataset di grandi dimensioni.

Ruolo
Far crescere la community open source attorno all'infrastruttura dati (Apache Parquet, Open Table Formats, data engineering), promuovere il Hugging Face Hub come piattaforma di riferimento per storage, versioning e collaborazione su dataset, creare demo, benchmark, notebook, tutorial, blog post e video su temi come deduplicazione, compressione, Parquet editing e ottimizzazione dello storage. Presenza attiva su Discord, GitHub e forum di comunità. Collaborazione interna con i team Datasets, Hub e Infrastructure.

Tecnologie
Python, pandas, pyarrow, libreria huggingface/datasets, Parquet, Open Table Formats (Delta Lake, Iceberg e simili), S3, Xet. Dimestichezza con storage optimization e dataset versioning su larga scala.

Condividi annuncio

Informazioni su Hugging Face

Hugging Face è la piattaforma di riferimento per la comunità mondiale del machine learning: il "GitHub dell'AI". Fondata nel 2016 da Clément Delangue, Julien Chaumond e Thomas Wolf - partita come chatbot per teenager, poi diventata la principale infrastruttura open source per modelli, dataset e applicazioni ML.

Oggi ospita oltre 2 milioni di modelli, 500.000 dataset e 1 milione di Spaces, con più di 50.000 organizzazioni attive sulla piattaforma tra cui Google, Meta, Microsoft, Amazon e Nvidia. Nel 2023 ha chiuso un Series D da 235 milioni di dollari a una valutazione di 4,5 miliardi, con partecipazione di Google, Amazon, Nvidia, Intel, AMD, IBM, Qualcomm e Salesforce. Il team conta circa 600-700 persone ed è distribuito globalmente.

Visita il sito web →