Talent Job Seeker

Offerta di lavoro per Speech Engineer – Deep Learning & NLP

About the position

Chi siamo:

Selefor è leader nella consulenza HR e nella trasformazione digitale. Promuoviamo l’innovazione attraverso progetti ad alto contenuto tecnologico e sosteniamo la crescita di aziende dinamiche e di professionisti/e. Per una realtà di eccellenza su Roma, cerchiamo una/un SPEECH AI Engineer – ASR & TTS Specialist esperta/o in tecnologie Vocali, Intelligenza Artificiale e Machine Learning.

Responsabilità Speech AI Engineer – Sviluppo Sistemi ASR & TTS, Innovazione Intelligenza Artificiale

  • Progettare, sviluppare e ottimizzare sistemi di Speech Recognition (ASR) e Text-to-Speech (TTS) basati su soluzioni AI/Machine Learning all’avanguardia.
  • Integrare tecnologie vocali nei prodotti digitali, collaborando con team di sviluppo software, data scientist, specialisti UX/UI e stakeholder aziendali.
  • Sperimentare modelli linguistici, reti neurali e framework deep learning per migliorare la qualità di trascrizione, sintesi vocale, multilingua e personalizzazione.
  • Contribuire alla ricerca su nuove architetture vocali e all’analisi di dataset audio, garantendo privacy, sicurezza e compliance normativa.
  • Partecipare all’implementazione di pipeline MLOps, continuous integration e testing per la messa in produzione di soluzioni vocali scalabili.
  • Monitorare i trend Speech AI (NLP, NLU, NLG) promuovendo innovazione tecnologica e aggiornamento costante del team.
  • Ruolo: Essenziale nello sviluppo di tecnologie speech-driven per soluzioni verticali, assistenti digitali, automazione contact center, healthcare e servizi di trascrizione intelligente.
  • Questa figura sarà cruciale per lo sviluppo e l'ottimizzazione dei modelli di riconoscimento vocale (ASR) e sintesi vocale (TTS) in autonomia e on-premise. Questo è un compito di ricerca e sviluppo avanzato che richiede profonda conoscenza del machine learning applicato alla voce. Gestirà anche la raccolta e l'etichettatura dei dati vocali.

Requisiti Speech AI Engineer – Competenze Tecniche ASR, TTS, Deep Learning e Machine Learning

  • Laurea in Informatica, Ingegneria Informatica, Matematica, Fisica, Linguistica Computazionale o discipline STEM affini.
  • Almeno 2 anni di esperienza nello sviluppo e deployment di sistemi di Speech Recognition (ASR) e Text-to-Speech (TTS) in ambito enterprise o research.
  • Solida conoscenza di almeno uno dei seguenti: Kaldi, ESPnet, Fairseq, Mozilla DeepSpeech, TensorFlow, PyTorch o TorchAudio.
  • Esperienza nell’ottimizzazione di modelli voice-to-text e text-to-speech per qualità, latenza, robustezza e multilingua.
  • Ottima padronanza di Python, scripting, data processing e librerie AI/ML (NumPy, pandas, scikit-learn, HuggingFace, spaCy).
  • Gestione pipeline di training, validazione, tuning e inferenza su dati audio, text e fonemi.
  • Familiarità con servizi Cloud AI (AWS, Azure Cognitive Services, Google Speech, IBM Watson) e deployment API RESTful.
  • Buona conoscenza della lingua italiana e inglese.
  • Attitudine al problem solving, team working, aggiornamento continuo, rispetto della diversità e delle differenze di background.
  • Competenze Chiave: Speech Recognition, Text-to-Speech, AI, NLP, Deep Learning, Python, Dataset Audio, MLOps, Cloud Speech API.
  • Competenze Chiave: Forte background in Machine Learning, Deep Learning, Natural Language Processing (NLP), elaborazione del segnale vocale, conoscenza di framework come TensorFlow/PyTorch, familiarità con librerie di ASR/TTS (es. Kaldi, Wav2Vec) e tecniche avanzate per i LLM. La programmazione in Python è essenziale. Richiesta esperienza con GPU computing

Competenze Gradite Speech AI – NLP, NLU, Pipeline Audio, Open Source

  • Conoscenza avanzata di modelli NLP/NLU (BERT, Wav2Vec, Whisper, Transformer based), dialog systems e voicebots.
  • Esperienza con dataset multilingua, annotazione fonetica, feature extraction, metriche di valutazione (WER, MOS, intelligibilità).
  • Integrazione di sistemi vocali con piattaforme IoT, web e mobile.
  • Partecipazione a progetti open source, challenge o community speech tech.
  • Certificazioni professionali su AI, cloud o machine learning.
Offerta Speech AI Engineer – Contratto, Remote Working, Crescita, Inclusione
  • Contratto a tempo determinato/indeterminato con RAL commisurata all’esperienza.
  • Ambiente digital-first, inclusivo, con team multidisciplinari e orientato a innovazione e crescita professionale.
  • Sede a Roma e possibilità di smart working parziale.
  • Formazione avanzata, mentoring, supporto a ricerca/innovazione e partecipazione a eventi AI internazionali.
  • Benefit aziendali e attenzione al work-life balance.
Candidatura Speech AI – Diversità, Inclusione e Pari Opportunità

Invia il tuo CV aggiornato e una lettera motivazionale che evidenzi progetti speech AI sviluppati, tecnologie vocali utilizzate e la tua visione sull’evoluzione delle soluzioni ASR/TTS.
La selezione è aperta a tutte le persone, in conformità ai principi di pari opportunità, inclusione e valorizzazione della diversità, senza discriminazione di genere, età, orientamento, etnia, background o esperienza, nel rispetto delle normative vigenti (leggi 903/77, 125/91, D.Lgs 215/03, 216/03).

Place of work

Talent Job Seeker
Rome
app.general.countries.Italy

About the company

Identifica el mejor Talento con Talent Job Seeker

Relevant places near

  • Rome
  • Acilia-Castel Fusano-Ostia Antica
  • Ciampino
  • Casal Palocco
  • Casal de' Pazzi
  • Tor Lupara
  • Giardinetti-Tor Vergata
  • Frascati
  • Grottaferrata
  • Casal Bertone



Job ID: 9682984 / Ref: 43b96745475d65772cf0c37cabcf581e

Open application open_in_new

Talent Job Seeker

Employees
51-200
Industry
Personnel Services