{rfName}
To

Indexat a

Llicència i ús

Citacions

Altmetrics

Anàlisi d'autories institucional

Iranzo-Sánchez, JAutor o coautorJorge, JAutor o coautorSilvestre-Cerdà, JaAutor o coautorCivera, JAutor o coautorSanchis, AAutor o coautorJuan, AAutor o coautor
Compartir
Publicacions
>
Conferència publicada

Towards simultaneous machine interpretation

Publicat a:19th Annual Conference Of The International Speech Communication Association (Interspeech 2018), Vols 1-6. 5 2277-2281 - 2021-01-01 5(), DOI: 10.21437/Interspeech.2021-201

Autors: Perez-Gonzalez-de-Martos, Alejandro; Iranzo-Sanchez, Javier; Gimenez Pastor, Adria; Jorge, Javier; Silvestre-Cerda, Joan-Albert; Civera, Jorge; Sanchis, Albert; Juan, Alfons

Afiliacions

Univ Politecn Valencia, Valencian Res Inst Artificial Intelligence VRAIN, Machine Learning & Language Proc MLLP Res Grp - Autor o coautor

Resum

Automatic speech-to-speech translation (S2S) is one of the most challenging speech and language processing tasks, especially when considering its application to real-time settings. Recent advances on streaming Automatic Speech Recognition (ASR), simultaneous Machine Translation (MT) and incremental neural Text-To-Speech (TTS) make it possible to develop real-time cascade S2S systems with greatly improved accuracy. On the way to simultaneous machine interpretation, a state-of-the-art cascade streaming S2S system is described and empirically assessed in the simultaneous interpretation of European Parliament debates. We pay particular attention to the TTS component, particularly in terms of speech naturalness under a variety of response-time settings, as well as in terms of speaker similarity for its cross-lingual voice cloning capabilities.

Paraules clau
Automatic speechCharacter recognitionCloningComputer aided language translationCross-lingualCross-lingual voice cloningIncremental text-to-speechIts applicationsLanguage processingLstmMachine interpretationModelsNetworkOne-pass decoderReal time systemsSimultaneous machine interpretationSpeechSpeech communicationSpeech recognitionSpeech transmissionSpeech-to-speech translationText to speechTo-speech translation

Indicis de qualitat

Impacte i visibilitat social

Des de la dimensió d'influència o adopció social, i prenent com a base les mètriques associades a les mencions i interaccions proporcionades per agències especialitzades en el càlcul de les denominades "Mètriques Alternatives o Socials", podem destacar a data 2025-05-13:

  • L'ús d'aquesta aportació en marcadors, bifurcacions de codi, afegits a llistes de favorits per a una lectura recurrent, així com visualitzacions generals, indica que algú està fent servir la publicació com a base del seu treball actual. Això pot ser un indicador destacat de futures cites més formals i acadèmiques. Aquesta afirmació està avalada pel resultat de l'indicador "Capture", que aporta un total de: 15 (PlumX).
Anàlisi del lideratge dels autors institucionals

Hi ha un lideratge significatiu, ja que alguns dels autors pertanyents a la institució apareixen com a primer o últim signant, es pot apreciar en el detall: Primer Autor (Pérez-González-de-Martos, A) i Últim Autor (Juan Císcar, Alfonso).

l'autor responsable d'establir les tasques de correspondència ha estat Pérez-González-de-Martos, A.