{rfName}
To

Indexado en

Licencia y uso

Citaciones

Altmetrics

Análisis de autorías institucional

Iranzo-Sánchez, JAutor o CoautorJorge, JAutor o CoautorSilvestre-Cerdà, JaAutor o CoautorCivera, JAutor o CoautorSanchis, AAutor o CoautorJuan, AAutor o Coautor
Compartir
Publicaciones
>
Conferencia Publicada

Towards simultaneous machine interpretation

Publicado en:19th Annual Conference Of The International Speech Communication Association (Interspeech 2018), Vols 1-6. 5 2277-2281 - 2021-01-01 5(), DOI: 10.21437/Interspeech.2021-201

Autores: Perez-Gonzalez-de-Martos, Alejandro; Iranzo-Sanchez, Javier; Gimenez Pastor, Adria; Jorge, Javier; Silvestre-Cerda, Joan-Albert; Civera, Jorge; Sanchis, Albert; Juan, Alfons

Afiliaciones

Univ Politecn Valencia, Valencian Res Inst Artificial Intelligence VRAIN, Machine Learning & Language Proc MLLP Res Grp - Autor o Coautor

Resumen

Automatic speech-to-speech translation (S2S) is one of the most challenging speech and language processing tasks, especially when considering its application to real-time settings. Recent advances on streaming Automatic Speech Recognition (ASR), simultaneous Machine Translation (MT) and incremental neural Text-To-Speech (TTS) make it possible to develop real-time cascade S2S systems with greatly improved accuracy. On the way to simultaneous machine interpretation, a state-of-the-art cascade streaming S2S system is described and empirically assessed in the simultaneous interpretation of European Parliament debates. We pay particular attention to the TTS component, particularly in terms of speech naturalness under a variety of response-time settings, as well as in terms of speaker similarity for its cross-lingual voice cloning capabilities.

Palabras clave
Automatic speechCharacter recognitionCloningComputer aided language translationCross-lingualCross-lingual voice cloningIncremental text-to-speechIts applicationsLanguage processingLstmMachine interpretationModelsNetworkOne-pass decoderReal time systemsSimultaneous machine interpretationSpeechSpeech communicationSpeech recognitionSpeech transmissionSpeech-to-speech translationText to speechTo-speech translation

Indicios de calidad

Impacto y visibilidad social

Desde la dimensión de Influencia o adopción social, y tomando como base las métricas asociadas a las menciones e interacciones proporcionadas por agencias especializadas en el cálculo de las denominadas “Métricas Alternativas o Sociales”, podemos destacar a fecha 2025-05-13:

  • La utilización de esta aportación en marcadores, bifurcaciones de código, añadidos a listas de favoritos para una lectura recurrente, así como visualizaciones generales, indica que alguien está usando la publicación como base de su trabajo actual. Esto puede ser un indicador destacado de futuras citas más formales y académicas. Tal afirmación es avalada por el resultado del indicador “Capture” que arroja un total de: 15 (PlumX).
Análisis de liderazgo de los autores institucionales

Existe un liderazgo significativo ya que algunos de los autores pertenecientes a la institución aparecen como primer o último firmante, se puede apreciar en el detalle: Primer Autor (Pérez-González-de-Martos, A) y Último Autor (Juan Císcar, Alfonso).

el autor responsable de establecer las labores de correspondencia ha sido Pérez-González-de-Martos, A.