CESyA desarrolla Mercurio – HG para mejorar el subtitulado automático como servicio de accesibilidad a eventos para el público sordo

  • Mercurio – HG supone una nueva versión resultado de la aplicación de la Inteligencia Artificial para mejorar la calidad del subtitulado automático. 
  • El software transcribe en tiempo real el audio de sala y micrófonos para su proyección como subtítulos en todo tipo de pantallas y dispositivos. 
  • A partir de la IA se han incluido mejoras en gramática, puntuación y división en líneas de subtítulo.
  • El subtitulado automático permite que las personas sordas o con discapacidad auditiva puedan acceder a todo tipo de eventos en directo.

Madrid, 4 de diciembre de 2024. El Centro Español del Subtitulado y la Audiodescripción (CESyA), centro asesor del Real Patronato sobre Discapacidad del Ministerio de Derechos Sociales, Consumo y Agenda 2030, gestionado por la Universidad Carlos III de Madrid, ha aplicado técnicas de Inteligencia Artificial (IA) a su herramienta tecnológica de subtitulado automático para mejorar la calidad de este servicio, que permite que las personas sordas o con discapacidad auditiva puedan acceder a todo tipo de eventos en directo, como reuniones, congresos, formaciones, conciertos y demás espectáculos culturales. 

El resultado de esta innovación es el denominado Mercurio – HG, un software capaz de captar el audio de espacios y micrófonos para generar una transcripción automática en líneas de subtítulos y lanzarlos a pantallas de sala o a dispositivos personales, como smartphones, ordenadores o tablets, con el objetivo de que el público sordo o con discapacidad auditiva pueda seguir el discurso del evento. 

El subtitulado adaptado comprende una normativa específica (UNE 153010) que exige determinados indicadores de calidad, como el número de caracteres por segundo y línea, el tiempo de exposición en pantalla o la sincronización con el audio, entre otros, por lo que las herramientas dedicadas al subtitulado deben perfeccionarse para cumplirlos. Por este motivo, CESyA ha recurrido a la IA con el objetivo de incorporar a las transcripciones nuevas mejoras que se adecúen aún más a la norma. 

Apuesta por la calidad

El trabajo de los profesionales en subtitulado es indispensable para ofrecer un servicio de calidad en los contenidos audiovisuales. Esta labor requiere una formación específica y un significativo tiempo de trabajo para la generación de contenidos audiovisuales accesibles y de calidad. Dicha actividad resulta imprescindible para la elaboración de materiales en diferido, como películas o cualquier contenido pregrabado cuya proyección se realiza a posteriori. Sin embargo, para aquellas situaciones en que se requiere de accesibilidad en tiempo real es necesario recurrir al apoyo de tecnologías automatizadas que eviten los retardos y se sincronicen con las voces y el audio en la mayor medida de lo posible.

En base ello, CESyA desarrolló su herramienta Mercurio, la cual ha sido actualizada a partir de la aplicación de técnicas de IA para generar la versión Mercurio – HG e incluir indicadores de calidad a los subtítulos que, hasta ahora, solo eran posibles mediante horas de trabajo previo. En este sentido, Mercurio – HG ofrece una mejora en el reconocimiento de voz, aportando transcripciones más precisas. Además, ha mejorado la gramática y añadido el sistema de puntuación, de tal modo que es capaz de identificar las pausas de los discursos e incorporar puntos y comas. Asimismo, se ha incluido la doble línea de subtítulo, tal y como dicta la normativa, mejorando también la correcta segmentación para evitar cortes o saltos de línea en los sintagmas y en los verbos copulativos. 

En cuanto al manejo interno, Mercurio – HG ha simplificado su uso técnico, permitiendo la creación de sesiones individuales para cada evento específico, incorporando una interfaz más intuitiva y ofreciendo la opción de elegir entre diferentes motores externos de transcripción, como pueden ser los correspondientes a Google, Amazon o Microsoft. 

Esquema del funcionamiento de Mercurio - HG. El técnico recoge el audio con el programa, se transcribe automáticamente, se añade sistema de puntuación mediante IA, convierte la transcripción en subtítulos con puntuación y ortografía y se lanza a pantallas y dispositivos.

Soporte para la difusión social

Mercurio surgió para dar solución a una importante necesidad de las personas sordas o con discapacidad auditiva: la accesibilidad a la información. Con el objetivo de asegurar este derecho, CESyA diseñó y desarrolló esta herramienta tecnológica que ha permitido llevar a cabo de manera accesible sus reuniones internas, congresos y jornadas de difusión social.  

Además, como centro asesor, CESyA ha empleado Mercurio en los eventos organizados por el Real Patronato sobre Discapacidad, así como por el Ministerio de Derechos Sociales, Consumo y Agenda 2030, especialmente en aquellos dedicados a las personas con discapacidad, pero también a otros muchos centrados en diferentes ámbitos sociales, como la perspectiva de género, el colectivo LGTBIQ+, las personas mayores, infancia y juventud, los cuidados personales, la salud mental o el sinhogarismo, entre otros. 

Según ha indicado el director gerente de CESyA, Israel González Carrasco, “Mercurio – HG ha sido uno de los proyectos prioritarios del centro dada la misión para la que fue creado, que no es otra que la de reforzar los derechos de acceso de las personas sordas o con discapacidad auditiva a la información y, por ende, a la educación, a la cultura y a tantos otros ámbitos que requieren de servicios en tiempo real”. Por su parte, el responsable técnico del proyecto, José Luis López Cuadrado, ha asegurado que “actualmente continuamos investigando y trabajando en la herramienta para ajustar aún más su precisión e incorporar otros idiomas”. 

Información anexa: infografía accesible [PDF] 

Ir al contenido