retinosis.org

la rp en español

Buscar en el sitio principal de retinosis.org



Secciones en el sitio principal de retinosis.org




24 horas con el transcriptor instantáneo de Google
martes, 7 de enero de 2020

La aplicación Transcripción instantánea de Google pretende sortear lo tedioso que resulta convertir nuestras conversaciones en texto.
A continuación os dejamos un análisis publicado sobre el funcionamiento del Transcriptor instantáneo de Google.

esquema_funcionamiento_transcriptor_google

 

Por la mañana

El mecanismo es muy sencillo: solo con acceder a ella ya se inicia la transcripción. Aplicamos el transcriptor a la televisión. Subimos el volumen. Lo primero que observamos es que es más rápido y fiable que la caótica transcriptora que incorporan las televisiones. También, y esto es un gran punto a su favor, tiene una ortografía francamente mejor, con acentuación de pronombres incluida.

A mediodía

Salimos a la calle a probarlo. He aquí una de las funciones más interesantes del transcriptor: resulta sorprendente su capacidad para identificar todo tipo de sonidos más allá del lenguaje verbal. En Google lo llaman sound events, acontecimientos sonoros. En la calle nos aparecerá “claxon”, “multitud” o “viento”. También reconoce ladridos de perros o vehículos en movimiento (aunque no distingue entre un coche y un vagón de metro).

Le cuesta diferenciar el sonido de un bar del de la multitud, pero sí produce situaciones paradójicas. A un servidor, que es un manazas, se le cayó el móvil y el transcriptor lo tradujo como “golpe en la puerta”. Pero la aplicación tiene un problema: precisa de wifi para funcionar correctamente.

Tarde

Es de suponer que la inteligencia artificial detrás de la aplicación funciona mejor con el inglés, por cuestiones sintácticas y porque la lingüística computacional está más desarrollada en el mundo anglosajón. En español, por ejemplo, cuesta reconocer la intención enunciadora de las frases, sobre todo cuando se trata de preguntas. La aplicación funciona con 70 lenguas y se puede elegir un idioma principal y otro secundario.

Interfaz

La interfaz es muy simple y muy limpia: solo con acceder a ella ya se inicia la transcripción. Se puede controlar tanto el tamaño de la letra como el fondo. Por defecto transcribe en blanco sobre negro, un poco cansado para la vista, siendo preferible el negro sobre blanco de toda la vida. Un circulito azul en la esquina te marca la potencia del sonido que recibe el micrófono, de manera que puedas acercarlo más a la fuente. Un botón te permite hacer anotaciones.

Almacenaje y privacidad

Cada vez que se usa te marca la hora a la que se inicia la transcripción, que se archivará durante un máximo de 72 horas. Por esta razón no se informa del día en el que se produce la grabación. En teoría, ese almacenaje tan breve se debe a que Google quiere demostrar que no busca usar los datos transcritos en sus algoritmos. Asimismo, se pueden eliminar todos los archivos de manera automática siempre que se desee.

Veredicto

Es, sin duda, una gran ayuda para las personas con dificultades auditivas que mejora en mucho los transcriptores a los que estamos acostumbrados, como pueden ser los de la televisión. Sin embargo, presenta problemas para el público sin dificultades auditivas: el principal es la necesidad de tener wifi para que funcione correctamente; uno secundario —aunque no menor— es el no poder exportar directamente las transcripciones.

Este es el enlace a la noticia original.

Deja tu comentario