En una entrevista reciente, el periodista colombiano Guillermo Romero Salamanca le preguntaba a Armando Plata Camacho si, hoy en día, aún son necesarios los locutores. Plata, hombre de radio, locutor, voice-over y hombre de gran experiencia en los medios, respondió:
“Por ahora creo que sí. Las voces seguirán en los medios por algunos años más. Son parte del modelo actual. A mediano y largo plazo desaparecerá la profesión de locutor y será reemplazada por voces generadas por computador.
“Hay quienes dicen que los sentimientos son solo de los humanos. La mala noticia es que con el desarrollo del ‘learning machine’ los analistas de data alimentarán las máquinas con todo tipo de sentimientos y emociones. Sin embargo, solo un grupo pequeño de talentos se mantendrán vigentes”.
A quienes amamos la radio y la locución, estas palabras nos suenan muy desalentadoras, especialmente viniendo de alguien que tanto conoce nuestra profesión y que ha vivido su desarrollo durante los últimos 50 años.
¿Pero tiene razón? ¿Realmente la voz humana podrá ser reemplazada por voces sintetizadas en el futuro?
CÓMO LA TECNOLOGÍA ESTÁ REEMPLAZANDO LA VOZ HUMANA
La tecnología ha experimentado un enorme avance en la última década y actualmente cuenta con nuevas opciones, como aprendizaje automático, inteligencia artificial, tecnología de Texto-a-Voz (TTS), reconocimiento de voz, robótica, etc.
Todo esto hace que nos preguntemos hasta dónde todo este campo de la inteligencia artificial podrá ser aceptado por la raza humana.
En una entrevista con el Australian Financial Review, Steve Wozniak, cofundador de Apple con Steve Jobs, advirtió que «las computadoras van a tomar el control de los humanos, sin duda» y continúa diciendo que «y tal como Stephen Hawking y Elon Musk lo han predicho, estoy de acuerdo en que el futuro da miedo y es muy malo para la gente”.
Por otro lado, un artículo de NBC Noticias titulado “Nueve trabajos que los humanos pueden perder ante los robots” informó que los robots actualmente están analizando documentos, prescribiendo recetas médicas y manejando otras tareas que alguna vez fueron realizadas exclusivamente por humanos.
Estos incluyen a empleados farmacéuticos, abogados y asistentes legales, conductores, astronautas, empleados de tiendas, soldados, niñeras, rescatadores, periodistas deportivos y reporteros en otras áreas.
Pero el ejemplo más claro y sorprendente, tal vez, es el de algunas películas animadas como “Frozen”, “Shrek”, “The Lion King” o la serie “Toy Story”, que han utilizado una sofisticada técnica de animación digital llamada «captura de movimiento«, más popularmente conocida como Mocap.
Y aunque las voces de estos personajes digitales han sido interpretadas por actores de voz humanos, algunas agencias de publicidad, compañías de producción y otras compañías industriales, como los fabricantes de teléfonos móviles, han usado voces digitales para «hablar» a sus clientes o usuarios a través de la tecnología de Texto-a-Voz (Text-to-Speech o TTS).
De hecho, hoy en días es posible escuchar a Armando Plata en diferentes sitios de internet que usan esta tecnología, algo de lo que no se siente particularmente orgulloso porque, según me confesó en una charla, nunca se sabe para qué van a usar su voz.
Un ejemplo de ella se puede escuchar al leer, de forma totalmente automática, una noticia del portal de noticias Pulzo.com. Para escuchar cómo suena su voz sintetizada, dé clic en este enlace: https://d2yoo3qu6vrk5d.cloudfront.net/pulzo-lite/audios/PP827130.mp3
Armando Plata no leyó ese texto. Lo hizo el software de TTS que se encarga de encadenar las letras, sonidos y fonemas grabados en su voz y convertirlos en palabras, en un proceso totalmente digital.
Las tendencias de inteligencia artificial y tecnología digital en realidad pueden representar una gran amenaza para los humanos.
Es posible que dentro de no mucho tiempo podamos encontrar que la fuerza laboral esté dominada por robots y las películas sean interpretadas por actores digitales con voces sintetizadas.
Esto es algo que nos puede atemorizar, y es posible que suceda, pero no todo son malas noticias.
LAS BUENAS NOTICIAS
Rick Robinson, director de TI para Smart Data and Technology de Amey, una de las compañías de servicios de ingeniería e infraestructura más grandes del Reino Unido, dijo en una entrevista del portal The Urban Technologist:
«Estoy convencido de que la generación actual de Inteligencia Artificial basada en tecnologías digitales no recreará nada que reconozcamos como vida consciente y de libre albedrío o cualquier cosa remotamente capaz de comprender los valores humanos o hacer juicios en los que se pueda confiar para que sean consistentes con ellos”.
Además afirmó que «creo que cuando la mayoría de la gente piensa en qué es lo que nos define como humanos, como seres vivos, pensamos que es algo que va más allá”.
“No solo la inteligencia necesaria para tomar decisiones basadas en el conocimiento frente a un conjunto de criterios y objetivos, sino la voluntad y la capacidad de elegir esos criterios y objetivos basados en un sentido de valores aprendidos a través de la experiencia y de la empatía que surge de los valores y experiencias compartidas”.
Robinson también cree que “el mundo humano y las cosas que nos importan no pueden describirse completamente utilizando combinaciones lógicas de programas y datos de computador«.
Por eso concluye que “la tecnología digital no puede reemplazar completamente a los trabajadores humanos en nuestra economía; solo nos puede complementar”.
APLIQUEMOS ESTOS CONCEPTOS EN LA RADIO
Si traemos estos conceptos a la radio, veremos que será muy difícil que una voz sintetizada o un robot realmente sean capaces de mantener una conversación cálida, amable, humorística, picante o retadora con un oyente.
Las conversaciones fluyen de manera natural, y cada parte de la conversación responde acorde a lo que replica la otra persona.
Por ejemplo, es posible que ante una pregunta seria el interlocutor responda con un chiste, o que use esa pregunta para hacer una burla o compararla con un hecho reciente, algo que vio en la televisión o una frase memorable de algún personaje.
Cuando alguien hable de que su hijo está enfermo, más allá de una receta o un diagnóstico lo que se espera es que el locutor muestre su empatía con la persona que sufre el problema, algo muy complicado para una máquina.
Ed Leonard, Jefe de Tecnología de DreamWorks, le dijo a la BBC que no ven el Mocap como una amenaza para el oficio del actor.
«Si usted quisiera recrear y hacer que un actor sea fotorrealista digitalmente, tenemos la tecnología para hacerlo, pero esto nunca reemplazará a los actores. Eso no tiene ningún sentido. El talento es la expresión en esa actuación».
Y continúa diciendo que «en general, los resultados de captura de movimiento simplemente no son lo suficientemente buenos y lo que se busca es expresividad, no una traducción literal. Hemos avanzado bastante, pero para usarla en películas animadas, no es lo que estamos buscando«.
Del mismo modo, la tecnología actual no ha llegado al punto en que pueda replicar exactamente las voces humanas. Si bien ha habido una gran mejora con respecto a las voces robóticas, las voces generadas por computador aún están muy lejos de las voces humanas.
CONCLUSIÓN
Cada vez queda más claro que las frases genéricas, las conversaciones insulsas, quedarse diciendo “gracias por acompañarnos a esta hora”, “Manda tus saluditos”, “Hoy es miércoles, ombligo de semana”, etcétera, no marcan ninguna diferencia. Eso lo puede hacer perfectamente un robot, y no cobrará ni un centavo por hacerlo.
Por esta razón, su locución tiene que ser creativa, cercana al oyente, sorprendente, entretenida, con información y cercanía. Por eso hay que preparar el turno, pensar antes de hablar e interactuar de manera afectiva con los oyentes.
¿Qué será de los locutores de radio en un futuro? ¿Qué pasará con los actores de voz para comerciales de radio y televisión, narraciones y audiolibros? ¿Cuánto tiempo pasará antes de que puedan ser reemplazados?
¿Tendrá razón Armando Plata? Hay señales claras de que podría ser cierto en un futuro. Sin embargo esperamos, por el bien de nuestro oficio, que no…