¿A quién no la ha pasado? Escuchas una grabación de tu propia voz y agitas la cabeza con incredulidad: “No, ese no soy yo, no puedo sonar tan [inserte término autodenigratorio]”. Tan identificados estamos con nuestras voces, que hasta el más mínimo cambio en ella nos causa recelo.
Nuestra voz es, básicamente, nuestra huella dactilar con un megáfono. Cada vez que hablamos transmitimos quiénes somos: nuestro origen geográfico, edad, estado de ánimo e incluso personalidad. Pero millones de personas en el mundo no tienen este lujo… y más limitante aún es para aquellos que ni siquiera pueden expresarse con sus manos, por tener problemas psicomotores. ¿Qué queda para ellos?
En el mejor de los casos, una voz sintética como la que tiene Stephen Hawking que, si bien cumple con su labor comunicativa, está desprovista de toda identificación personal. En otras palabras, una huella dactilar, sí, pero sin nada dentro.
Por esta razón, una empresa desarrolla desde 2014 una labor que combina un gran catálogo de voces con lo último en tecnología, para darle voces personalizadas y únicas a aquellos que no la tienen.
En 2002, Rupal Patel, entonces estudiante de la Universidad de Calgary (Canadá), escuchó a dos personas con trastornos del habla comunicándose a través de un sistema de asistencia. Era una niña pequeña y un hombre adulto y, sin embargo, compartían la misma y única voz metálica que ofrecía la tecnología.
Saltamos poco más de una década, en 2014, y encontramos a Patel, ya formada como científica y profesora en tecnologías del habla, trabajando intensamente aún con el recuerdo en mente. ¿Su objetivo? Desarrollar voces personalizadas para darle a esa niña, a ese hombre y a muchos otros la posibilidad de tener su propia voz.
Luego de varios años de trabajo, la canadiense lanzó públicamente el primer banco colaborativo de voces del mundo, al que hoy 20 mil personas de 110 países han aportado con la suya.
El sistema es bien simple e intuitivo; luego de registrarte y preparar tu “estudio” (computador) para evitar que haya ruidos externos, el sistema te muestra textos que debes leer. Antiguamente esto solía hacerlo Patel en su laboratorio en sesiones de varias horas, pero ahora es posible hacerlo en línea, en sesiones que puede completar el usuario a su manera, y que culminan luego de 2 a 3 horas de grabaciones totales.
¿Pero cómo es que de un banco de voces se crean nuevas? Bajo el paraguas de su compañía, VocaliD, Patel perfeccionó una tecnología que permite hacer un match entre la voz de una persona con trastornos del habla y un donante del banco, y sintetizar una nueva ad-hoc al usuario para su uso en dispositivos generadores del habla.
Incluso personas con severas limitaciones del lenguaje, como aquellas afectadas por parálisis cerebral, pueden hacer sonidos con su marca personal, aunque sean tan simples como un “Ahhh”. De esto se alimenta el VocaliD para encontrar una voz similar.
En el proceso son especialmente importantes las vocales. Tim Bunnell, investigador que trabajó junto a Patel, explica que el sistema busca emparejar “la calidad de vocales”, porque es en ellas donde se distingue, mayormente, el “color” particular de una voz.
Luego de emparejarse, un algoritmo es utilizado para mezclar ambas en una sola. Luego cortan "esa voz mezclada en pequeños fragmentos de habla, que se pueden reordenar de cualquier forma, pegando pequeñas partes de una oración", explicaba Patel en 2014.
Es un proceso costoso ($1.499 dólares o 940 mil CLP, actualmente), pero para quienes tiene su propia voz por primera vez significa mucho:
VocaliD también ofrece la oportunidad a personas de grabar sus voces y almacenarlas para el futuro. ¿Por qué haría alguien algo así?
Muchas personas sufren de enfermedades degenerativas que van afectando progresivamente sus capacidades, el habla entre ellas. VocaliD toca el caso de John, un hombre afectado por ELA, cuya voz fue una de las primeras cosas en verse afectadas. Su esposa cuenta que escuchaba con frecuencia un antiguo mensaje de voz en el celular de él, solo para recordar cómo sonaba.
Gracias al banco de voz, muchas personas como John pueden guardar su voz antes de perderla, y así poder trasladarla posteriormente a dispositivos de asistencia.
Para John fue muy tarde porque la enfermedad lo privó de su voz en 2007. Afortunadamente, recibió una de un donante que suena igual que él, dice su esposa.
¿Se animaría Stephen Hawking, la primera persona que se nos viene a la mente cuando hablamos de voces sintéticas? Él mismo ha declarado que, luego de tantos años usando la misma, ha terminado identificándose con ella y, por lo demás, no ha encontrado un reemplazo convincente.
Por cierto: el nombre oficial de su voz es “Perfect Paul”, una elección algo soberbia tomando en cuenta que la única voz perfecta es la propia.