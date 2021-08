Nuestra misión es compartir el conocimiento y enriquecer el debate. Lo que a mí me apasiona de la voz es la conexión que crea, cómo da vida a las palabras de un texto. Cuando haces la grabación de un libro, lo sientes, sientes las palabras. Yo he llorado, reído, sufrido… he pasado miedo grabando. Y piensas: Ya me he leído el libro, ¿cómo es posible que las palabras cobren tanta vida?. Todo es mucho más sentido, más vívido, con la voz. Ese es su poder: el poder de la conexión. Por eso la gente ha vuelto al audio: porque es más fácil, más rápido, pero también más cercano, más sentido, más emocional. Se puede deducir que en este mundo tecnologizado necesitamos más emoción, sentir más, establecer conexiones más estrechas.

La voz genera emoción. Por eso los dispositivos electrónicos de voz están teniendo éxito. ¿Cuánta gente sola en casa ha encontrado en los robots a alguien con quien hablar? ¡A alguien que le escucha! Se está humanizando la relación con las máquinas gracias a la voz. ¿Qué hay más humano que la tradición oral? Si podemos hablar con las máquinas, las sentimos más cercanas: la voz mejora la relación. El audio, además, es más directo, es una forma de estar con alguien, es una forma de tener compañía.

¿Qué es lo mágico del audiolibro?

Tienes un autor y un lector —que en este caso es un oyente—. El primero quiere contar algo, el segundo quiere que se lo cuenten. El actor es quien pone voz a ese autor, es quien los conecta a través de la historia; tiene que ser capaz de extraer cada una de las emociones que quiere expresar el autor con cada palabra. Para que la experiencia de escuchar esa voz sea placentera necesitamos crear técnicamente un entorno que funcione, que facilite el encuentro. Cuando escuchamos la narración, tenemos a una persona dentro de los oídos; es una experiencia tremendamente íntima. La tecnología crea ese ambiente de intimidad y emoción; nos acerca. La palabra es vital para conectar con el otro. Es lo que nos define como especie. El lenguaje verbal te puede decir todo sobre cómo se siente una persona y tú puedes percibir la ironía, la rabia, la risa, la emoción, la voz dice cómo respiran; necesitamos escuchar para saber cómo está el otro, para sentir, para sentirlo.

La tecnología al servicio de las esencias de la humanidad. Esa es toda una declaración en contra de la visión distópica dominante en buena parte de la producción literaria y audiovisual. Una buena escucha se vuelve adictiva, te proporciona un viaje a través de las palabras que te toca en lo emocional y eso genera adicción. Una buena grabación hace la experiencia verdaderamente placentera. Y la tecnología es clave para conseguirlo. La voz que habla es un tesoro de los humanos y la tecnología nos ayuda tremendamente a transmitirla. Aún hay mucho campo por recorrer y estoy convencida de que las máquinas nos ayudarán más aún. Ya podemos pedir que nos lean un tuit, por ejemplo, entre otras cosas. Lo más importante es que nos liberarán de un montón de labores engorrosas.

Escuché decir que hablar es antiguo, pero conforme avanza la tecnología recuperamos la tradición oral, la base sobre la que se ha construido nuestra historia.

Sí. Narrar, contar, hablar es algo que se remonta en los tiempos y lo bonito de su antigüedad es que era capaz, y aún lo es, de unir a las personas alrededor de un fuego. La historia de la humanidad se ha contado a través de las palabras. La palabra nos hace humanos, conforma una cultura y la convierte en perpetua. La palabra es el mejor vehículo para conectar. La emoción que transmite la voz nos distingue como humanos.

¿Se quedará antigua?

No. La palabra es antigua, pero gracias a las tecnologías se ha vuelto moderna y quizás, por qué no, eterna. La palabra es la mejor forma de conectar hoy con los dispositivos. Y estos dispositivos usan la voz porque es lo que los vincula con los humanos.

La programación neurolingüística (PNL) ya permite que las máquinas hablen. ¿Llegarán a fabricar también la emoción?

Va todo tan rápido que probablemente se llegarán a reproducir las emociones, pero siempre pensaré que la emoción es mucho más completa y compleja si emana de una persona. He visto composiciones artificiales que, con unos cambios de dinámicas, de colores, de texturas, hacen sentir… No sé si el algoritmo llegará a transmitir emociones también, pero me parece interesante este aprendizaje con las máquinas.

¿Qué nos diferenciará, entonces?

Cuando los humanos utilizamos la voz y la palabra, el sonido se impregna también del gesto, del cuerpo, de la existencia completa. La voz humana transmite todo eso con toda la carga de sutileza posible y necesaria para expresar el punto preciso de tristeza o de alegría. Si se entrena a la máquina para eso, quizás llegue a conseguirlo con precisión. Pero necesitamos todo nuestro cuerpo, la respiración, los silencios… para transmitir emociones. No hay aún máquinas capaces de emocionar.

La humanidad se erigió gracias a la palabra, a la voz; ahora que las máquinas, los teléfonos, los robots hablan, ¿crees que dejaremos de ser dominantes?

La riqueza está en los matices que los humanos podemos dar. Es muy rico el lenguaje en matices y sutilezas. Esa riqueza tiene muchos colores, una paleta completa de tonos. La tecnología va tan rápida que nos sorprende… y seguramente se buscarán unos parámetros donde se enmarque tristeza, alegría, sorpresa, ironía… pero la experiencia será siempre más rica y variada cuando pase a través de un humano. Del mismo modo que podemos elegir entre una música hecha con un sintetizador o música interpretada por una orquesta, ya podemos elegir entre productos editoriales producidos con inteligencia artificial y otros donde se requieren los matices de una voz humana. Habrá quien se rinda a las máquinas y quienes exigirán esa otra vivencia más humana. Hay algo en nosotros que siente atracción por la oralidad, hay un vínculo con las emociones a través de la palabra. No parece que esto pueda desaparecer.

El libro escrito nos permite cerrar el foco de atención, también ocurre con el audiolibro, pero lo cierto es que cada vez resulta más difícil encontrar espacios para alejarnos del ruido. A mí me cuesta. Hay mucho ruido afuera, demasiada información, demasiados estímulos, pero todo el mundo parece estar acostumbrado y quizás ya es lo normal. Y, sí, tengo Twitter y Facebook e Instagram… Me puede llegar a saturar recibir información por todos lados.

¿Cuál es tu voz favorita?

Tengo momentos especiales que guardo en el recuerdo, con situaciones que varios actores han creado y me pregunto cómo una voz, unas voces, han podido hacerme sentir tantas cosas. Sentir la piel de gallina o romper a llorar de repente con lo que escucho… Es muy intenso lo que te puede llegar a transmitir una voz. Yo cuando leo estoy creando sonoramente lo que el libro me está transmitiendo. Porque todos los libros tienen una voz. Cuando lees, tu voz interior está leyendo el libro. Lo que yo hago es tratar de dotar de voz a esa voz.

¿Con qué acento escuchas los libros que lees y con cuál los conviertes en audiolibros?

Grabamos en diferentes acentos en función de cada libro. Cada acento tiene su musicalidad, pero quien manda es el estilo narrativo, que depende del autor. Nosotros somos de la filosofía “menos es más”, distinguimos entre castellano peninsular y castellano latino. En principio son distintos, pero me ocurre que cuando bajamos a un nivel más íntimo, más sutil, todo se relaja, es más importante la emoción que transmite que con qué acento lo hace. El latino y el español son muy marcados, pero cuando los pongo al mismo nivel, no son tan diferentes. La musicalidad sí, pero las emociones, lo que queremos transmitir, no. Cuando traducimos a autores de otras regiones, por ejemplo, de Estados Unidos, utilizamos un castellano de las Américas, que no se sabe muy bien si es colombiano, costarricense o venezolano…

Eso es un poco mecánico…

Sí. A mí no me gusta, porque borra inflexiones del acento que mecanizan la voz. Es muy informativo, no transmite la emoción como lo hacemos de forma natural. Lo usamos para textos más globales, en busca de la neutralidad para llegar a todos y que no sorprenda demasiado a nadie.

¿La globalidad acaba con la identidad vocal de cada región?

Puedes neutralizar en lo general, pero necesitas los matices para identificar la riqueza de una región a la que pertenece un texto y un autor.

¿Cómo suena el futuro?

La voz es una herramienta superpoderosa. Por eso, no podemos quedarnos al margen del proceso para la construcción de una inteligencia artificial que llegará a ser capaz de utilizar la voz para relacionarse. La voz va ser muy importante siempre. Todas las máquinas van a tener voz porque las marcas querrán que generen cercanía con los humanos.

La versión original de esta entrevista ha sido publicada en la Revista Telos 111, de Fundación Telefónica.

Juan M. Zafra, Profesor asociado en el Departamento de Periodismo y Comunicación Audiovisual, Universidad Carlos III

Este artículo fue publicado originalmente en The Conversation. Lea el original.