¿Qué tal si fuera posible doblar tu voz a cualquier idioma manteniendo tu mismo tono? Bueno, no hace falta imaginar, porque esto ya es posible y se puede lograr en pocos segundos. Una vez más la protagonista es la inteligencia artificial generativa. Esta nueva tecnología llegó para revolucionar la forma en que nos vinculamos, trabajamos y creamos.
Así como están el ChatGPT o Bard para producir textos; Midjourney para hacer imágenes, o Runway para crear videos; también hay plataformas capaces de clonar voces. En este caso estamos hablando de Rask.AI, una herramienta de inteligencia artificial (IA) generativa. Así se denomina al subgrupo de IA capaz de producir contenido nuevo a partir de los datos de entrenamiento que recibe.
Y sale a competir con un gigante: hace unas semanas YouTube comenzó a ofrecer el doblaje automático para sus videos con voces sintéticas con una herramienta llamada Aloud, según relata The Verge; la diferencia es que la herramienta de YouTube funciona como un doblaje genérico, es decir, eligiendo una entre un grupo de voces ya sintetizadas.
Cómo funciona el doblaje por inteligencia artificial
Para comenzar a usar Rask, simplemente hay que ingresar al sitio y registrarse con un correo electrónico. El siguiente paso es subir un video o simplemente pegar el link a un contenido multimedia subido a YouTube. Después aparece una caja de diálogo en la cual se selecciona la lengua que está en el video original y luego el idioma al cual se quiere doblar el contenido. Se presiona en la opción que dice “generar” y casi en un instante se obtendrá el video doblado en la lengua seleccionada.
Pero lo más sorprendente es que el doblaje se hace manteniendo el tono, ritmo y cadencia de la voz del protagonista del video. El sistema hace una clonación casi perfecta. Otro punto para destacar es que el sistema es capaz de detectar a diferentes hablantes en un mismo video.
El costado negativo para la industria del doblaje
Son todos beneficios para quienes le sacan el jugo a esta herramienta, pero hay un lado B: el impacto negativo, a nivel laboral, que tiene para locutores, intérpretes y traductores. Al automatizar el doblaje y la traducción, se reduce la necesidad de contratar a quienes se dedican a hacer este tipo de servicios. Ese es el gran desafío que hoy presentan las diferentes plataformas de inteligencia artificial generativa y que no solo afecta a este tipo de trabajos, sino a muchos otros que hoy pueden absorber otras IA especializadas en la creación de textos, códigos de programación, edición de videos o fotos.
Rask también ofrece otros servicios como la posibilidad de generar máscaras que se fusionan sobre el rostro original del protagonista del video, a partir de una instrucción escrita en formato de texto. Esto permite, por ejemplo, subir un video de un hombre de 30 años, sin cabello y con labios delgados, y luego escribir un prompt que diga “hombre de 50 años con abundante cabellera y labios voluminosos” para que la IA haga su reconversión digital.
A su vez, la compañía está trabajando en una opción que permite generar clips cortos para redes sociales a partir de videos extensos. Todo esto también en pocos segundos y gracias a “la magia” de la inteligencia artificial generativa.