Innovación en el doblaje: Las tecnologías que están remodelando la industria.
Les comparto algunas novedades recientes.
Desde hace algún tiempo, he estado siguiendo de cerca en internet todos los últimos lanzamientos relacionados con el doblaje. Con el avance exponencial de la inteligencia artificial (IA), constantemente surgen nuevos proyectos innovadores.
De hecho, redacté un artículo para una publicación en el que detallo algunas aplicaciones que podrían ser utilizadas de diversas formas en esta disciplina. Pronto se publicará y estará disponible para su lectura. Mientras tanto les comparto algunas cosas que estuve probando las últimas semanas.
Hasta ahora, he encontrado muchas «promesas» en el campo del doblaje, pero pocas soluciones concretas. En general, especialmente cuando se trata de la combinación de idiomas inglés-español, los resultados suelen ser insatisfactorios. Probé varias aplicaciones y sitios web que ofrecen servicios de este tipo: «Accesibilidad automática del contenido de un canal de YouTube», o «Haz que tu contenido sea multilingüe con solo hacer clic y llega a más personas.». Sin embargo, en esos casos, los resultados suelen carecer de calidad. Permítanme ilustrarlo con un ejemplo recurrente. Por lo general, el proceso es este: la transcripción y la traducción se realizan de forma automática, y la voz utilizada es generada mediante TTS (Text-to-speech), pero claramente nadie con un mínimo de criterio humano revisa el resultado: hay errores de traducción, entonación y fraseo, entre muchos otros.
Durante la semana pasada, he estado probando Rask.ai, una plataforma que ofrece servicios de doblaje en más de 60 idiomas. Según parece, además tiene la capacidad de reconocer si un video cuenta con más de un interlocutor y sabe cómo interpretar correctamente a cada uno. Estuve viendo algunos videos y debo admitir que las voces sintéticas suenan mucho más naturales que en otras plataformas. Lo interesante es que adicionalmente, como parte de su servicio ofrecen una «clonación» de la voz del video original, utilizando su timbre y cualidades propias para generar las voces en los otros idiomas.
A pesar de los errores que pueden observar a continuación, como problemas de sincronización o dubitaciones y/o problemas de fraseo, me gustaría que me dieran su opinión sobre la efectividad de esta clonación. Me resulta difícil ser objetivo con respecto a mi propia voz. Tengo la sensación de que hay un cierto «tufillo» a mí, pero no puedo precisarlo con certeza.
Pueden probar su propia versión, gratis, en su página.
El «Traductor universal» de Google.
El Universal Translator es un servicio experimental presentado por Google durante la conferencia Google I/O '23. Se trata de otra herramienta basada en IA -y con voces sintéticas- que tiene como objetivo «mejorar el doblaje de videos al ofrecer la capacidad de traducir la voz de un orador a diferentes idiomas y sincronizar los movimientos labiales del hablante con las palabras traducidas» (O al menos así lo venden).
Durante su presentación oficial (Aquí el video de su anuncio), James Manyika, Vicepresidente Senior de Tecnología y Sociedad de Google, explicó que el Universal Translator utiliza modelos de traducción automática para convertir el discurso del orador a otro idioma, replicando también el estilo y el tono de la voz original. Luego, la herramienta sincroniza los movimientos labiales del orador con las palabras traducidas, creando una experiencia de doblaje «más fluida y natural».
Aparentemente lo que diferencia al Universal Translator de otras propuestas similares es su enfoque en la sincronización labial. En este enlace podrán ver un video con detalles. Tanto aquí como en la presentación no está del todo claro cómo es que realizan dicha «sincronización especial». Según se entiende, no se trata de una modificación con post-producción de video (como lo que propone, por ejemplo, el TrueSync de Flawless) sino que simplemente tiene en cuenta la isocronía, el ritmo, la segmentación, velocidad y demás de la versión original y se adecua a eso. Por lo poco que se percibe puede ser algo mejor que lo ofrecido por otras plataformas, pero sigue sin haber lipsync y a pesar de que la audiencia aplaude hacia el final, el resultado no sorprende en absoluto. No es mucho lo que hay disponible para ver y analizar pero pueden ver que no hay correspondencia de bilabiales cuando dice «(…)convertirse en un adulto productivo».
Universal Translator aún se encuentra en una etapa experimental y solo está disponible para socios autorizados.
Consideraciones finales: mirando hacia adelante.
Quiero compartir con ustedes algunas reflexiones sobre los cambios que estamos presenciando en la industria del doblaje. En estos tiempos de transformación, hemos sido testigos de una evolución significativa en nuestra forma de trabajar. Los grandes estudios de postproducción ya no son la única opción, y la pandemia nos impulsó a adoptar nuevas prácticas. La tecnología ha desempeñado un papel fundamental en esta revolución.
Lo que más me fascina es cómo ha cambiado la estructura de talento en nuestra industria. Ahora, muchos tienen la posibilidad de grabar sus partes asignadas desde la comodidad de sus hogares, e incluso están surgiendo colaboraciones entre países. ¡Es todo un cambio de paradigma! En algunos proyectos, aún se mantiene la estructura tradicional de dirección, técnicos y talento de voz, pero también existen estudios que «encargan» las grabaciones, lo que hace que los profesionales de la voz ahora también tengan que ser editores de audio, directores creativos e incluso adaptadores y traductores. Está disponibilidad de talentos de la voz con equipamiento propio, está animando a que haya cada vez más estudios pequeños -o entidades que incluso no poseen un estudio «físico» - que se animan a producir doblajes o incluso voces originales.
Creo que se puede establecer un paralelo entre la incursión de estas tecnologías en algo que solía ser más «artesanal» y lo que ocurre con el CGI en la postproducción de efectos especiales visuales en el cine.
La llegada del CGI en el cine revolucionó la forma en que se crean efectos especiales, ofreciendo ventajas en términos de costos y tiempos de producción. El uso de efectos generados por computadora permite reducir los gastos asociados con la creación de sets físicos, la contratación de actores especializados en escenas peligrosas y la realización de secuencias de acción.
Sin embargo, a pesar de todas las ventajas que ofrece el CGI, todavía hay proyectos de mayor envergadura que optan por utilizar efectos prácticos y escenas reales con especialistas. Esto se debe a que hay ciertas situaciones en las que los efectos físicos y el trabajo artesanal ofrecen una calidad y autenticidad que no se puede lograr completamente con efectos generados por computadora.
En escenas que involucran explosiones, fuegos, acrobacias y secuencias de acción intensas, los equipos de producción pueden optar por utilizar elementos reales para garantizar una mayor sensación de peligro y emoción. Estas técnicas implican el uso de especialistas en acrobacias, coordinadores de acción y equipos de efectos prácticos, quienes trabajan en estrecha colaboración para crear momentos impactantes y auténticos en pantalla.
Estos enfoques tradicionales no solo brindan un aspecto más realista, sino que también pueden generar una mayor conexión emocional con el público, ya que perciben que lo que están viendo en la pantalla es tangible y genuino.
Volviendo al doblaje, creo que para ciertos materiales -por ejemplo, los del tipo informativo- el uso de esta producción en serie será cada vez más extensivo y el doblaje tradicional quedará más reservado para la ficción y producciones más grandes.
En este contexto en constante evolución, vislumbro un futuro en el que todas estas plataformas y aplicaciones sean parte de la «caja de herramientas» de cada talento.
Aunque por ahora las emociones y las actuaciones humanas no son reemplazables, puedo imaginar un panorama en el que cada vez haya menos intermediarios y muchas tareas estarán automatizadas. Los humanos quedaremos reservados para brindar esas emociones y para realizar las tareas creativas y de supervisión, además de certificar la calidad de lo que la tecnología produzca.
Para lograr esto, es importante tener un criterio formado sobre todos los aspectos que componen el doblaje: desde un casting adecuado hasta una buena actuación, sin descuidar las cuestiones artísticas y técnicas que no pueden fallar.
En resumen, veo un futuro con cada vez más productores de doblaje. Hoy en día, es posible generar un doblaje sin tener que grabar a ningún actor, o incluso tener un elenco completo utilizando una voz como guía y aplicando plugins que le den una identidad propia a cada una de las voces. Ya está ocurriendo, por ejemplo, con plataformas como Papercup, que permiten la producción desde cero de doblajes en estilo «U.N. Style voice over». En este caso, son traductoras/es y correctoras/es quienes supervisan la calidad del producto final audiovisual, ya que no hay voces ni personas reales involucradas en la producción ¿No debería supervisar este proceso alguien con experiencia en doblaje o al menos en la voz hablada?
Es en ese contexto -y reservé para el final la parte autorreferencial- en el que estoy pensado armar un curso que apunte hacia ese tipo de formación integral. Pero antes de embarcarme en su gestión, necesito que me digan si podría ser de su interés.
Espero ansioso sus comentarios.
¡Gracias por leer!
El que más me convenció fue el de TrueSync de Flawless, pero me hace sospechar que puede estar retocado para la publicidad.
Creo que la capacitación orientada a este tipo de mercado sería genial, de todas formas creo que en el campo del doblaje más artístico el doblaje artificial tendría resultados estéticos tristísimos. Ojalá nos sepamos adecuar para compensar con calidad notable lo que la AI ofrece en reducción de tiempo y costos.