Humanos al mando: traducir, adaptar y decidir antes del TTS.
📌 Lo que encontrarás en este artículo
💡 Cómo se trabaja hoy con herramientas automáticas en doblaje
🧠 Por qué la adaptación sigue necesitando criterio humano
🎯 Qué decisiones afectan ritmo, sincronía y naturalidad
🎙️ Por qué traducir no es solo pasar palabras de un idioma a otro
📚 Una mirada práctica desde la experiencia real en proyectos actuales
👉 Si te interesa entender cómo se define la calidad de un doblaje antes de que suene una sola voz, seguí leyendo.
En publicaciones anteriores ya he hablado sobre las nuevas herramientas que están surgiendo para hacer doblajes. Hoy quiero centrarme en un aspecto de la adaptación y traducción que surge de mi trabajo actual, pero que bien puede aplicarse tanto al doblaje convencional como a los desarrollos futuros.
Llevo un par de años trabajando con esta tecnología. Por cuestiones de confidencialidad, no puedo mencionar proyectos ni procesos concretos, pero creo que podré transmitir algunas ideas generales y conceptos que pueden ser de utilidad. No solo conozco el proceso desde adentro, sino que también tengo la posibilidad de supervisar y corregir trabajos realizados por otros, y ya he establecido algunos patrones.
Parte de lo que describo aquí tiene que ver con un proceso que incluye una transcripción automática—bastante acertada, debo decir, pero que de todas maneras debemos revisar y no podemos confiar plenamente—una traducción también automática que se vale de distintos “motores” con distintos resultados, e incluso la posibilidad de parafrasear automáticamente para tener una salida rápida a disposición.
Pero la adaptación propiamente dicha siempre está centrada en un humano. Me gusta esta idea que está empezando a circular del «human in the core» en contraposición al «human in the loop». Es decir, las decisiones sobre si la traducción es acertada, qué caminos elegir durante la adaptación, y sobre todo qué niveles de sincronía y a qué restricciones obedecer y/o dar prioridad están basadas en las elecciones que tomemos.
Formación y educación: más necesarias que nunca
Para el futuro, estoy pensando en algún tipo de curso o taller que incluya estas herramientas para poder practicar directamente sobre un material concreto y generar voces que nos permitan testear o probar al instante si nuestras decisiones son las más apropiadas. Es muy útil para entender ritmo e isocronía, al igual que la adaptación de lipsync—aunque por el momento en la generación de voces con TTS no sean muchos los parámetros ajustables o la precisión dependa un poco del azar.
Por supuesto que un formato como el voice-over UN STYLE tiene sus propias reglas y estilo, por eso me gustaría centrarme en lo que ocurre en un proyecto convencional de doblaje sincronizado o «con lipsync», como se lo conoce en la jerga.
Habiendo visto algunos trabajos, quiero defender esta idea: estas plataformas ponen al alcance de cualquiera la producción de un doblaje desde cero—como suele decirse, «democratizando» el acceso a esa herramienta—pero creo que ahora más que nunca la formación y educación son necesarias.
Como esta etapa ocurre antes de generar las voces, muchas de las decisiones que se tomen acá van a definir la calidad final del producto. Con una misma herramienta, los resultados pueden variar muchísimo dependiendo del criterio, la experiencia y la sensibilidad de quien la use.
Entre otras, creo que hay dos cosas importantes a considerar que están relacionadas y casi que van a la par:
La importancia del ritmo:
La tecnología de síntesis de voz permite que los interlocutores hablen muy rápido y con baja probabilidad de problemas de dicción, pero si queremos naturalidad y fidelidad con el material original, debemos prestar atención a la estructura y a la isocronía o largos de los enunciados.
Qué pausas respetar, cuáles son notorias, qué cosas están en OFF y podemos omitir, cuándo la sincronía fonética es importante, etc., son todas decisiones que tomamos en este momento.
Puede sonar a perogrullada, pero cuanta más letra tenga que decir más rápido, menos posibilidad habrá de que tenga matices, inflexiones, entonaciones, etc. A falta de un humano que hable, la prosodia y estilo quedan en manos del humano que esté produciendo estos textos.
Rubén Arvizu, en su libro ¿De Quién es la Voz que Escuchas?, nos habla acerca de sus comienzos en el doblaje traduciendo y adaptando guiones. Su jefe en ese momento y pionero del doblaje en México era el Lic. Carlos Ortigosa (cuya voz iniciaba los capítulos del Superagente 86 diciendo «Temible operario del recontraespionaje»).
Recordando cómo aprendió el oficio, nos dice: «...En ciertos ratos intervenía en mi trabajo y, tamborileando los dedos sobre el escritorio, como si fuera un piano, me hacía comprender la enorme importancia del ritmo en la adaptación. Recuerdo esto claramente: - La traducción y adaptación son como música. Si el original es larara rará... lo que escribas debe tener la misma medida. Si lo tuyo dice larara, estás corto... y si es lararararara, estás largo... Además pensaba en la enorme importancia de pensar en las labiales al hacer la adaptación, para que los diálogos se ajustaran lo más posible al movimiento de la boca original»...
Traducir ideas e intenciones, no palabras sueltas:
Cuando hablamos de traducir para doblaje, lo importante es el sentido y la función de lo que se dice. La adaptación no se trata solo de pasar palabras de un idioma a otro, sino de capturar la esencia cultural y emocional del contenido original.
Esto garantiza que el mensaje, el tono y las emociones lleguen al público en su idioma de destino de forma efectiva.
La fidelidad en doblaje no significa traducir cada término al pie de la letra, sino mantener el espíritu, la intención y el impacto de cada línea.
Hay que tener en cuenta que este es un tema amplísimo (existen estudios enteros sobre traducción audiovisual), pero en esencia la idea clave es esa: traducir sentido por sentido, no palabra por palabra. Para lograrlo, el traductor-adaptador de doblaje debe considerar muchas variables a la vez. Además del ritmo y los niveles de sincronía, algunas de las más importantes son:
Contexto: ¿En qué situación se dice la frase? ¿Cuál es la relación entre los personajes? El contexto cultural y narrativo influye en cómo se debe traducir una expresión.
Intención: ¿Está el personaje bromeando, amenazando, consolando, siendo sarcástico? La función del lenguaje(persuadir, ofender, hacer reír, etc.) guía la elección de palabras en la traducción.
Imagen en pantalla: Lo que ocurre visualmente también manda. Si en la imagen se ve un letrero, un gesto o algo que da sentido al diálogo, la traducción debe tenerlo en cuenta. A veces hay que modificar una línea para que no choque con lo que se ve.
Prosodia y estilo: La entonación, el acento y el registro importan. El diálogo adaptado debe sonar natural en el idioma meta, con la melodía y énfasis adecuados, para que la actuación vocal fluya con la misma emoción que en la versión original.
Este newsletter siempre será gratuito, pero si consideras que el contenido merece apoyo, te invito a colaborar conmigo a través de estos botones. Los primeros tres son para suscribirte mensualmente en pesos, a través de Mercado Pago. (Recuerda que puedes darte de baja en cualquier momento si así lo deseas). Y si estás en el exterior puedes hacerlo a través de PayPal (También con una suscripción mensual o un único aporte). Tu contribución será una forma de respaldar mi trabajo y ayudar a que este proyecto siga creciendo.
Por favor, si no puedes hacerlo no te vayas, ¡Corre por mi cuenta la invitación para que sigas leyendo!
Y MUCHÍSIMAS GRACIAS A LOS QUE YA ESTÁN COLABORANDO.
NOTICIAS:
Flawless y el «doblaje visual»:
De todas las tecnologías que no paran de anunciarse, esta es —por lejos— la más prometedora en términos de lo que implica para nuestro campo.
Me refiero a lo que está haciendo la empresa Flawless, que viene trabajando hace rato en lo que llaman “visual dubbing” o doblaje visual: una técnica que no solo reemplaza las voces en otro idioma, sino que también adapta visualmente el movimiento de los labios para que coincidan con el nuevo diálogo, como si los actores hubieran hablado en ese idioma desde el principio.
Su último avance se puede ver en Watch the Skies, una película sueca que fue transformada para públicos de habla inglesa usando esta tecnología. La gracia no está solo en que suena bien, sino en que los labios, gestos y expresiones se adaptan de manera tan convincente que la barrera idiomática desaparece casi por completo. No es redoblaje tradicional, no es deepfake, no es animación: es un híbrido con supervisión creativa donde se busca que todo parezca natural.
Ya lo decía en este texto: el doblaje es, en última instancia, un proceso de postproducción pensado para hacer que una obra llegue a otras audiencias. Y si ese proceso puede mantenerse bajo el control creativo de los realizadores, y a la vez lograr un resultado que se percibe como una versión auténtica en otro idioma —sin perder tono, intención ni emoción—, entonces esto es, sin duda, lo más prometedor que tenemos por delante.