Así usamos la inteligencia artificial para devolver la voz a pacientes de ELA

📅 12/01/2026 📂 salud

La Voz: Un Sello Personal Irreemplazable

Nuestra voz es mucho más que un simple medio para transmitir información; es una expresión directa de nuestra identidad. A través de su tono y cadencia, revelamos quiénes somos. El mismo chiste contado con nuestra entonación natural adquiere un matiz distinto al pronunciado por una voz artificial. Un mensaje de afecto pronunciado con nuestro timbre personal tiene una profundidad emocional que ninguna síntesis mecánica puede igualar.

La Pérdida de la Voz en la ELA

Para las personas diagnosticadas con esclerosis lateral amiotrófica (ELA), la pérdida progresiva de la voz representa la erosión de un componente esencial de su ser. Esta patología neurodegenerativa va limitando las funciones motoras, entre ellas, la capacidad de hablar. Aunque existen soluciones de comunicación aumentativa, estas suelen emplear voces estándar que no reflejan la identidad previa del individuo.

Un Proyecto con un Objetivo Humano

En el grupo VertexLit, del Instituto VRAIN en la Universitat Politècnica de València, nos planteamos un desafío: alterar esta realidad. Nuestro esfuerzo ha logrado recrear la voz de Fran Vivó, un paciente con ELA, restituyéndole un atributo que parecía irrecuperable.

La motivación de este trabajo no era únicamente técnica. Los pacientes ya cuentan con dispositivos para comunicarse mediante texto o voces sintéticas genéricas. Nuestra búsqueda era de otro orden: restituir la dignidad personal.

El momento en que Fran puede expresarse nuevamente con su voz propia, con sus modulaciones y peculiaridades, produce una transformación significativa en él y en su entorno cercano. Más que una utilidad funcional, supone una contribución inmensa al bienestar emocional. Es reencontrarse con la esencia auditiva de la persona que conocían.

El Desafío Tecnológico y Humano

La dificultad principal no radica en la tecnología de clonación en sí, sino en adaptarla a los materiales de los que se dispone. Cuando alguien pierde la voz, las grabaciones existentes son habitualmente limitadas y de diversa calidad: audios de teléfono, vídeos domésticos o mensajes conservados sin intención.

El proyecto ha requerido seleccionar las herramientas y algoritmos más adecuados, y realizar procesos de entrenamiento especializados. El objetivo no era solo preservar los atributos fundamentales de la voz, sino también incorporar rasgos de emotividad y expresión.

Más Allá del Timbre: La Huella Prosódica

Los sistemas actuales pueden imitar con gran precisión el tono y el timbre de una voz. No obstante, el habla natural incluye un ritmo distintivo, muletillas, pausas estratégicas y modulaciones que nos individualizan tanto como el sonido mismo. Esta capa expresiva, nuestra "huella prosódica", es lo que hemos intentado capturar y reproducir.

Para lograrlo, empleamos modelos de inteligencia artificial que examinan minuciosamente las grabaciones del paciente. Estos sistemas identifican patrones de entonación, variaciones locales, ritmos y otros elementos que configuran su estilo único de comunicación. El producto es un perfil exhaustivo que trasciende las meras cualidades acústicas.

Con este perfil, preparamos cualquier texto antes de sintetizarlo. En vez de generar las palabras directamente, las moldeamos para que imiten cómo las articularía esa persona: con sus énfasis, sus silencios y sus giros idiomáticos. Así, la voz resultante no solo se parece a la suya, sino que habla como él lo haría.

El Camino a Seguir: Accesibilidad y Escalabilidad

Nuestra visión es desarrollar una plataforma intuitiva que permita, sin conocimientos técnicos, entrenar el sistema con las grabaciones disponibles y crear nuevas locuciones. Perseguimos que el paciente y su familia puedan generar mensajes en un entorno privado, transformando esta tecnología en un apoyo humano a los sistemas de comunicación existentes.

Nos encontramos en una etapa decisiva para la inteligencia artificial. Lamentablemente, a menudo se destaca más su potencial uso indebido que los beneficios tangibles que ya ofrece en áreas como la salud. Es crucial regular sus aplicaciones concretas, sin obstaculizar la investigación y la exploración de sus capacidades positivas.

Para nosotros, el sentido de la IA reside en servir de puente inteligente entre la complejidad del mundo y las personas, en especial aquellas con necesidades específicas.

Actualmente, el proyecto está en fase de expansión. Trabajamos para que esté disponible a través de asociaciones e instituciones, permitiendo que otros afectados puedan realizar el proceso de forma autónoma. La meta es ampliar el alcance, no solo para la ELA, sino para cualquier condición que afecte a la comunicación.

Emplear la inteligencia artificial como un recurso que nos apoya, nos complementa y se ajusta a las singularidades de cada persona. Eso es, en esencia, lo que perseguimos.

Así usamos la inteligencia artificial para devolver la voz a pacientes de ELA

Contenido original en https://theconversation.com/asi-usamos-la-inteligencia-artificial-para-devolver-la-voz-a-pacientes-de-ela-270897

Derechos de autor
Si cree que algún contenido infringe derechos de autor o propiedad intelectual, contacte en bitelchux@yahoo.es.


Copyright notice
If you believe any content infringes copyright or intellectual property rights, please contact bitelchux@yahoo.es.