JULIÁN NEÑER, COFUNDADOR DE NEURALWAVE: “YA USAMOS MUCHAS HERRAMIENTAS DE INTELIGENCIA ARTIFICIAL EN LA VIDA COTIDIANA SIN SABERLO”
En una primera entrega de la serie “Emprendedores del Balseiro”, el cofundador de la empresa “NeuralWave”, el físico egresado del Balseiro Julián Neñer cuenta en esta nota cuál es el diferencial de esta plataforma y cuáles son los desafíos para el futuro. Además habla sobre el universo tecnoemprendedor y la ética en el uso de Inteligencia Artificial.
Fecha de publicación: 06/03/2024
Desde cualquier dispositivo pequeño, incluso desde un celular, se podría crear y transformar voces aplicando Inteligencia Artificial o IA. El proyecto “NeuralWave” de dos físicos del Instituto Balseiro permite cambiar una voz existente por otra generada con IA o ponerle voces a diferentes textos. Cuáles son las tecnologías que ofrece desde su empresa, quiénes son los clientes a quienes apuntan y cuáles son los nuevos desafíos del proyecto son algunas de las preguntas que uno de sus fundadores responde en esta nota.
La plataforma de IA desarrollada por Julián Neñer y su colega Ian Sosa, ambos físicos egresados del Instituto Balseiro, tiene un gran potencial para ofrecer sus servicios a diversos públicos debido al gran interés que despiertan los temas relacionados a este tipo de tecnologías.
NeuralWave encontró su nicho y apunta a brindarles una herramienta eficiente y accesible a quienes desarrollan videojuegos desde productoras independientes o indie hasta creadores de contenidos o agencias de noticias. Además entre los nuevos desafíos de este proyecto se encuentra la reconstrucción de voz para personas con dificultades en el habla.
“NeuralWave es un proyecto que aplica la Inteligencia Artificial para transformar voces, creando versiones sintetizadas que conservan las cualidades emocionales y de entonación de la voz original”, dice Neñer, que vive en la ciudad de Bariloche, al Área de Comunicación y Prensa del Instituto Balseiro.
Dos tecnologías en una sola plataforma
Existen muchas opciones a la hora de generar voces con IA. Si una persona hiciera una búsqueda en cualquier navegador encontraría cientos de resultados relacionados a este tema: Veed.io, Resemble AI y Murf.Ai son solo algunas de las empresas que aparecen al buscar ejemplos en google. Entonces, ¿cuál es el diferencial de NeuralWave? Según señala Neñer, su gran ventaja es la combinación de bajo costo, rapidez y la utilización conjunta de dos tecnologías.
En primer lugar, NeuralWave permite la creación de voces o la modificación de voces existentes para diferentes aplicaciones. En pocas palabras esta primera tecnología pasa de “voz a voz”. Por ejemplo, se podría modificar una voz existente por otra generada con IA que haga énfasis en cierta emocionalidad o bien cambie la entonación, y así podría ser utilizada para un personaje ficticio en un videojuego.
Por otra parte, la segunda tecnología que brinda NeuralWave implica la conversión de “texto a voz”. Así se pueden generar voces gracias a que la plataforma desarrollada por los dos físicos logra separar los componentes de la voz y ajustarlos según el requerimiento. Esos componentes son “el acento, la emoción, la identidad del orador y el mensaje”, explica Neñer.
La aplicación de esta tecnología podría ser utilizada por una agencia de noticias para reproducir sus contenidos con una voz adecuada para una región o incluso a un país. En este punto, los desarrolladores están enfocados en los lenguajes denominados como “periféricos” o de “poca información” como pueden ser los dialectos, según comenta Neñer. Esto se debe a que han desarrollado tecnologías que les permiten generar voces con pocos datos.
En ese sentido se podría imaginar que a raíz de un texto en español se pueda generar una voz en español argentino cordobés que lo reproduzca. Luego ese producto puede ser usado como insumo para un podcast o un sitio web que ofrezca el servicio de lectura en voz alta. Incluso podría pensarse en audiolibros con voces regionalizadas.
NeuralWave está alineada con la ética del uso de la IA. Un ejemplo en ejercicio de ello es la disponibilidad de la plataforma para que actores de voz puedan prestar su voz y trabajar a través de este proyecto. Neñer comenta sobre la metodología de trabajo en conjunto con los actores de voz.
A su vez, explica que se hace un contrato en el que ese actor tiene que brindar ciertos minutos de su voz, “Nosotros lo que hacemos es clonar la voz para que luego sea utilizada en texto a voz o en lectura de artículos periodísticos”, dice. Además, cuenta que los actores perciben regalías por el uso de sus voces en distintos productos.
Nuevos desafíos
El proyecto de IA ganó el primer puesto del Concurso IB50K, un certamen que premia planes de negocio de base tecnológica organizado por el Instituto Balseiro (CNEA-UNCUYO), en 2023. “Este reconocimiento es un gran honor y un impulso significativo para nuestro proyecto, ya que valida nuestro trabajo y nos proporciona recursos para seguir adelante”, dice Julián Neñer sobre el concurso.
Con vista hacia el futuro, los emprendedores detrás de NeuralWave están interesados y trabajando en un nuevo desafío para la plataforma relacionado con temas de salud. Con la tecnología de generación y reconstrucción de voces con IA se podría otorgarles o devolverles la voz a personas que hayan perdido o tengan dificultades en el habla.
En el caso particular de la reconstrucción el proceso comienza utilizando archivos de grabaciones de voz de la persona y con ese insumo se podría clonar y devolverles la voz gracias a esta tecnología. Para este proyecto, los físicos comentan que están trabajando en una colaboración internacional.
Cambio del paradigma tecnoemprendedor
Frente a la pregunta sobre el futuro de grandes cambios en la vida cotidiana debido a la IA que vaticinan los medios de comunicación, el emprendedor del rubro tecnológico y experto en la temática, Julián Neñer responde: “Ya usamos muchas herramientas de IA en la vida cotidiana sin saberlo. No hay que tenerle miedo, es una herramienta más”.
Un perfil emprendedor debe tener entre sus principales cualidades la capacidad de adaptarse a los cambios del entorno. En ese sentido, Neñer cuenta desde su experiencia que “tener la tecnología no es tener un producto”. Y es por esto que en un mensaje que va directo a los emprendedores en general, y en particular a quienes provienen desde el sector académico, el co-fundador de NeuralWave destaca la importancia de capacitarse en negocios, o en sus propias palabras, aprender herramientas de “business”.
Julián Neñer se formó como físico en el Instituto Balseiro (IB), dependiente de la Comisión Nacional de Energía Atómica (CNEA) y de la Universidad Nacional de Cuyo (UNCUYO). Como egresado remarcó: “Formarme en el IB no solo me llevó a entender la frontera del conocimiento humano, sino que también me enseñó a ser altamente flexible y eficiente al momento de aprender y encontrar nuevas soluciones.”.
La física detrás del producto
Un interrogante que muchas personas se pueden hacer es cuál es “la física” detrás de esta empresa. O, en otras palabras, cómo aportó el conocimiento científico a este tipo novedoso de tecnología. “Nuestra comprensión de la física nos permitió descubrir una óptima descomposición de la voz”, dice Neñer, que se graduó de la Licenciatura en Física y luego de la Maestría en Ciencias Físicas del Instituto Balseiro.
Así, el físico explica que su plataforma está basada en redes neuronales y algoritmos, esto es, fórmulas con instrucciones escritas en lenguaje matemático, que procesan la voz como un fenómeno físico. En NeuralWave se trabaja con modelos que transforman el audio en un espectrograma, que es una representación visual o gráfica del sonido y permite que las redes neuronales aprendan mejor los patrones subyacentes del habla.
“Al combinar modelos físicos con inteligencia artificial, es posible descomponer el habla humana en sus componentes fundamentales: voz, emoción y mensaje, y luego alterar solo el componente deseado”, dice Neñer. Y agrega que los modelos utilizados están basados en “mecanismos de atención desarrollados in-house que son capaces de subdividir el habla de manera adecuada”.
La ciencia física, en este caso, es utilizada para optimizar la descomposición de la voz y además colabora para lograr un modelo “pequeño y rápido”, como si fuese una “huella digital” de la voz analizada. La plataforma desarrollada es entonces una herramienta de IA que se puede usar en cualquier dispositivo.
En las propias palabras del físico: “La señal de audio de entrada es descompuesta en qué fue lo que se dijo, es decir, el mensaje lingüístico que usualmente es representado con texto, cómo se dijo, en donde se encapsula tanto la emoción del mensaje como el énfasis, entonación y acento; elementos que encapsulan la llamada prosodia del mensaje, y quién lo dijo, en donde se define la tonalidad de la voz, única para cada persona”.
¿Cómo es posible reconstruir una voz a partir de esta información? Neñer explica que una vez que se tiene esta división de la información, se puede editar el aspecto deseado y luego combinarlo con los demás para reconstruir la voz.
Otro es el caso de la tecnología de intercambio de voz (voice-swapping), también desarrollada en Neuralwave, en la que se edita la tonalidad de la voz (el quién lo dijo), manteniendo intactos todos los aspectos emocionales y lingüísticos. “Esto resulta en la capacidad de cualquier persona de tener cualquier voz”, agrega el físico y concluye que así se “permite al orador original incorporar cualquier tonalidad y emoción, generando infinitas posibilidades”.
El conocimiento detrás de la IA crece a pasos agigantados. Una prueba de ello es lo que sucede con software o apps de la vida cotidiana que han incorporado tecnología de IA para mejorar las experiencias de sus usuarios. En ese contexto, NeuralWave ofrece un producto que genera gran interés en empresas de todo el mundo. De hecho, ya tienen clientes en la República Checa y esperan hacer pronto nuevas colaboraciones con empresas de otros países.
–
Si te gustó esta nota, podés navegar por www.ib.edu.ar para leer nuestras notas y noticias, y encontrar toda la información sobre el Balseiro.
Además, podés enviarnos tus comentarios a través de nuestras redes sociales: Facebook, Instagram y Twitter. También tenemos un canal de YouTube.
Para estar al día con las novedades del Balseiro, podés suscribirte a nuestro newsletter.
—
Por Agostina Valentino
Crédito foto: Ramiro Sáenz Valenzuela
Área de Comunicación Institucional y Prensa (ACIyP)
Instituto Balseiro, San Carlos de Bariloche,06/03/2024
Contacto: prensa@ib.edu.ar
Más noticias: www.ib.edu.ar/index.php/comunicacion-y-prensa/noticias.html