Esta nueva y mágica aplicación es una IA Ron Borgoña para tu teléfono

la aplicación de lectura de ElevenLabs en un iPhone
oncelabs

Incluso cuando OpenAI retrasa su función de texto a voz para ChatGPT, la startup de audio AI ElevenLabs lanzó su aplicación Reader para iOS el miércoles, un modelo que promete leer en voz alta las palabras de prácticamente cualquier fuente de contenido, incluidos artículos de noticias, archivos PDF, ePubs y boletines. – incluso pegar enlaces web.

Los usuarios podrán seleccionar de una biblioteca de “ voces humanas de alta calidad ” para escuchar y podrán controlar la rapidez con la que la voz modulada por IA les lee el texto. La aplicación Reader está disponible en iPhone, iPad y iPod Touch (cualquier dispositivo que ejecute iOS y iPadOS 15 o posterior) para usuarios de EE. UU., Reino Unido y Canadá, para comenzar. La compañía planea lanzar el software en la UE “ en un par de semanas ” alrededor del 11 de julio. Actualmente se está trabajando en una versión de Android y la compañía ofrece una lista de espera para los usuarios interesados.

ElevenLabs ya está considerando actualizaciones para el servicio, incluida la reproducción sin conexión, acceso a fuentes RSS, resumen de IA y la capacidad de compartir fragmentos con amigos. La empresa también busca ampliar los idiomas hablados a los 29 idiomas admitidos por su modelo multilingüe.

"Crear los mejores modelos de audio de IA no es suficiente", se lee en el anuncio del miércoles de ElevenLabs. “Los creadores necesitan herramientas a través de las cuales puedan crear. Y los consumidores necesitan interfaces a través de las cuales puedan consumir audio”. La compañía eventualmente comenzará a cobrar por el servicio (dado que su sitio web indica que los primeros tres meses de uso son gratuitos), aunque aún no se sabe cuánto podría costar esa suscripción.

Los modelos de voz generados por IA de ElevenLabs se entrenan con datos de dominio público, datos adquiridos en acuerdos con socios comerciales y datos disponibles públicamente, según un informe anterior de Digital Trends . Con ellos, la empresa puede ofrecer una variedad de servicios, desde doblaje y traducción automática hasta clonación de voz y narración automática, e incluso generar voces de IA para NPC creados en Unreal Engine.