El lanzamiento de mi primer podcast generado con IA de NotebookLM me enseñó una cosa que debes evitar

Empezó como una broma. "¿Qué tal si creo un podcast donde hablo con robots de inteligencia artificial y finjo que me interesa lo que dicen?", le pregunté a un amigo.

Eso fue hace unos meses, antes de que me diera cuenta de que Google tiene una herramienta de IA llamada NotebookLM que (prácticamente) te permite conversar con dos presentadores que parecen humanos en tiempo real. Conocido como modo interactivo, puedes unirte al podcast y hacer una pregunta en cualquier momento . Los bots pausarán el podcast, te reconocerán como "oyente" y comentarán lo que tengas que decir.

Decidí probar NotebookLM para crear un podcast de verdad. Lo lancé a través de Spotify para Creadores y luego lo promocioné en mis redes sociales. Aprendí mucho durante el proceso, pero el resultado final reveló bastante sobre lo que se necesita para crear un podcast. ¿Lo único que hay que evitar? Crear un podcast con un sonido demasiado robótico y sin alma. Así es como lo hice funcionar.

Grabación en modo interactivo

Al principio no me di cuenta, pero NotebookLM no graba tus interacciones con los anfitriones del robot. Como la aplicación (disponible para dispositivos móviles, pero también funciona en un navegador) está en fase beta, no hay mucha documentación útil ni instrucciones de uso. En lugar de usar NotebookLM para grabar la conversación interactiva, usé la aplicación Notas de Voz del iPhone. Aunque un podcaster de verdad se burlaría de la baja calidad, fue rápido y sencillo.

Para empezar, hay que elegir una fuente para la discusión. Decidí crear "Orígenes con John Brandon" como un podcast un tanto irónico sobre el origen de las cosas comunes. Mi primer episodio iba a tratar sobre el origen del plástico de burbujas, así que primero encontré varios artículos sobre el tema y los cargué en NotebookLM. Estos son los datos de entrenamiento que usan los "presentadores", ya que normalmente solo hablan entre ellos, pero no quería que empezaran a improvisar sobre el tema. En lugar de eso, intervine de inmediato y me presenté como el verdadero presentador.

Como pueden imaginar, Google no pretendía que funcionara así. Los bots se mostraron sorprendidos e incluso se dieron cuenta de que yo no era el anfitrión (mencionándome por mi nombre) e insistieron en que ellos eran los verdaderos anfitriones humanos. Hice algunas preguntas sobre el plástico de burbujas, pero al final la conversación derivó en una discusión sobre la concienciación y la inteligencia artificial. Me pareció un tema mucho más interesante, así que mi podcast adquirió un tono más satírico, similar al de The Onion. En otras palabras, aunque se suponía que iba a tratar sobre el plástico de burbujas, se centró más en la inteligencia artificial.

Estaba satisfecho con los resultados, aunque la calidad de la grabación no fue excepcional. Me imaginé que habría funcionado mejor si hubiera grabado la conversación en vivo con una grabadora digital aparte, pero no buscaba ganar ningún premio de podcast. Quería publicar mi primer episodio, y NoteBookLM me había impresionado, al menos en cuanto a la coherencia de la conversación. También fue genial cómo los bots respondieron a mi comentario en tiempo real.

Creando los activos

Por supuesto, un podcast es más que un simple archivo de audio que publicas. También incluye el diseño gráfico, la música de fondo, una voz en off y otros elementos.

Una vez que tuve la grabación del primer episodio, recurrí a Google Gemini para crear un mosaico cuadrado que pudiera usar para el programa. Cada podcast tiene un mosaico que ayuda a los usuarios a identificarlo en una aplicación como Apple Podcasts. Mi sugerencia fue simple: crear una imagen cuadrada para un podcast llamado "Orígenes con John Brandon" . También proporcioné una imagen de mí mismo con IA. En la primera prueba, Gemini creó un mosaico excepcionalmente bueno, como algo que diseñaría un profesional. Sin embargo, no me gustó que mi imagen estuviera asociada, así que le pedí al bot que lo intentara de nuevo. El resultado parecía un poco cutre, pero aceptable.

Me puse manos a la obra. Después, usé Suno para crear la música de cierre de mi nuevo podcast. Esta herramienta de generación de sonido con IA suele usar indicaciones como: "Crea una nueva canción que suene a Coldplay mezclado con Nirvana" . En cambio, mi indicación era más bien pedir música de cierre con sintetizadores y batería para añadir energía y emoción antes de empezar a hablar.

Al igual que en mi primer intento con Gemini, Suno creó una música de fondo que sonó perfectamente bien desde el principio. No tuve que probar más indicaciones, pero sí quería perfeccionar la introducción con una voz en off. Recurrí a Speechify, que puede convertir cualquier texto que proporciones en una voz en off. Después, usé ChatGPT para combinar la música de fondo con la voz en off como superposición. Para ser sincero, no sabía que ChatGPT permitía crear archivos de audio.

En cuestión de minutos, tenía música de introducción como corchete con voz en off. Incluso ajusté el fundido cruzado entre la música de introducción y el inicio de la voz en off, y luego lo desvanecí. Le pedí a ChatGPT que añadiera el audio del podcast para mi primer episodio y generó un archivo de audio final, que subí a Spotify.

Una cosa que hay que evitar

Me impresionaron los resultados y cómo se integró todo , pero diría que confié demasiado en la IA para mi nuevo podcast. El mosaico parecía un poco falso y sin alma, sobre todo porque la imagen que usé fue generada por IA. El audio de NotebookLM sí tiene algo más de humanidad y alma, sobre todo porque hablo con los bots, pero el episodio terminó sonando como una persona hablando con chatbots, lo cual es una receta para el desastre. La gente escucha podcasts para aprender algo nuevo, pero también porque las personas que hablan son cercanas, interesantes y reales. Al menos me motivó a hacer un podcast real sin bots involucrados sobre el mismo tema.

Mi lección principal estaba relacionada con NotebookLM. Es una buena herramienta experimental que me ayudó a descubrir cómo crear y lanzar un podcast. Sin embargo, no es más que un experimento de laboratorio. Los presentadores repiten la misma basura de audio una y otra vez, sobre todo cuando me uno a su conversación. Tras oírles decir "oh, tenemos un oyente que quiere comentar" varias veces, empiezas a sospechar que todo es una farsa generada por ordenador. Usan los mismos tics de voz y peculiares gestos auditivos una y otra vez, hasta el punto de resultar casi inaudible y molesto.

En resumen, es aburrido. El podcast no es algo que quisiera mantener en línea y, principalmente, revela que tener bots hablando entre sí de esta manera no va a captar la atención de nadie. Es casi como ver a dos computadoras jugando a un videojuego. Lo único que hay que evitar con cualquier podcast es depender demasiado de la IA que elimine a la humanidad de la ecuación.

En la evolución de la IA, quizá tengamos que decidir si ese no es un buen resultado.

La publicación El lanzamiento de mi primer podcast generado con IA de NotebookLM me enseñó una cosa que debes evitar apareció primero en Digital Trends .