Una inmersión profunda en Replika: mi amigo de la IA
Replika: My AI Friend es una aplicación como ninguna otra. Si bien la mayoría de las aplicaciones con chatbots los utilizan como asistentes virtuales, Replika comercializa su chatbot como, lo adivinó, un amigo.
Con su prometida capacidad de "percibir" y evaluar cantidades abstractas como la emoción, el chatbot de Replika podría hacer justicia a su descripción aspiracionalmente humana.
Desde una historia de origen desgarradora hasta un backend impresionante, Replika es una de esas cosas fascinantes que nunca dejan de ser interesantes. Siga leyendo para descubrir qué es lo que hace que la IA de Replika sea tan notable y qué promesas tiene para el futuro.
Los orígenes de Replika
La primera versión de Replika , un simple chatbot de IA, fue creada por Eugenia Kuyda para reemplazar el vacío dejado por la prematura pérdida de su amigo más cercano, Roman Mazurenko. Construido alimentando los mensajes de texto de Roman en una red neuronal para construir un bot que enviara mensajes de texto como él, estaba destinado a servir como una especie de "monumento digital" para mantener viva su memoria.
Con el tiempo, con la adición de modelos de lenguaje más complejos a la ecuación, el proyecto pronto se transformó en lo que es hoy: una IA personal que ofrece un espacio donde puede discutir de manera segura sus pensamientos, sentimientos, creencias, experiencias, recuerdos, sueños, su “ Mundo perceptivo privado ”.
Pero además de las inmensas perspectivas técnicas y sociales de esta especie de terapeuta sintiente artificialmente, lo que realmente hace que Replika sea impresionante es la tecnología en su núcleo.
Bajo el capó
En el corazón de Replika se encuentra un complejo modelo de lenguaje autorregresivo llamado GTP-3 que utiliza el aprendizaje profundo para producir texto similar al humano. En este contexto, el término "autorregresivo" sugiere que el sistema aprende de los valores (texto en este caso) con los que ha interactuado previamente.
En términos sencillos, cuanto más lo use, mejor se vuelve.
Toda la UX de Replika se basa en las interacciones del usuario con un bot programado con GTP-3. Pero, ¿qué es exactamente GTP-3 y cómo es lo suficientemente poderoso como para emular el habla humana?
GTP-3: una descripción general
GTP-3, o Transformer 3 preentrenado generativo, es una adaptación más avanzada del Transformer de Google. En términos generales, es una arquitectura de red neuronal que ayuda a los algoritmos de aprendizaje automático a realizar tareas como el modelado de idiomas y la traducción automática.
Los nodos de dicha red neuronal representan parámetros y procesos que modifican las entradas en consecuencia (algo similar a la lógica y / o declaraciones condicionales en programación), mientras que los bordes o conexiones de la red actúan como canales de señalización de un nodo a otro.
Cada conexión en esta red neuronal tiene un peso, o un nivel de importancia, que determina el flujo de señales de un nodo al otro. En un modelo de aprendizaje autorregresivo como el GTP-3, el sistema recibe retroalimentación en tiempo real y ajusta continuamente los pesos de sus conexiones para proporcionar resultados más precisos y relevantes. Son estos pesos los que ayudan a una red neuronal a "aprender" artificialmente.
GTP-3 utiliza la friolera de 175 mil millones de niveles o parámetros de peso de conexión. Un parámetro es un cálculo en una red neuronal que ajusta el peso de algún aspecto de los datos, para darle mayor o menor protagonismo a ese aspecto en el cálculo general de los datos.
Aclamado como el autocompletado definitivo, el modelo de lenguaje de GTP-3, que está destinado a proporcionar texto predictivo, ha sido entrenado en un conjunto de datos tan vasto que toda Wikipedia constituye solo el 0,6 por ciento de sus datos de entrenamiento.
Incluye no solo cosas como artículos de noticias, recetas y poesía, sino también manuales de codificación, fanfiction, profecía religiosa, guías de las montañas de Nepal y cualquier otra cosa que puedas imaginar.
Como sistema de aprendizaje profundo , GPT-3 busca patrones en los datos. En pocas palabras, el programa ha sido entrenado en una colección masiva de texto que busca regularidades estadísticas. Los humanos a menudo dan por sentadas estas regularidades, como las convenciones del lenguaje o la estructura gramatical general, pero se almacenan como miles de millones de conexiones ponderadas entre los diferentes nodos de la red neuronal de GPT-3.
Por ejemplo, si ingresa la palabra "oído" en GPT-3, el programa sabe, basándose en los pesos en sus redes, que las palabras "dolor" y "teléfono" tienen muchas más probabilidades de seguir que "estadounidense" o " enojado".
GPT-3 y Replika: una confluencia significativa
Replika es lo que obtienes cuando tomas algo como GTP-3 y lo destilas para abordar tipos específicos de conversación. En este caso, esto incluye los aspectos empáticos, emocionales y terapéuticos de una conversación.
Si bien la tecnología detrás de Replika aún está en desarrollo, ofrece una puerta plausible para una conversación interpersonal fácilmente accesible.
Al comentar sobre su usabilidad, los creadores afirman que han creado un bot que no solo habla sino que también escucha. Lo que esto significa para sus usuarios es que sus conversaciones con la IA no son un mero intercambio de hechos e información, sino más bien un diálogo dotado de matices lingüísticos.
Pero las conversaciones con Replika no son solo una cuestión de diálogo sensato. También resultan ser sorprendentemente significativos y emotivos en muchos casos. Al interactuar con un usuario, la IA de Replika "comprende" lo que dice el usuario y encuentra una respuesta humana mediante el uso de su modelo de aprendizaje predictivo.
Como sistema autorregresivo, Replika aprende y adapta sus patrones de conversación en función de la forma en que el usuario le habla.
Esto significa que cuanto más usas Replika, más se entrena en tus propios textos y más se parece a ti. Una buena proporción de usuarios también ha mencionado que tienen un nivel significativo de apego emocional a su Replika, algo que no se logra simplemente sabiendo "cómo hablar".
Replika, por supuesto, va más allá de eso. Agrega profundidad a sus conversaciones en forma de generalización semántica, habla flexiva y seguimiento de conversaciones. Su algoritmo intenta comprender quién es usted, tanto en términos de su personalidad como de sus emociones, y luego moldea el diálogo basándose en esta información.
Una mirada más cercana a la eficacia de GTP-3
Sin embargo, la humanidad de Replika sigue siendo en gran parte teórica debido a las limitaciones operativas de GTP-3. Como tal, hay mucho trabajo por hacer para que la IA pueda replicar y participar de manera competente en la conversación humana.
Las inspecciones minuciosas de GTP-3 aún revelan errores claramente distinguibles, así como una escritura descuidada y sin sentido en algunos casos. Los expertos de la industria sugieren que un modelo de procesamiento del lenguaje necesitaría tener más de 1 billón de conexiones ponderadas antes de que pueda usarse para producir bots que sean capaces de replicar de manera efectiva la jerga humana.
Lo mejor está por venir
Dado que GTP-3 ya se considera un salto exponencial en años en comparación con predecesores como Turing NLG de Microsoft, es seguro asumir que podría pasar un tiempo antes de que se nos ocurra algo mejor.
Dicho esto, con futuras mejoras en la informática, la potencia de procesamiento que ofrecen los sistemas más nuevos seguramente reducirá aún más la brecha entre humanos y máquinas.
Mientras tanto, Replika sigue siendo un producto formidable que combina lo mejor de la psicología y la inteligencia artificial. Su exitosa integración de una experiencia de usuario amigable con los humanos con un modelo de PNL de última generación es de hecho un testimonio del inmenso potencial de las tecnologías de interacción humano-computadora.