Las ilusiones ópticas podrían ayudarnos a construir la próxima generación de IA

julio 16, 2022 Aranzulla de Los Pobres

Miras una imagen de un círculo negro en una cuadrícula de puntos circulares. Se parece a un agujero quemado en un trozo de material de malla blanca, aunque en realidad es una imagen fija y plana en una pantalla o una hoja de papel. Pero tu cerebro no lo comprende así. Como una experiencia alucinatoria de bajo nivel, tu mente se dispara; percibiendo la imagen estática como la boca de un túnel negro que avanza hacia ti.

Respondiendo a la verosimilitud del efecto, el cuerpo comienza a reaccionar inconscientemente: las pupilas del ojo se dilatan para dejar entrar más luz, tal como se ajustarían si estuvieras a punto de sumergirte en la oscuridad para asegurarte la mejor visión posible.

El efecto en cuestión fue creado por Akiyoshi Kitaoka , psicólogo de la Universidad Ritsumeikan en Kobe, Japón. Es una de las docenas de ilusiones ópticas que ha creado a lo largo de su dilatada carrera. ("Me gustan todos", dijo, respondiendo a la pregunta de Digital Trend sobre si tiene un favorito).

Esta nueva ilusión fue objeto de una investigación publicada recientemente en la revista Frontiers in Human Neuroscience . Si bien el enfoque del documento está firmemente en las respuestas fisiológicas humanas al efecto novedoso (que resulta que el 86 por ciento de nosotros experimentará), el tema general también puede tener mucha relevancia cuando se trata del futuro de inteligencia artificial, como uno de los investigadores estaba ansioso por explicar a Digital Trends.

Una ventaja evolutiva

una ilusión óptica conocida como la espiral de Fraser — A primera vista, podría parecer que esta imagen muestra una espiral que serpentea hacia el centro. Pero trate de seguir una de las líneas, ya que aparentemente se curva hacia adentro, y se dará cuenta de que no es una espiral en absoluto.

Algo anda mal con tu cerebro. Al menos, esa es una conclusión fácil de extraer de la forma en que el cerebro humano percibe las ilusiones ópticas. ¿Qué otra explicación hay para una imagen estática bidimensional que el cerebro percibe como algo totalmente diferente? Durante mucho tiempo, la psicología convencional pensó exactamente eso.

“Al principio, la gente pensaba: 'Vale, nuestro cerebro no es perfecto… No siempre lo hace bien'. Eso es un fracaso, ¿verdad? dijo Bruno Laeng , profesor del Departamento de Psicología de la Universidad de Oslo y primer autor del estudio mencionado. “Las ilusiones en ese caso eran interesantes porque revelarían algún tipo de imperfección en la maquinaria”.

Los psicólogos ya no los ven de esa manera. En todo caso, una investigación como esta destaca cómo el sistema visual no es solo una cámara simple. La ilusión óptica del "agujero ilusorio en expansión" deja en claro que el ojo se ajusta a la luz y la oscuridad percibidas, incluso imaginadas, en lugar de a la energía física.

Lo más significativo es que muestra que no solo grabamos el mundo de manera tonta con nuestros sistemas visuales, sino que realizamos una serie continua de experimentos científicos para obtener una ligera ventaja evolutiva. El objetivo es analizar los datos que se nos presentan y tratar de abordar los problemas de manera preventiva antes de que se conviertan en problemas.

“El cerebro no tiene forma de saber qué hay [realmente] ahí fuera”, dijo Laeng. “Lo que está haciendo es construir una especie de realidad virtual de lo que podría estar ahí fuera. Hay un poco de conjeturas. En este sentido, puedes pensar en el cerebro como una especie de máquina probabilística. Puedes llamarlo una máquina bayesiana si quieres. Está usando alguna hipótesis previa y tratando de probarla todo el tiempo para ver si funciona”.

Laeng da el ejemplo de nuestros ojos haciendo ajustes basados nada más que en la impresión de la luz del sol: incluso cuando esto se ve a través de una capa de nubes o un dosel de hojas en lo alto. Por si acaso.

“Lo que importa en la evolución no es que sea cierto [en ese momento], sino que es probable”, continuó. “Al contraer la pupila, tu cuerpo ya se está adaptando a una situación que es muy probable que suceda en un corto período de tiempo. Lo que pasa [si sale el sol de repente] es que te deslumbras. Encandilado significa incapacitado temporalmente. Eso tiene enormes consecuencias tanto si eres una presa como si eres un depredador. Pierdes una fracción de segundo en una situación particular y es posible que no sobrevivas”.

No es solo la luz y la oscuridad donde nuestros sistemas visuales necesitan hacer conjeturas. Piense en un juego de tenis, donde la pelota viaja a gran velocidad. Si basáramos nuestro comportamiento totalmente en lo que el sistema visual está recibiendo en un momento dado, nos quedaríamos atrás de la realidad y no devolveríamos la pelota. “Somos capaces de percibir el presente aunque realmente estemos atrapados en el pasado”, dijo Laeng. “La única manera de hacerlo es prediciendo el futuro. Suena un poco como un juego de palabras, pero eso es todo en pocas palabras”.

La visión artificial está mejorando

reconocimiento facial — izusek/imágenes falsas

Entonces, ¿qué tiene esto que ver con la visión artificial? Potencialmente todo. Para que un robot, por ejemplo, pueda funcionar de manera efectiva en el mundo real, debe poder realizar este tipo de ajustes sobre la marcha. Las computadoras tienen una ventaja cuando se trata de su capacidad para realizar cálculos extremadamente rápidos. Lo que no tienen son millones de años de evolución de su lado.

No obstante, en los últimos años, la visión artificial ha avanzado a pasos agigantados. Pueden identificar rostros o pasos en transmisiones de video en tiempo real, potencialmente incluso en grandes multitudes de personas. Las herramientas tecnológicas y de clasificación de imágenes similares también pueden reconocer la presencia de otros objetos, mientras que los avances en la segmentación de objetos permiten comprender mejor el contenido de diferentes escenas. También se han logrado avances significativos en lo que respecta a la extrapolación de imágenes 3D a partir de escenas 2D, lo que permite a las máquinas "leer" información tridimensional, como la profundidad, de las escenas. Esto acerca la visión de la computadora moderna a la percepción de la imagen humana.

Sin embargo, todavía existe un abismo entre los mejores algoritmos de visión artificial y los tipos de capacidades basadas en la visión que la gran mayoría de los humanos pueden llevar a cabo desde una edad temprana. Si bien no podemos articular exactamente cómo realizamos estas tareas basadas en la visión (para citar al erudito húngaro-británico Michael Polanyi, "podemos saber más de lo que podemos decir"), somos capaces de realizar una impresionante variedad de tareas que permitirnos aprovechar nuestra vista de una variedad de formas inteligentes.

Una prueba de Turing para la visión artificial

Si los investigadores e ingenieros esperan crear sistemas de visión por computadora que funcionen al menos a la par con las habilidades de procesamiento visual del cerebro húmedo, construir algoritmos que puedan comprender las ilusiones ópticas no es un mal punto de partida. Como mínimo, podría resultar una buena manera de medir qué tan bien funcionan los sistemas de visión artificial en nuestros propios cerebros. Puede que no sea la respuesta a la mítica Inteligencia General Artificial , pero podría ser la clave para desbloquear la Visión General.

una ilusión óptica que engaña a tu cerebro para que vea colores falsos — Lo creas o no, pero todas estas bolas tienen el mismo tono de gris, y tu cerebro las interpreta como si tuvieran diferentes colores según las señales contextuales de las líneas de colores que las cruzan.

“Si alguien desarrollara, algún día, un sistema visual artificial que comete los mismos errores de percepción ilusorios que cometemos, sabría en este punto que está [logrando] una buena simulación de cómo funciona nuestro cerebro”, dijo Laeng. “Sería una especie de Test de Turing. Si tienes una red artificial que se deja engañar por la ilusión como nosotros, entonces [estaríamos] muy cerca de comprender la computación subyacente del propio cerebro”.

Yi-Zhe Song , lector de visión por computadora y aprendizaje automático en el Centro de Procesamiento de Señales y Habla de Visión en la Universidad de Surrey en el Reino Unido, está de acuerdo con la hipótesis. “Pedirle a los algoritmos de visión que entiendan las ilusiones ópticas como un tema general es de gran valor para la comunidad”, dijo a Digital Trends. “Va más allá del enfoque comunitario actual de pedirle a las máquinas que [reconocan], empujando el sobre más allá [y] pidiéndoles a las máquinas que razonen. Este impulso [representaría] un importante paso adelante hacia la 'Visión general', donde es necesario adaptarse a las interpretaciones subjetivas de los conceptos visuales”.

Usa tu ilusión

Hasta la fecha, ha habido una investigación limitada hacia este objetivo, aunque se encuentra en una etapa relativamente temprana. Nasim Nematzadeh, investigador que tiene un Ph.D. en Inteligencia Artificial y Robótica-Modelos de visión de bajo nivel, es una persona que ha publicado trabajos sobre este tema .

“Creemos que una mayor exploración del papel de los modelos simples de tipo gaussiano en el procesamiento retiniano de bajo nivel y el kernel gaussiano en la etapa temprana [redes neuronales profundas], y su predicción de la pérdida de la ilusión perceptiva, conducirá a técnicas de visión por computadora más precisas. y modelos”, dijo Nematzadeh a Digital Trends. "[Esto podría] contribuir a modelos de mayor nivel de procesamiento de profundidad y movimiento y generalizarse a la comprensión informática de imágenes naturales".

Max Williams, un investigador de inteligencia artificial que ayudó a compilar un conjunto de datos de miles de imágenes de ilusiones ópticas para sistemas de visión por computadora, describe la relación entre la visión general y las ilusiones ópticas de la manera más sucinta: "Las ilusiones existen porque nuestros ojos y cerebros están realizando un desordenado y ad-hoc". proceso para extraer una escena visual de un campo de luz que de otro modo sería incomprensible, creado por un mundo físico del que estamos casi completamente aislados”, dijeron a Digital Trends. "No creo que sea posible hacer que un sistema visual sea lo suficientemente expresivo como para ser considerado 'percepción' que también esté libre de ilusiones".

Lograr la visión general

Para ser claros, lograr una visión general a nivel humano (o mejor) para la IA no será simplemente entrenarlos para reconocer ilusiones ópticas estándar. Ninguna capacidad hiperespecífica para, por ejemplo, decodificar las ilusiones del Ojo Mágico con una precisión del 99,9 % en 0,001 segundos sustituirá a millones de años de evolución humana.

(Curiosamente, la visión artificial ya tiene su propia versión de ilusiones ópticas en forma de modelos antagónicos, lo que puede hacer que confundan, como en una ilustración alarmante, una tortuga de juguete impresa en 3D con un rifle . Sin embargo, estos no producen el mismos beneficios evolutivos que las ilusiones ópticas que funcionan en humanos).

Aún así, lograr que las máquinas entiendan las ilusiones ópticas humanas y respondan a ellas de la forma en que lo hacemos, podría ser una investigación muy útil.

Y una cosa es segura: cuando se logre General Vision AI, caerá en los mismos tipos de ilusiones ópticas que nosotros. Al menos, en el caso del Agujero Ilusorio en Expansión, el 86% de nosotros.