Esta IA permite que los coches autónomos “recuerden” los trayectos anteriores para planificar rutas más seguras.

Uno de los mayores problemas de los sistemas de conducción autónoma es que, si bien pueden ver perfectamente la carretera, toman decisiones precipitadas a corto plazo en el caótico tráfico urbano. Los sistemas avanzados tienen dificultades para adaptarse a situaciones viales complejas y cambiantes. Sin embargo, un nuevo estudio sostiene que estos vehículos no necesitan mejor visión, sino mejor memoria.

En el artículo revisado por pares KEPT (Knowledge-Enhanced Prediction of Trajectories from Consecutive Driving Frames with Vision-Language Models) , investigadores de la Universidad de Tongji y colaboradores desarrollaron un sistema que ayuda a los vehículos autónomos a "recordar" escenas de conducción pasadas antes de elegir qué hacer a continuación.

¿Cómo funciona esta nueva tecnología de conducción autónoma?

El método, llamado KEPT, utiliza vídeo de la cámara frontal, lo compara con una amplia biblioteca de grabaciones de conducción reales anteriores y predice una trayectoria a corto plazo más segura basándose tanto en la escena actual como en ejemplos recuperados del pasado. La idea principal es bastante intuitiva. En lugar de pedirle a un modelo de IA que reaccione a cada situación como si nunca hubiera visto nada parecido, KEPT le permite recordar momentos similares de conducción previa.

Estos ejemplos se introducen en un modelo de lenguaje visual como parte de un proceso de razonamiento estructurado. Esto es importante, ya que los investigadores afirman que, de lo contrario, los modelos de lenguaje visual complejos pueden generar ilusiones, ignorar las limitaciones físicas o sugerir movimientos que parecen plausibles en teoría, pero que no son adecuados para un automóvil real. Por lo tanto, KEPT actúa básicamente como una guía para mantener el modelo basado en cómo se ven situaciones de tráfico similares en el mundo real.

¿Es mejor que los sistemas autónomos convencionales?

Los investigadores probaron KEPT en el ampliamente utilizado benchmark nuScenes y afirmaron que superó tanto a los sistemas de planificación integrales convencionales como a los planificadores más recientes basados ​​en lenguaje de visión en métricas de bucle abierto. Incluso logró reducir el error de predicción y disminuir los indicadores de colisión potenciales, manteniendo al mismo tiempo una recuperación lo suficientemente rápida como para ser práctica para la conducción en tiempo real.

Esto podría hacer que parezca una opción obvia para los coches autónomos de próxima generación, pero aún no está listo para circular. Aun así, la idea general es atractiva. Si los coches autónomos pueden combinar la percepción en tiempo real con un recuerdo significativo de cómo se desarrollaron situaciones similares anteriormente, podrían llegar a tomar decisiones menos precipitadas y más humanas.