Locura de marzo, revisitada: El modelo de IA funcionó bien. Pero aún ocurren cosas increíbles.

( NOTA : Este artículo forma parte de una serie en curso que documenta un experimento sobre el uso de la IA para completar los cuadros del torneo de la NCAA y ver cómo se compara con años de experiencia humana . El artículo original es el siguiente.)

Hace una semana escribí sobre cómo participar en una quiniela del torneo de la NCAA con un proceso más disciplinado del que suelo usar.

En lugar de basarme en las mascotas, el ambiente o cualquier equipo que luciera bien el sábado por la tarde, intenté pensar en el cuadro de eliminatorias como lo haría un inversor o analista: separar las previsiones brutas del valor esperado, construir un cuadro en torno a la mayor probabilidad de éxito, construir otro en torno a la dinámica del grupo y tomar decisiones con al menos cierta conciencia de la incertidumbre.

Ese proceso generó dos cuadros de eliminatorias. Uno era el cuadro de "más probables", diseñado para maximizar las probabilidades de obtener una buena puntuación si el torneo seguía un curso mayormente racional. El otro era un cuadro de valor esperado (EV) para un grupo de aproximadamente 70 participantes; no se trataba de una apuesta arriesgada y poco convencional, sino de algo diseñado para ganar una competición real en lugar de simplemente parecer sensato.

¿Y cómo resultó eso?

Bastante bien, la verdad. Simplemente no a la perfección.

El modelo acertó con 13 de los equipos del Sweet 16, lo cual es objetivamente sólido en un torneo diseñado para castigar la confianza y premiar el caos. La arquitectura general del pronóstico se mantuvo. Identificó a la mayoría de los verdaderos pesos pesados. Acertó en la dirección sobre los equipos con más probabilidades de sobrevivir al primer fin de semana. En general, se entiende que la forma del campo.

Pero, como suele ocurrir en marzo, también encontró los puntos débiles.

Los errores más evidentes fueron los de Ohio State, Wisconsin y Florida. Ohio State perdió 66-64 contra TCU con una canasta en los últimos instantes. Wisconsin cayó 83-82 ante High Point, número 12 del ranking. Florida, el vigente campeón nacional y cabeza de serie número 1, perdió 73-72 contra Iowa con un triple que les dio la ventaja en los últimos segundos. No fueron colapsos lentos y predecibles. Fueron derrotas por una sola posesión, decididas en los momentos finales, justo el tipo de resultados que te recuerdan que ningún modelo de torneo puede funcionar en un laboratorio.

Eso deja dos posibles interpretaciones.

Una de las razones es que el modelo era erróneo.

La otra posibilidad es que el modelo fuera mayormente correcto, pero el baloncesto de eliminación directa es un entorno terrible para la certeza.

La respuesta, como siempre, es ambas.

La buena noticia es que acertar con 13 de los 16 equipos del Sweet 16 sugiere que el marco básico fue útil. No fue casualidad. No fue un mero adorno. No se trató simplemente de usar palabras más sofisticadas para llegar a las mismas conclusiones intuitivas que todos los demás. A la hora de identificar la calidad, funcionó.

La noticia menos alentadora es que los fallos también resultaron instructivos.

En retrospectiva, el proceso aún se inclinaba demasiado hacia la idea de que "el mejor equipo suele avanzar". Esto suele ser cierto a lo largo de una temporada, pero no tanto en 40 minutos en un pabellón neutral, sobre todo cuando el equipo menos favorito puede generar incertidumbre. La derrota de Wisconsin es el ejemplo más claro. Un modelo de predicción de sorpresas más sólido no necesariamente habría elegido a High Point como ganador, pero probablemente habría considerado a Wisconsin más vulnerable que yo: más susceptible a un partido donde el equipo menos favorito se inspira con los triples, pone en aprietos al favorito y convierte los últimos dos minutos en un partido de infarto.

La derrota de Florida demuestra algo similar a un nivel superior. Se supone que un cabeza de serie número 1 nunca tiene probabilidades de perder pronto, pero hay una diferencia entre ser fuerte y ser invulnerable. El modelo acertó al respetar a Florida. Probablemente fue un error considerarla un rival seguro.

Esa distinción importa si lo que se busca es ganar una quiniela, en lugar de simplemente defender la dignidad.

Aquí es donde la cosa se pone interesante. En los mercados, en las inversiones y en las quinielas, hay una gran diferencia entre tener razón en líneas generales y estar bien posicionado. Un pronóstico puede ser inteligente y aun así no captar dónde reside la verdadera fragilidad. El torneo no premia el estilo por tener el mejor marco de análisis si sigues subestimando la posibilidad de que un equipo con pocas probabilidades de ganar empiece a anotar puntos.

¿Qué cambiaría yo?

Esa no es la idea principal. Sigo pensando que la forma correcta de abordar un torneo es separar la predicción de mayor probabilidad de la estrategia de valor esperado. La mayoría de la gente las mezcla sin darse cuenta. Eligen a un campeón que creen que puede ganar, pero luego hacen algunas predicciones arbitrarias para "darle emoción", lo que en realidad es solo otra forma de admitir que no tienen un proceso coherente.

Lo que mejoraría es la capa de volatilidad.

Una versión mejorada de este enfoque prestaría más atención a qué favoritos son realmente sólidos y cuáles solo aparentan serlo en una hoja de cálculo. Mediría de forma más explícita la varianza de los triples, el riesgo de pérdidas de balón, los problemas de faltas, la dependencia de un único anotador y la frecuencia con la que los resultados de un equipo fluctúan drásticamente de un partido a otro. Seguiría respetando a los favoritos, pero desconfiaría más de ellos.

Eso importa aún más ahora porque, por supuesto, los corchetes originales están bloqueados.

Llegados a este punto, nadie puede afirmar que "habría tenido Iowa" a menos que realmente la haya tenido. Esa es parte de la belleza y la crueldad de todo el asunto. Una vez que comienzan los juegos, tu brillante planteamiento se convierte en un documento histórico.

Pero eso no significa que el proceso deje de ser útil.

Para empezar, podrían existir rondas de repesca. Muchos torneos se reinician en los octavos de final o en la semifinal, lo cual es una ventaja para quienes aprecian el proceso. Una ronda de repesca elimina la ilusión de creer que lo sabemos todo de antemano. Ahora contamos con información nueva, un grupo más reducido de participantes y una nueva oportunidad para distinguir a los equipos verdaderamente fuertes de los que simplemente sobreviven.

Más importante aún, este ejercicio sigue ofreciendo la lección principal que esperaba explorar en esta serie: la previsión rigurosa no consiste en eliminar la incertidumbre, sino en hacerla comprensible.

El modelo funcionó bien. March aún tenía otras ideas.

Eso no es un fracaso. Ese es el objetivo.

Y si existe una segunda oportunidad, volveré a participar, pero más viejo, más sabio y un poco menos dispuesto a confiar en un favorito vulnerable solo porque su posición en el ranking indica que debería hacerlo.

Locura de marzo, revisitada: El modelo de IA funcionó bien. Pero aún ocurren cosas increíbles.

¿Y cómo resultó eso?

La noticia menos alentadora es que los fallos también resultaron instructivos.

¿Qué cambiaría yo?

Más entradas

Los portátiles plegables anchos parecen una solución a muchos problemas y estoy deseando que Apple lo intente.

La serie Honor 600 apunta a la corona de los teléfonos insignia asequibles con potencia Snapdragon y una batería de 7000 mAh.

Opera One mejora la experiencia de ver vídeos con un aumento de volumen del 500 %, una función PiP mejorada y compatibilidad con la transmisión en la barra lateral.

Motorola acaba de lanzar un teléfono de gama media delgado con una batería realmente voluminosa.