La primera investigación que publiqué sobre sports analytics fue en 2010 (aunque la escribí en 2009), y puede descargarse el pdf en esta web. Esa investigación originariamente se iba a titular con el rimbombante encabezado de «Un método para cambiar la historia de los rankings estadísticos de jugadores de baloncesto», aunque finalmente uno de los revisores fue más conservador y sugirió que se quedase en «Un método probabilístico para las clasificaciones estadísticas de jugadores de baloncesto». Yo creo que el título original explica mucho mejor lo que sucedería si el enfoque que propongo en el artículo se llevara a cabo. Como podréis ver, es una perspectiva nada descabellada, y pienso que es chocante como, a día de hoy, nadie se plantea cambiarlo. Veamos cuál es la historia:
Los rankings estadísticos
Los rankings estadísticos no son más que clasificaciones ordenadas de jugadores en función de una característica del juego. Esa jerarquización de los jugadores se emplea para identificar jugadores «top», y lo que es más importante, supone una plataforma mediática muy importante cuando ese jugador encabeza el ranking. Como comentaba en el artículo:
«en la Liga ACB, el “Jugador de la Jornada” es un honor que recae sobre el jugador mejor valorado estadísticamente. Hasta hace unos pocos años, concretamente hasta la temporada 2003/2004, el “Jugador más Valioso” o MVP de la temporada era otorgado también por criterios puramente estadísticos, aunque a partir de ese año, esa concesión es responsabilidad de un jurado de expertos. No obstante, las valoraciones estadísticas son un factor clave en la elección de esos expertos. Lo mismo ocurre con el MVP del mes, donde el criterio estadístico fue sustituido en la temporada 2008/2009».
Y continuaba más adelante:
«Las estadísticas individuales (puntos, rebotes, asistencias, etc.) que son las que construyen esos índices de valoración, tienen un protagonismo particular. Así, en todas las competiciones aparecen las clasificaciones de los principales apartados estadísticos individuales. En la ACB, además, se denominan “Triunfadores estadísticos” a quienes vencen en cada categoría, teniendo también su relevancia mediática, la cual se disemina entre los medios especializados, que su vez potencian la noticia. En la Euroliga, por ejemplo, se otorga el “Trofeo Alphonso Ford” al máximo anotador de la competición, teniendo el premio una cobertura mediática similar al de MVP. En el portal global de baloncesto más importante, www.eurobasket.com, se muestran los primeros puestos del ranking de puntos, rebotes, asistencias, recuperaciones y pérdidas de todas las ligas del mundo donde existen datos disponibles. Dado que uno de los objetivos de ese portal es que sirva como referencia a agentes, entrenadores y directivos para contratar jugadores, las clasificaciones estadísticas se convierten en un aspecto importante en la revalorización de los mismos. Estadísticas similares son también reportadas por www.keyhoops.com, aunque sólo referidas a las principales ligas europeas y norteamericanas»
El problema de cómo están construidos los rankings
El problema del sistema actual del establecimiento de rankings es muy sencillo de entender. Si lo que se pretende evaluar es, por ejemplo, quien al final de la temporada es el máximo anotador de la competición ACB, el valor del marco muestral o poblacional (en este caso es lo mismo) sería de 34 (todos los partidos de la liga regular). Como lo que estamos buscando es identificar al jugador que más media de puntos ha obtenido en 34 partidos, ese valor llevaría un error asociado si el jugador jugara menos de 34 partidos. Por ejemplo, si el jugador hubiera disputado 30 partidos la media de puntos sería una estimación del parámetro poblacional, que es el que verdaderamente nos interesa.
Realmente, para los jugadores que juegan menos de 34 partidos (por lesiones, decisiones del entrenador, etc.), no podemos conocer exactamente cuál sería su valor promedio de puntos. Aquí deberíamos de considerar la limitación de tener en cuenta la aleatoriedad en los partidos no jugados. Es como si estuviéramos haciendo un control de calidad en una fábrica industrial sobre 34 productos y cogiéramos sólo una parte de ellos ya que sería muy caro e inviable cogerlos todos. Lo que estamos haciendo aquí es usar un procedimiento estadístico de estimación. A ningún especialista que controlara la calidad en la empresa se le ocurriría dar un valor puntual sin un error asociado. Lo mismo ocurre, por ejemplo, con las encuestas de intención de voto; sabemos que los valores obtenidos son estimaciones (aunque muchas veces no se sepan interpretar correctamente).
Por tanto, si no admitimos este hecho y, por ejemplo, un jugador jugara 30 partidos y obtuviera 20,1 puntos de media, y otro jugara 29 y obtuviera 19,9, si diéramos como vencedor absoluto de ese ranking al primer jugador estaríamos probablemente cometiendo una injusticia estadística, es decir, estaríamos incurriendo en el título de este post: haciendo «estadísticas sin estadística».
El método propuesto
El método propuesto está detallado paso a paso en el artículo, por lo que sugiero que para un mayor detalle lo leáis tranquilamente. No he inventado nada nuevo, sólo he aplicado estadística existente. Se basa en la estimación de un error máximo admisible a la estimación para decidir si ese jugador entra en el ranking o no. Es decir, un jugador con pocos partidos no podría entrar en el ranking porque el error cometido en la estimación sería tan grande que no sabríamos si es un gran anotador o un anotador mediocre. La NBA tiene en sus rankings un número mínimo de partidos para poder ser incluido, pero su método adolece de cualquier estimación del error.
Una vez calculado el valor del error máximo admisible para cada categoría estadística, se podría calcular el tamaño de muestra mínimo para cada jugador, en función de la estimación de su varianza para cada categoría.
De este modo eliminaríamos del ranking final aquellos jugadores que no hubieran jugado el número de partidos mínimo en cada temporada. Esto sería mucho más justo porque nos aseguraríamos que la estimaciones de su valor promedio son mucho más precisas.
Llegados a este punto habría que comparar los jugadores del ranking dos a dos en base a algún índice de tamaño de efecto, que no es más que una especie de tolerancia por debajo de la cual considero a los valores de las estimaciones iguales y por encima los considero diferentes. Como explico en el artículo si un jugador anotase 707 puntos en 32 partidos y otro 704 en esos mismos partidos, el valor del tamaño de efecto en promedio sería de= 0.093 < 0.1, por lo que ambos jugadores compartirían la misma posición en el ranking. Parece justo decir que si uno anota sólo 3 puntos más que otro en 34 partidos, ambos se merecerían el primer puesto. Esto es lo que nos indica esa fijación del tamaño de efecto.
Evidentemente este método no está exento de problemas, al utilizar contrastes estadísticos las diferencias entre distintas posiciones en el ranking no cumplirían las propiedades de la distancia cartesiana. Es decir, si las comparaciones estadísticas nos dan el siguiente patrón: a = b , b = c , y a <> c , entonces ocurriría una paradoja, y es que d(a,b) = 0 , d(b,c) = 0 y d(a,c) =1, lo que desde el punto de vista cartesiano es incongruente, ya que si d(a,b) = 0 y d(b,c) = 0 , entonces d(a,c) debería ser también cero.
Para evitar este problema proponemos no realizar un ranking numérico de jugadores con las posiciones delimitadas como se hace actualmente, sino realizar una comparación entre el líder de cada categoría y el resto, con el fin de crear un ranking descendente pero sin delimitación definida de posiciones. Realmente, desde el punto de vista mediático, la primera posición es la que más interesa, por lo que el hecho de que un jugador ocupe, por ejemplo, el quinto o sexto puesto, queda en un segundo plano.
Esto no quiere decir que no se ordene descendentemente a los jugadores, ni que se puedan comparar entre ellos. Así, todos los jugadores tendrán una medida de distancia con respecto al primero, por lo que las distancias entre éstos se podrían comparar. Asimismo, siempre se pueden realizar comparaciones “dos a dos” para analizar si las puntuaciones de dos jugadores concretos son iguales o diferentes desde el punto de vista estadístico. De cualquier manera, el ranking resultante clasificará a los jugadores de forma descendente, y los intervalos de confianza de la diferencia de medias con respecto al primero del ranking, servirá como criterio para evaluar su posición en la clasificación.
¿Los rankings cambiarían?
Claro que sí, no todos, pero sí algunos de ellos. Para el análisis realizado en el artículo de la temporada 2008/2009 había cambios en la primera posición de los rankings de: rebotes, asistencias y recuperaciones. En los tapones, el primer puesto debió de ser compartido.
Alguno pensará que esto no es importante, pero desde el punto de vista de marketing sabemos que la trascendencia de ser el primero es fundamental.
Cualquiera de vosotros puede emplear mi método para estudiar lo que habría pasado en la NBA y en la ACB desde entonces hasta esta temporada. Puede ser que nos encontráramos con sorpresas.
Conclusión
Es cierto que para el aficionado es mucho más fácil entender e interpretar el sistema actual de creación de rankings que, como hemos dicho, es común en todas las ligas del mundo. Sin embargo, esto no es razón suficiente para dejar de buscar nuevos sistemas, que aporten nuevas ideas, y que tal vez den una visión más ajustada a la realidad de la temporada.
Al menos la ACB o la NBA podrían pensar en establecer sus rankings actuales y luego dar unos alternativos basados en un criterio estadístico más correcto. A las personas les cuesta entender la inferencia estadística (y a muchos de nosotros, los investigadores, también, que conste), pero si consiguiéramos ser más puntillosos con estos temas ayudaríamos a mejorar la cultura científica.
1 comentario en «ESTADÍSTICAS SIN ESTADÍSTICA»
Los comentarios están cerrados.