martes, 15 de noviembre de 2022

"INTRODUCCIÓN A LAS ESTADISTICAS AVANZADAS EN EL BALONCESTO".

Desde muy joven odiaba las matemáticas y sin embargo me encantaba el baloncesto. Ahora resulta paradójico que según van pasando los años el baloncesto moderno se va convirtiendo en un juego donde se puede medir casi todo de forma matemática y se calculan parámetros del juego con endemoniadas fórmulas.
Puede carecer de sentido que un juego que transcurre con tantas acciones explosivas e imprevisibles se pueda medir con instrumentos matemáticos.
Y es que antes se medían muchos menos parámetros de nuestro amado deporte . Se hacía a través de unas estadísticas "primitivas", pero vamos a ver que todo ha ido cambiando de forma exponencial y quién sabe donde está límite. 

Aquí en España desde el año 1992, la Liga ACB introdujo un sistema para determinar quién había sido el mejor jugador del partido. Antes se medían únicamente los puntos, los rebotes y las asistencias. 

Con el nuevo sistema comenzaron a medirse los tapones, los balones robados o las faltas recibidas, algo que en la actualidad nos parece imprescindible para cualquier aficionado que siga este deporte de una manera continúa, pero es que llegarían a la actualidad muchísimas más estadísticas desde el otro lado del Atlántico donde los americanos nos sacan décadas de ventaja. 

Como se hace evidente que los números están cada vez más presentes en el baloncesto nada mejor que leer lo que opina un reputado matemático como Pablo Mira (Universidad Politécnica de Cartagena) sobre nuestro amado juego, que además es un gran aficionado al baloncesto (@NdeBasket) en twitter:

Pablo Mira
  "El baloncesto es complicadísimo de modelizar porque no son unos pocos fenómenos que tienes que ver y ya está. Tienes a diez personas corriendo por la pista y haciendo un montón de diseños complicados de esquemas de juego y, en una misma jugada, resulta que uno pierde el balón pero realmente la acción está en otro lugar de la pista con un bloqueo indirecto".

Leyendo a los que entienden de números y además amán el baloncesto , me animo a llegar un poquito más allá con este artículo a vivir la aventura de entender un poco más el baloncesto a través de la evolución de las estadísticas básicas a las más avanzadas.

Con estas líneas sólo quiero despertar la curiosidad de los que quieren conocer algunas estadísticas avanzadas de una forma "básica" y que cada uno decida hasta donde quiera llegar ya que hay multitud de parámetros y fórmulas que no voy a entrar.
Vamos allá!

La Valoración, la primera estadística avanzada
Como estamos hablando de la repercusión y evolución de las estadísticas en el baloncesto, vamos a hablar de la primera piedra para construir la estadística avanzada: La valoración que se calcula con la siguiente fórmula : 

Puntos+rebotes+asistencias+recuperaciones+faltas recibidas+tapones efectuados. A esa suma se le restan: tiros fallados, pérdidas, tapones recibidos y faltas cometidas.

 "Una simple fórmula de sumar lo positivo y restar lo negativo te daba la primera gran estadística avanzada: la valoración", dice Raúl Barrigón, redactor jefe de Hoopshype, la reputada página especializada en NBA de USA Today

Además añade "Pero con la estadística avanzada añade muchísimo contexto. Por ejemplo no es lo mismo meter 10 puntos por partido en 20 minutos de media que en 34 minutos
El matemático Pablo Mira opina que con los sistemas de valoración que se emplean en España, por ejemplo, "se pierde muchísimo, lo que pasa es que hay que mantener un equilibrio". Aunque apostilla que "Si tienes un modelo muy complejo, al final no sabes muy bien qué estás midiendo".

También es verdad que los clubes de Europa -salvo algunas excepciones- cuentan con una o dos personas en su secretaría técnica, frente a los más de 30 analistas y ojeadores de una franquicia normal en la NBA

Por ejemplo, John Hollinger, autor de uno de los libros referencia sobre análisis de jugadores, Basketball Prospectus (2001), fue contratado por los Memphis Grizzlies como vicepresidente de operaciones deportivas. Mientras los métodos de evaluación en España y el resto de Europa resultan anticuados, la ciencia avanza en Estados Unidos junto al deporte de élite. 

 Hay modelos que pueden mostrar lo bueno que es un jugador dependiendo del +/- (número que se le asigna a un jugador basado en el marcador durante los minutos que está en cancha), no sólo el suyo individual sino en función del +/- de sus cuatro compañeros y de los cinco rivales. 

De esta forma, si hay un jugador con un +/- muy bueno porque está rodeado de jugadores muy buenos, se puede demostrar que ese jugador tiene en realidad menos peso del que su valoración muestra. "Ese tipo de análisis está muy bien", dice Mira, "pero cuando empiezas a implementar ese proceso estadístico comienza a generar ruido y no sabes si realmente es culpa del análisis o estás descubriendo algo sobre un valor real jugador". "Cuando las matemáticas se vuelven complejas quizá no son muy útiles para el aficionado", agrega. 

Por su parte, Marc Stein, reputado reportero de la ESPN, dice a EL ESPAÑOL que no cree que sea tan difícil de entender para los aficionados: "El seguidor moderno de la NBA es mucho más listo que los de mi generación porque llevan años escuchando cómo los equipos se preocupan de las mediciones y de los números que acarrean el juego"
 

El estudio matemático de las posesiones como introducción a la estadistica avanzada: 

Las “posesiones de balón” son seguramente uno de los aspectos más importantes del juego y para estudiarlo he recuperado breves extractos del fabuloso y detallado estudio "A Starting Point for Analyzing Basketball Statistics" de Justin Kubatko  donde se realizó un estudio extenso y concienzudo de las posesiones en 4 temporadas de la NBA a través de conceptos, estadísticas avanzadas y una concluyente recogida de datos: 

De esta manera vamos a manejar los conceptos que sirven de fuentes de datos para analizar las estadísticas avanzadas del baloncesto:

 1.Definición de posesiones:

Es el punto de partida de las estadísticas del baloncesto. Una posesión comienza cuando un equipo obtiene el control (o la posesión) de la pelota de baloncesto y finaliza cuando ese equipo cede el control de la pelota.
 Los equipos pueden ceder la posesión de la pelota de varias maneras, incluyendo (1) tiros de campo o tiros libres que llevan al otro equipo a sacar la pelota fuera de los límites, (2) rebotes defensivos y (3) pérdidas de balón. 

Hay que tener en cuenta que, según esta definición de posesión, un rebote ofensivo no inicia una nueva posesión; un rebote ofensivo inicia una nueva jugada. 

Se garantiza que las posesiones sean aproximadamente iguales para dos equipos en un juego (dentro de dos para un juego sin tiempo extra), por lo que las posesiones brindan una base útil para evaluar la eficiencia de equipos e individuos. 


Para ganar, los equipos y las personas intentan sumar más puntos por posesión que sus oponentes. Dada la centralidad del concepto de posesión, es sorprendente que esta no sea una estadística registrada oficialmente en la mayoría de los juegos de baloncesto.
Sin embargo, las posesiones se pueden contar usando registros de juego jugada por jugada.
Las posesiones también se pueden estimar utilizando datos de puntuación de caja comúnmente disponibles. 

Una fórmula general para estimar las posesiones del equipo t (POSSt) es: 

Por supuesto que el estudio va mucho más allá en detalles de fórmulas y desarrollo pero sólo quería enseñar una breve muestra de hasta donde se puede llegar en este apartado del juego en lo estadístico.


2.Términos básicos en estadísticas de baloncesto Clasificación ofensiva y defensiva 
Tras haber llegado a la definición de posesiones con formulas matemáticas , el siguiente paso sería utilizarlas para evaluar la eficiencia en el juego a través del estudio mencionado de  Justin Kubatko.


El término común para la eficiencia por posesión es una "calificación". En concreto, los puntos anotados y permitidos por cada 100 posesiones se han denominado rating ofensivo y rating defensivo, respectivamente, para el equipo

Clasificación ofensiva(ORtgt) = PTSt/POSSt × 100 

Valoración defensiva(DRtgt) = PTSo/POSSo × 100 


Las medidas tradicionales de ataque y defensa del equipo (puntos anotados y permitidos por juego, respectivamente) reflejan tanto la eficiencia de un equipo como el ritmo al que juega.
 
Dado que, en cualquier partido, el número de posesiones se dicta por ambos participantes y es aproximadamente igual para ambos participantes, la eficiencia con el balón es lo que finalmente gana; por lo tanto, esta medida aísla mejor la calidad de la ofensiva y la defensa de un equipo. 
Como tal, la mayoría de los estudios sobre el desempeño de los equipos se basan en estas "calificaciones". 


Estadísticas por minuto 
Otro avance importante para el análisis de la NBA fue descubrir que las estadísticas calculadas por minuto tienden a ser bastante consistentes incluso cuando los minutos jugados por un jugador son variables. 
Esto permite realizar comparaciones directas de titulares y suplentes que juegan menos minutos (las estadísticas por minuto se vuelven poco fiables para los jugadores que han jugado muy pocos minutos; por lo general, se utilizan 500 o 1000 minutos jugados en una temporada de la NBA como punto de corte).
A veces, las estadísticas por minuto se denominan "Rates" (tasas); la tasa de puntuación para el jugador p, por ejemplo, es puntos anotados por 40 minutos (PTS40p): PTS40p= PTSp/MINp × 40,
donde PTSp son puntos para el jugador p y MINp son minutos para el jugador p. 

El erudito de la estadística avanzada en baloncesto, Hollinger (2003, 2004, 2005) ha utilizado una base de 40 minutos a pesar de que los partidos de la NBA duran 48 minutos. 

Debido a que los partidos de la NCAA , FIBA, Euroliga, ACB etc., duran 40 minutos y los jugadores de la NBA rara vez juegan más de 40 minutos por juego, es un buena base este minutaje para desarrollar dichas estadísticas,

Porcentaje de tiros reales y porcentaje de tiros de campo efectivos

Porcentaje de tiros de campo (FG%) no tiene en cuenta triples o tiros libres, por lo que se han desarrollado dos alternativas comunes:
 porcentaje de tiros de campo efectivos (eFG%) y porcentaje de tiros verdaderos (TS%). Estos se pueden medir a nivel individual o de equipo. 

FG%= MGF/MGF.

eFG%= (MGF + 0,5 × 3PM)/FGA.

TS%= (PTS/2)/(FGA + 0,44 × FTA)

El porcentaje efectivo de tiros de campo representa los triples anotados (3PM), mientras que el porcentaje real de tiros representa tanto los triples como los tiros libres. 

El porcentaje real de tiro proporciona una medida de la eficiencia total en los intentos de anotar, mientras que el porcentaje efectivo de tiros de campo aísla la eficiencia de tiro de un jugador (o equipo) del campo. Ambas medidas son apropiadas para diferentes situaciones.


Tasa de rebote 
Las estadísticas de rebotes por minuto se ven afectadas no solo por el ritmo al que juegan los diferentes equipos, sino también por su capacidad para hacer tiros y forzar a los oponentes a fallar.

Como resultado, el rebote se evalúa mejor por el porcentaje de todos los tiros fallados que un jugador rebota cuando está en el juego. (Esto generalmente se estima por los rebotes por minuto de su equipo sumado a los rebotes por minuto del oponente y multiplicado por los minutos del jugador). 

Esto se conoce como tasa de rebote o porcentaje de rebote para el jugador p (REB%p). donde REBp son los rebotes del jugador p, REBt son los rebotes del equipo t y REBo son los rebotes de los oponentes o del equipo t, MINp son los minutos del jugador p y MINt son los minutos del equipo t. 

El porcentaje de rebotes de los jugadores también se puede dividir en porcentaje de rebotes ofensivos (OREB%p) y porcentaje de rebotes defensivos (DREB%p), lo que puede resultar revelador porque pocos jugadores son igualmente expertos en rebotes en ambos extremos de la cancha. 

A nivel de equipo, el porcentaje de rebotes también es una medida de habilidad más precisa que los rebotes por partido. 
Los buenos equipos tienden a atrapar más rebotes que sus oponentes porque tienen menos tiros fallados que sus oponentes.
 Los tiros fallados tienden a ser predominantemente reboteados por equipos defensivos. El porcentaje de rebote del equipo aísla la capacidad de rebote de la capacidad de forzar errores.


Estadísticas de más/menos 

En la NBA, el seguimiento de esta estadística ha sido posible solo recientemente gracias a la disponibilidad de datos jugada por jugada en Internet. 
En particular, 82games.com comenzó a recopilar y publicar esta información para muchos jugadores a partir de 2003.
Antes de 82games.com, Harvey Pollack de los Philadelphia 76ers comenzó a recopilar esta información en 1993-94 y publicó el total de más/menos para cada jugador en su manual estadístico anual (Pollack, varios años). 

Hay que tener en cuenta que el término "más/menos" se puede ser usar de manera diferente tal y como vamos a ver.

Estadísticas más/menos medir el diferencial de puntos del equipo (puntos ofensivos menos puntos defensivos o índice ofensivo menos índice defensivo) cuando un jugador en particular está en el juego; 

Las estadísticas de más/menos a menudo se miden por minuto o por posesión.
 
Estadísticas netas más/menos mide las estadísticas positivas/negativas de un jugador dado cuando ese jugador está en el juego en relación con las estadísticas positivas/negativas de ese equipo cuando ese jugador no está en el juego. 
El fundador de 82games.com lo llamó alguna vez "Calificación de Roland", pero ese nombre ahora se usa para una calificación que incluye estadísticas individuales y más/menos netas.

 Estadísticas ajustadas de más/menos tiene en cuenta las diferencias entre los jugadores en la calidad de los compañeros de equipo con los que juegan y los oponentes contra los que juegan.

La mayor ventaja de las estadísticas de más/menos es que representan las contribuciones de un jugador que no se registran en el cuadro de puntuación. 

Las estadísticas de más/menos miden cómo funciona un equipo cuando un jugador determinado está en la cancha, por lo que son, en esencia, la versión de jugador individual del diferencial de eficiencia del equipo (índice ofensivo menos índice defensivo).

El  mayor inconveniente de la mayoría de las estadísticas de más/menos es que confunden el desempeño de un jugador con el desempeño de sus cuatro compañeros de equipo en la cancha (y también con cinco oponentes). 

Las estadísticas netas de más/menos dan cuenta de parte de este problema restando cómo le va al equipo sin el jugador, asumiendo efectivamente que las sustituciones de jugadores no están correlacionadas. 

Sin embargo, las fuertes correlaciones entre los minutos de los compañeros de equipo en la cancha y las diferencias sistemáticas en la calidad de los oponentes que enfrentan los diferentes jugadores no se explican por completo usando Estadísticas netas más/menos. 
Las alineaciones iniciales a menudo juegan una gran cantidad de minutos juntas, al igual que las reservas profundas.
Las estadísticas ajustadas de más/menos utilizan técnicas de regresión para tener en cuenta los jugadores con los que juega y contra los que juega un jugador determinado. 


Estadísticas de uso y eficiencia de posesión individual 
Debido a que las posesiones a nivel de equipo son tan importantes para comprender el rendimiento del equipo, tiene sentido considerarlas a nivel individual. 

Los estudiosos de las estadísticas como Dean Oliver (2004) y Hollinger (2003) introducen el concepto de tasa de posesión individual, que mide la intensidad con la que los jugadores utilizan las posesiones a través de intentos de gol de campo, tiros libres, asistencias, pérdidas de balón y (en el caso de Oliver) rebotes ofensivos. 

Oliver también normaliza las tasas de posesión individual para que los jugadores individuales (una quinta parte del equipo en la cancha en un momento dado), en promedio, usen una quinta parte de las posesiones del equipo mientras están en la cancha. 

Oliver (2004) también introduce el concepto de calificación ofensiva individual o eficiencia ofensiva individual. El índice ofensivo individual es la versión a nivel individual del índice ofensivo del equipo y mide la eficiencia de los jugadores con sus posesiones. 
Ponderado por el uso de la posesión y los minutos jugados, los índices ofensivos individuales deben sumarse al índice ofensivo del equipo. 

Por lo tanto, los índices de posesión individuales y los índices ofensivos individuales juntos son una buena manera de descomponer el índice ofensivo del equipo; también proporcionan un marco para obtener detalles completos sobre el cálculo de las tasas de posesión individual y la eficiencia ofensiva individual. 


Método de la curva de campana  El método Bell Curve 
(introducido en Oliver, 2004) es un enfoque relativamente más teórico para relacionar los puntos anotados y permitidos con el porcentaje de victorias de un equipo.
 
A diferencia del método pitagórico, el método Bell Curve se basa en la suposición de que las distribuciones de los puntos anotados y permitidos de los equipos se distribuyen normalmente y se pueden restar entre sí para formar otra variable aleatoria distribuida normalmente, los puntos netos. 
Los puntos netos se normalizan dividiéndolos por la desviación estándar del punto neto para ese equipo específico, formando así una estadística Z. 
La probabilidad estimada de ganar viene dada por la probabilidad de que una normal estándar distribuida de variable aleatoria tome un valor menor que esta estadística Z.





donde PPGt son los puntos por juego para el equipo t, PPGo son los puntos por juego para los oponentes o, StDev(PPGt – PPGo) es la desviación estándar de los puntos netos (PPGt – PPGo) en el calendario de un equipo, y NORMSDIST es la función de distribución acumulativa normal y representa el área bajo la "curva de campana" normal estándar a la izquierda del valor entre paréntesis.

Al igual que con el método de Pitágoras, los puntos de equipo por juego y los valores de puntos permitidos por juego pueden reemplazarse con clasificaciones ofensivas y defensivas, junto con sus desviaciones estándar. 

Los beneficios del método Bell Curve sobre el método de Pitágoras son que no necesita modificación empírica para su aplicación en diferentes ligas o diferentes épocas, e incorpora información sobre cuánto juegan los equipos por encima o por debajo de sus oponentes. 


"Basketball on paper" (Dean Oliver): la Biblia de la estadística avanzada.


Es el libro de referencia de los miembros del staff técnico de un equipo de baloncesto profesional para entender la estadísticas avanzadas y aplicarlas en sus equipos. 
Es un viaje en la cancha "a través de los números" para obtener un conjunto excepcional de herramientas y reglas estadísticas que pueden ayudar a explicar las rachas ganadoras o perdedoras de un equipo de baloncesto. 

Basketball on Paper no diseña jugadas, ni habla de táctica pero demuestra cómo interpretar el rendimiento del jugador y del resto del equipo.
Dean Oliver destaca las estrategias generales para los equipos cuando están ganando o perdiendo y qué aspectos deben ser el foco en cualquier situación. 

Dean Oliver

Describe y cuantifica los trabajos de los líderes de equipo y los jugadores de rol específico o especialistas, luego analiza las interacciones entre los jugadores y cómo lograr el mejor ajuste. 

Oliver conceptualiza el significado del trabajo en equipo y cómo cuantificar el valor de los diferentes tipos de jugadores que trabajan juntos. 
Examina equipos históricamente exitosos de la NBA e identifica qué los hizo tan exitosos: talento individual, un sistema para juntar a los jugadores o un buen entrenamiento. 

Luego, Oliver usa estas herramientas estadísticas y estudios de casos para evaluar a los mejores jugadores de la historia, como Magic Johnson, Michael Jordan, Wilt Chamberlain, Bill Russell y Charles Barkley, y cómo contribuyeron al éxito de sus equipos.

 Hace lo mismo con algunos de los jugadores más peculiares de la NBA: Manute Bol, Muggsy Bogues y Dennis Rodman. También lo hace con las mejores jugadoras de la WNBA

Basketball on Paper es único en sus conceptos analíticos dentro del contexto del baloncesto para medir el valor de los jugadores en un entorno profesional. 


Bienvenidos a la estadística avanzada: 
En fin , espero no haberos saturado y llegado a este punto , creo que es el momento de terminar con este artículo porque como ya comenté en la introducción, hay muchísimas estadísticas avanzadas más, pero no os quería marear ni marearme yo tampoco, porque al fin al cabo aunque haya dejado atrás mi fobia a las matemáticas hay cosas que me superan...


Espero haber despertado la curiosidad a los neófitos (como yo) sobre las estadísticas avanzadas en baloncesto. Un mundo apasionante donde se sigue trabajando para descifrar cualquier tipo de dato que pueda valer para interpretar el juego, aunque al final es una cosa tan sencilla como meter la pelotita en el aro ¿no? .

Saludos

Publicado por @basketatodoritm en Twitter.


 Bibliografía: 
"A Starting Point for Analyzing Basketball Statistics" de Justin Kubatko.
"Basketball on paper" de Dean Oliver
"Las matemáticas reinventan el baloncesto" artículo de El Español.

No hay comentarios:

Publicar un comentario