La final de la Liga de campeones no fue sólo un juego emocionante, pero también era un cambiador de juego posibles: Liverpool huelguista Mo Salah, jugador del año, recibió la bota de oro y de Egipto mejor conocido jugador repentinamente había tenido su boleto a la Copa del mundo en duda después de un desafío agresivo de Sergio Ramos lo dejó herido.
Las implicaciones de este aparejo han sido sería enorme: Salah si no podía jugar para su país (resulta que ha hecho la casi imposible y que es apto), esto podría haber afectado las posibilidades de Egipto en la Copa del mundo, y mientras Egipto es poco probable ser troub Ling las últimas rondas de la competición, como una mariposa aleteando sus alas en el otro lado del mundo, rendimiento de Egipto podría en impacto de vuelta como los otros equipos en su grupo no – y en última instancia afectan a qué país llega a levantar el trofeo.
Dicho esto, caída potencial de Salah es sólo uno de millones de puntos de datos. Uno de los millones de factores que podrían afectar el resultado de la competencia.
¿Cómo podemos conseguir una manija en qué esperar, entonces? ¿Hay alguna manera de predecir cómo actuará equipos? ¿Podría Big Data, que ya ha transformado a muchas otras industrias, también desbloquear una comprensión más profunda del juego hermoso? ¿Podría predecir lo que va a ganar la Copa del mundo?
Puntos de datos
Opta Sports y estadísticas son dos empresas que tratan de responder a preguntas como esta. Como empresas de datos de deportes, sus misiones son para recopilar datos y hacer sentido para sus clientes, que incluye equipos deportivos y federaciones, así como los medios de comunicación que tienen hambre de conocimientos de datos (ejem).
“Es muy fácil pensar que más datos están buenos, pero hasta que sepa cómo vas a utilizar y qué se puede aprender de él, a veces puede ser datos por causa de los datos”
¿Realmente recogen, entonces? Gerente de marketing de opta Peter Deeley explicó que para cada partido de fútbol, su compañía recoge alrededor de 2000 puntos de datos individuales, sobre todo centrados en acciones “en bola”. Un equipo de tres analistas – uno para cada lado y alguien en momentos difíciles de comprobar, se sentará en el centro de datos de la empresa en Leeds y todo lo que sucede en el campo registrará esencialmente: cada pase, cross y tiro, así como las posiciones en el campo donde ea interacción de CH ha tenido lugar.
Los datos se envían a clientes directo, razón por la cual, por ejemplo, experto de UK (y ex jugador de Inglaterra) Gary Lineker es capaz de decirle a los espectadores sobre estadísticas como posesión y tiros en meta en el medio tiempo.
Stats.com hace al mismo tipo de cosa – y Paul Power, un científico de datos en la empresa, estaba dispuesto a decirme acerca de cómo no sólo los seres humanos que se utilizan para la recolección de datos y nuevas tecnologías de visión de computadora.
Cuando se trata de registrar con precisión la posición de cada jugador en la cancha, su empresa utiliza cámaras colocadas alrededor del borde para calcular hacia fuera, ahorrando la necesidad de los jugadores a llevar balizas de seguimiento bajo sus camisas, como ha ocurrido en deportes como el Rugby Union.
Pero ¿por qué a los seres humanos? ¿No visión de computadora se utiliza para iniciar sesión todos de este tipo de datos? “La gente está aún mejor debido a matices que los equipos no van a ser capaces de entender,”, argumenta Pablo.
Él da el ejemplo qué pasa si un jugador está acorralado y lanza el balón lejos de la desesperación, pero por suerte la bola entonces es recibida por un jugador en el mismo equipo. A una máquina, esto puede parecer simplemente un pase largo, como las máquinas no pueden trabajar fuera del contexto de lo que está sucediendo, o la mirada de pánico en la cara del jugador – iniciar sesión un pase largo, mientras que técnicamente el evento técnicamente es algo más : un espacio libre. Lo que significa que sin un ser humano para hacer estas llamadas, los datos registrados podrían ser menos precisos.
El enfoque Opta
¿Sabemos que ambas empresas tienen un montón de datos – pero que piensan que realmente va a ganar la Copa del mundo? Aunque ambas empresas generan mucha información detallada para sus clientes, curiosamente las estadísticas y Opta divergieron cuando se trata de modelar el torneo de este verano.
En caso de Opta, Peter me explicó que su modelo de la Copa del mundo no tiene en cuenta la gran cantidad de datos de jugadores individuales. En cambio, ha elegido Opta sólo por fijarse en el funcionamiento de los escuadrones nacionales específicos a nivel de equipo. Por ejemplo, las posibilidades de evaluación de Egipto basadas en cómo el equipo egipcio realizado en el pasado y sin tomar en cuenta la situación lesiones de Mo Salah.
“Los científicos de datos de la Copa del mundo vieron la performance histórica de los diferentes países, qué diferencia hace si juegas como nación anfitriona, qué diferencia hace que usted está jugando en su continente de origen.”
“Los científicos de datos de la Copa del mundo vieron la performance histórica de los diferentes países, qué diferencia hace si juegas como nación anfitriona, qué diferencia hace que usted está jugando en su continente de origen [y] Qué diferencia hace “hacer si han ganado las últimas copas del mundo pocos, explica Peter.
Los científicos de datos eran entonces capaces de modificar el modelo ejecutando cientos de miles de veces para hacer mejoras iterativas, ajuste el peso relativo de cada factor en el algoritmo.
Esto es una sorpresa, asumiría más datos mejor, pero Peter cree que este modelo todavía puede entregar buenas predicciones.
“Una Copa del mundo sólo se realiza cada cuatro años, por lo que usted encontrará a menudo que un jugador de calidad decente, jugando para un país que juega a menudo en copas del mundo, sólo jugará en los dos torneos de Copa del mundo – no tendrás mucho datos sobre ese impacto de los jugadores del equipo mayor dentro de la internacional arriba conjunto “, dice.
Y él cree que esto