BIHUB PATH

November 8, 2019

Futebol
Análise e Tecnologia Desportiva
Rendimento Desportivo
Análise e Tecnologia Desportiva
Rendimento Desportivo

O QUE VOCÊ PRECISA PARA APRENDER A TRABALHAR COM ANALYTICS DE FUTEBOL?

A pergunta que mais me fazem é sobre as habilidades necessárias para se tornar um cientista de dados em um clube de futebol. Para muitos, analisar o futebol é o trabalho dos sonhos. Se você gosta tanto do jogo quanto das estatísticas, nada poderia ser melhor do que combinar os dois em uma carreira. A questão é: quais habilidades você precisa desenvolver para encontrar uma vaga em um clube?

 

Para responder a essa pergunta, é melhor começar examinando os dados disponíveis.

 

Há dez anos, os dados usados pelos clubes eram limitados a estatísticas sobre gols, chutes, número de escanteios, posse de bola, etc. Esses dados têm valor limitado para a equipe técnica. Embora possa ser preocupante se o seu time estiver concedendo muitos chutes a gol ou não conseguindo manter a posse de bola, saber disso não fornece informações para treinamento. As estatísticas típicas que vemos na TV não ajudam, por si só, os times a vencerem jogos.

 

A segunda onda de dados de futebol veio na forma de dados de eventos com a bola. A maior fornecedora desses dados, Opta, fornece coordenadas (x, y) de cada passe da bola, toda ação defensiva e cada chute. A Opta agora é uma das várias fornecedoras de dados, incluindo Statsbomb, Wyscout e várias empresas de apostas, que coletam esse tipo de dados.

 

Os dados de evento se mostraram úteis para muitos clubes, em especial na busca de jogadores. A estatística mais conhecida nesse contexto são os gols esperados, que medem a qualidade das chances que os jogadores criam. Outros indicadores mais avançados incluem assistências esperadas, modelos de passe que atribuem um valor a cada passe com base no progresso da bola, e cadeias de posse que medem o envolvimento nas sequências de ataque. Essas estatísticas, juntamente com as medições mais tradicionais, como a contagem de duelos de cabeça, interceptações e conclusão de passes, são frequentemente apresentadas na forma de um radar de jogador. O radar mostra como cada jogador se compara a outros que jogam na mesma liga.

 

Sei por experiência própria que muitos olheiros adoram esses diagramas. Os diagramas proporcionam a eles, para o bem ou para o mal, uma maneira de confirmar suas crenças sobre um jogador ou encontrar novos talentos para analisar com maior detalhe.

 

Para lidar e analisar com dados de eventos, você precisa programar, de preferência em Python ou R, e também precisa aprender sobre modelagem estatística básica. Gols esperados são um modelo de regressão logística. Os modelos de passes usam regressão logística ou redes neurais básicas. Esses são os tópicos que aparecem em todos os bons cursos universitários em estatística e nos cursos de mestrado em ciência de dados, e também são abordados em cursos on-line.

 

Embora seja importante conhecer os dados “na bola”, o futuro da análise de futebol pode estar em outro lugar. Falei com Raúl Peláez Blanco, chefe de Análise de inovação em tecnologia esportiva do FC Barcelona, e perguntei sobre os dados que a equipe usa atualmente.

 

Ele foi direto ao ponto: “Não confiamos nos dados de evento na avaliação do jogador. Acreditamos que precisamos entender como os jogadores agem em diferentes contextos. Por exemplo, se estivermos olhando para um ponta que dribla muito bem em contra-ataques, nos perguntamos como ele também dribla quando a defesa adversária está organizada. Os dados de evento não nos dizem isso”.

 

“Antes de contratarmos um jogador, precisamos examinar como ele resolve problemas nos contextos que ele enfrentará no Barcelona”, Raul disse. “Tornou-se popular categorizar jogadores usando dados sem levar em conta esses contextos, mas isso distorce as realidades”.

 

Seria errado, no entanto, concluir que Raul se opõe ao uso de dados. Pelo contrário. Para ele, a questão é usar os dados certos.

 

“O problema com os dados de evento é que eles são descontextualizados, não sabemos como o restante dos jogadores está posicionado quando um passe é feito, por exemplo”, disse ele. “Em vez disso, usamos dados posicionais dos 22 jogadores e da bola. Isso nos ajuda a obter informações táticas para o treinador”.

 

Os dados de 22 jogadores, a terceira onda de dados no futebol, são muito mais ricos do que os dados de eventos. Como o nome indica, ele contém as coordenadas no campo de todos os jogadores, bem como a posição da bola. Isso é essencial para entender o contexto. Durante uma partida normal, Luis Suarez fica com a bola por menos de 90 segundos dos mais de 90 minutos de jogo. O que Suarez, ou qualquer outro jogador, contribui para a jogada – pressionar, correr para abrir espaço e posicionamento tático – não pode simplesmente ser medido nas estatísticas de chutes.

 

Para Raul e sua equipe, o primeiro passo para usar esses dados foi automatizar o trabalho dos analistas de vídeo. “Alguns anos atrás, os analistas de vídeo passavam a maior parte do tempo gravando jogos e rotulando partidas e treinos”. Ele disse: “Agora os computadores podem fazer a rotulagem e os analistas de vídeo podem se concentrar em gerar informações”.

 

A realização dessas tarefas requer habilidades em aprendizado de máquina e visão computacional. Algoritmos são necessários para identificar corretamente as posições e orientações corporais dos jogadores em tempo real, bem como para decidir se uma situação é um contra-ataque ou uma posse estabelecida. Esse problema ainda não está totalmente resolvido, e os algoritmos cometem erros. Mesmo nas principais ligas, onde várias câmeras são usadas para filmar as partidas de vários ângulos, os dados de rastreamento ainda não são 100% confiáveis. Um emprego para um jovem cientista da computação ambicioso, talvez?

 

Apesar das limitações, os dados de rastreamento de 22 jogadores já são confiáveis​o suficiente como para começar a gerar informações. Por exemplo, o físico William Spearman, atualmente trabalhando no Liverpool FC, desenvolveu um modelo de passe que mostra quais passes são possíveis e quais serão interceptados. No ano passado, um dos meus alunos de mestrado em Ciência da computação, Fran Peralta Alguacil, implementou um modelo semelhante ao de Spearman para analisar a tomada de decisão dos jogadores (veja a figura 1). Ele conseguiu mostrar como as “corridas disruptivas” dos jogadores do Barcelona abriam espaço para seus companheiros de equipe. O projeto envolveu um grande uso de suas habilidades em física para simular o movimento do jogador e a dinâmica da bola. Sem um treinamento científico adequado, Fran não teria sido capaz de simular o movimento da bola.

Figura 1: (a) Situação da partida. O ponta esquerdo (Alcacer) corre para abrir espaço para o lateral esquerdo (Alba) (b) Saída dos dados de rastreamento e modelo de passe. Os pontos mostram as posições e as linhas mostram as direções dos jogadores. A linha azul indica um passe que é feito. As áreas verdes são um passe possível, enquanto as áreas vermelhas são onde os passes serão interceptados pelos adversários.

Outra habilidade é implementar o código em computadores paralelos, para que os resultados possam ser apresentados imediatamente. “O pessoal das equipes profissionais procurará usar dados para tomar decisões em tempo real. Os computadores oferecerão segundas opiniões aos treinadores para que eles possam fazer alterações durante as partidas”, afirma Raul.

 

Para mim, a conclusão de Raul é que qualquer pessoa que queira entrar no ramo de análise do futebol deve pensar de forma ampla. A ciência de dados e a estatística são importantes, mas também existem oportunidades para quem tem um bom entendimento de física, da visão computacional ou da computação paralela. Treinadores e cientistas do esporte também terão que desenvolver suas habilidades para aproveitar ao máximo essa nova abordagem analítica. Eles terão que se adaptar para entender o que os modelos matemáticos estão dizendo a eles e para saber em quais resultados confiar e quando confiar em sua própria intuição.

 

Uma última coisa. É importante saber trabalhar em equipe. Raul mencionou Javier Fernandez, cujo trabalho vimos no artigo anterior.

 

“Javier é uma pessoa generosa que compartilha tudo o que aprende”. Raul disse: “Essa também é a filosofia do Barça. Isso não tira o valor competitivo, porque o verdadeiro valor é o aprendizado. As fórmulas finais são apenas o culminar do trabalho, a parte mais bonita é o caminho percorrido”.

 

Portanto, seja qual for o caminho para a análise de dados, certifique-se de abordá-lo abertamente. Converse com outras pessoas, aprenda e compartilhe seu conhecimento. Isso criará as análises de futebol do futuro.

 

David Sumpter

KNOW MORE

¿VOCÊ QUER SABER MAIS?

  • ASSINAR
  • CONTATO
  • CANDIDATAR-SE

FIQUE ATUALIZADO COM NOSSAS NOVIDADES

Você tem dúvidas sobre o Barça Universitas?

  • Startup
  • Centro de investigação
  • Corporate

Por favor, preencha os campos:

Por favor, preencha os campos:

Por favor, preencha os campos:

O formulário foi enviado com sucesso.

Por favor, preencha os campos:

Por favor, preencha os campos:

Por favor, preencha os campos:

O formulário foi enviado com sucesso.

Por favor, preencha os campos:

Por favor, preencha os campos:

Por favor, preencha os campos:

O formulário foi enviado com sucesso.