Meu nome é Edvaldo, o Ed. Além de praticante e amante de Crossfit, sou estatístico, para quem não sabe é uma formação/profissão que se encarrega de organizar, fazer análises e interpretar dados. Com a chegada de mais um Open, o coach Marcel me pediu para fazer previsões de quais exercícios cairiam em cada WOD. Desafio lançado!
As previsões para o primeiro WOD (2020.1) estão prontas, mas antes gostaria de deixar algumas premissas:
1- Previsão estatística não é certeza, apenas tentamos encontrar um padrão nos dados que temos. Pode não existir padrão, podemos não entender totalmente o padrão e o padrão pode mudar totalmente;
2- Pessoas especializadas na área podem ser que façam previsões bem mais acertadas. Podem ter conhecimentos de mais dados, inclusive de uma futura mudança de padrão.
Informadas minhas desculpas para possíveis fracassos totais, vamos à metodologia:
Organizei os dados para que a maioria das minhas variáveis fossem binárias, 1 ou 0, aconteceu ou não aconteceu. E assim tinha para muitos movimentos de CrossFit uma variável dizendo se ele “caiu” em cada WOD. Além disto tinha também variáveis para tipo de movimentos (ginástico, cardio e levantamento), variáveis sobre a quantidade de movimentos (1-Singlet, 2-Couplet, 3-Triplet e >= 4-Chipper), variável sobre o tipo do Time Cap, variáveis sobre a cronologia de cada WOD, e para conseguir ver um efeito temporal fiz variáveis do tipo: “Caiu snatch no WOD passado? E no retrasado?…”. Enfim, consegui uma quantidade de variáveis boa, as citadas acima e mais algumas. O ruim são as quantidades de observações, o histórico, só tivemos 46 WODs de Open até o momento, isso foi realmente um grande dificultador e incapacitou algumas previsões, mesmo que bem genéricas.
Fiz um modelo estatístico para cada uma destas variáveis, foram 48. Para as variáveis binárias (0 ou1), fiz regressões logísticas, é um método estatístico que retorna a probabilidade de algo acontecer, exemplo, 99% de chance de cair Cardio. Para a variável tamanho do Time Cap fiz um modelo linear múltiplo, que me retornou a quantidade de minutos esperados.
Finalmente, as previsões: Em relação a quantidade de movimentos, disparadamente Couplet tem a maior probabilidade de cair, ou seja, dois movimentos. Sem aqueles Time Cap diferentões e com uma duração longa, mais de 15 minutos. Tipo de movimentos, Levantamento de Peso e Cardio. E os movimentos, qualquer tipo de Snacth e Double Unders. Por enquanto sem dumbbells.
Espero fazer as previsões das próximas semanas deste Open, mas após sair o 2020.1 alimento meu banco de dados e tenho mais uma observação para fazer as previsões do 2020.2, e assim por diante. Espero também acertar, mas se não, fica o desafio cumprido e a diversão que foi fazer!
E qual a sua previsão?
Por Edvaldo Batalha