Sign in / Join

OptaX - 4e partie : table ronde et conclusion

Si la gestion de la donnée est devenue un enjeu crucial dans l’économie actuelle, elle est aussi une thématique abordée de plus en plus régulièrement dans le football. Nouvelles données, nouveaux temps de mesure (quasi-instantanés désormais), nouvelles méthodes de visualisation : la data du football est un terrain en pleine floraison.

Il paraissait presque anormal dans ce contexte de ne pas voir d’événements spécifiques traitant de la data dans le football ; c’est désormais chose faite, grâce à cette conférence co-organisée par Opta, leader mondial reconnu de la donnée dans le sport, et l’Ecole Polytechnique, qui nous a fait l’honneur de nous recevoir dans ses locaux parisiens.

 

Introduction et Premier sujet : TIRAGES AU SORT, QUANTIFIER L’INJUSTICE

Deuxième sujet : DES SCIENCES PHYSIQUES AUX MEDAILLES OLYMPIQUES ET PARALYMPIQUES

Troisième sujet : LE COACHING A l'ÈRE DE L'INTELLIGENCE ARTIFICIELLE

 

Quatrième et dernier sujet : Table ronde

Participants : Alain Roche (10 ans à la direction sportive du PSG), Christian Gourcuff (35 ans au poste d’entraîneur), Matthieu Lille-Palette (Senior VP chez Opta), Mathieu Lacome (Sport Scientist au PSG) + Joeffrey Voltzenlogel (data-journaliste chez Bein Sports) en animateur.

 

CE QUE NOUS AVONS APPRIS DE LA TABLE RONDE

L’avis de Christian Gourcuff sur les 3 premières parties

« Il manque la dimension collective » : pour pouvoir analyser une prestation, l’équipe doit être prise en compte dans son ensemble. La coordination des déplacements est très importante dans les phases de récupération.

L’utilisation de la data par Christian Gourcuff

  • Gourcuff revoit tous ses matchs avec la caméra grand angle. Elle lui permet de préparer son travail tactique car elle renseigne sur la position de tous les joueurs.
  • Les statistiques sont utiles pour valider les impressions (et non pas les créer). Sa statistique préférée : le nombre de passes.
  • Revoir un match le lendemain, sans émotion, altère la vision portée sur celui-ci : « un mauvais match paraîtra moins mauvais, et un très bon match ne sera peut-être pas si génial que ça ».
  • Il est important de savoir rester critique avec la donnée. Face au PSG, ses équipes ont toujours fini avec plus de kilomètres parcourus, à plus haute intensité en moyenne (parce que le PSG fait tourner la balle). Mais le PSG produit un nombre d’accélérations très supérieur, et c’est là qu’ils font la différence.

Sport Scientist au PSG, cela consiste en quoi ? (par Mathieu Lacome)

  • Son travail est de répondre aux requêtes du staff technique et de l’entraîneur.
  • La donnée est souvent au cœur de problèmes qui sont pris à l’envers. La bonne pratique, c’est d’abord de comprendre la problématique, puis de refondre le modèle des indicateurs que l’on souhaite générer.

Le business d’Opta

  • Opta propose aux clubs des services de consulting en recrutement (via la donnée évidemment). Une de leurs belles histoires ramène à l’été 2015, au siège de Leicester. Claudio Ranieri a besoin d’un joueur « fort au milieu de terrain, capable de récupérer beaucoup de ballons ». L’italien sait que la Ligue 1 est très fertile de ce genre de joueurs et sonde Opta, qui proposera une liste de joueurs. Tout en haut de la liste, Nampalys Mendy. Juste en-dessous, N’golo Kanté. Ranieri décide de recruter le caennais. Vous connaissez la suite.
  • Tous les clubs veulent des statistiques différentes. Notamment concernant la possession, une question qui revient souvent et qui n’est pas abordée de la même façon partout : qu’est qu’une possession de bonne qualité ?

Quel lien entre l’analyse de la donnée et les joueurs ?

  • « Les joueurs sont très demandeurs », affirme C. Gourcuff.
  • A date, les données sont le plus utiles pour faire le point sur la forme physique des joueurs.
  • Lacome rappelle cependant qu’il faut manipuler les statistiques athlétiques avec soin, car elles peuvent être contre-productives. Un joueur qui aura parcouru une grande distance n’aura pas nécessairement fait un bon match.

 

 

CONCLUSION

Tout d’abord, il nous faut renouveler nos remerciements à Opta et à l’Ecole Polytechnique pour avoir organisé cette conférence ; nous espérons qu’elle sera la première d’une longue série. Nous espérons aussi que les épisodes suivants pourront durer un peu plus longtemps, afin que les intervenants puissent évoquer leurs projets plus longtemps : le sujet est souvent si complexe que la démonstration mérite de ne pas être tronquée.

Des avancées à petits pas

Le premier ressenti (c’est donc totalement subjectif) est que la manipulation de la donnée dans le football se situe à un stade très préliminaire dans son développement. Si la partie privée de ce milieu (contrats entre Opta, Prozone, etc. et des clubs professionnels), ne nous est pas accessible, nous pouvons élaborer sur la partie publique, celle des médias. Lorsque nous comparons le football européen aux sports américains, la différence est vertigineuse. Cela signifie qu’il y a beaucoup de chemin à parcourir et de pages à écrire du côté du football : c’est l’enseignement le plus stimulant que nous puissions en garder.

Concernant l’utilsation des nouvelles méthodes, en 2018, les technologies et les outils ont évolué : le machine learning se démocratise dans la plupart des entreprises et l’intelligence artificielle est passée du rayon science-fiction à celui des sciences modernes. Si certaines entreprises spécialisées, comme SciSports,  (http://www.scisports.com/) commencent à faire du machine learning un argument de vente, elles restent pour l’instant marginales à côté d’un poids lourd comme Opta. Bon, ces entreprises sont aussi des concurrentes d’Opta, organisateur de la conférence, ce qui peut expliquer pourquoi elles n’étaient pas conviées.

Le football est-il quantifiable ?

Il y a trois ans, les Cahiers du Foot publiaient un article sur  les limites de la statistique. Les statistiques évoquées alors concernaient particulièrement l’analyse de cas individuels. Il faut noter que le mauvais usage de la statistique se fait plus rare, notamment grâce à l’apparition de données de plus en plus pertinentes ; les xG, expected goals, et affiliés (xA, etc) en font partie. On regrette que cette donnée n’ait pas pu être abordée lors de la conférence. Seul Joeffrey Voltzenlogel aura essayé de lancer le sujet lors de la table ronde, sans succès.

En revanche, l’appréhension par la donnée d’une équipe de football dans sa globalité reste un terrain encore peu ou pas exploité ; c’était d’ailleurs l’objet de la toute première remarque de Christian Gourcuff lors de la table ronde. Et la nature de notre sport favori n’aide pas. Dans la majorité des sports américaines, les joueurs évoluent dans des postes spécifiques, où ils ont des rôles différents de leurs partenaires, mais similaires à celui de leurs homologues. Au basket-ball, sport US le plus connu en France, un pivot ne peut certainement pas être évalué comme un ailier ; en revanche, on pourra comparer ses statistiques à celui du pivot adverse. Le football est infiniment plus complexe que cela :

  • Au niveau des dispositions d’équipe, vous avez 10 joueurs de champ qui peuvent être mis dans des dispositions différentes au cours d’un même match ; la disposition défensive et la base des constructions offensives est également souvent différente (défenses régulièrement en 451 ou 442 à plat par exemple)
  • Au niveau des positionnements des joueurs, ceux-ci peuvent permuter régulièrement (le milieu qui couvre son latéral parti déborder ; les ailiers qui changent d’aile pour perturber leurs adversaires directs), donc les changements de fonctions sont fréquents
  • Au niveau du rôle des joueurs, même dans une disposition et à un poste similaires, selon la volonté de l’entraîneur, deux joueurs peuvent avoir des rôles totalement différents. On ne juge pas les performances de Benzema et de Cavani de la même façon, pourtant ils jouent (souvent pour Benzema, toujours pour Cavani) à la pointe d’un 4-3-3.

L’analyse de cas individuels tend à se développer de façon pointue ; cela s’explique par les progrès analytiques et technologiques dans un terrain facilité par l’hyper-individualisation récente du football. Néanmoins, les éléments listés ci-dessus, tout à fait naturels dans la pratique du football, contribuent à en rendre l’analyse globale particulièrement complexe. Tellement complexe qu’à date, personne ne sait encore proposer de modèle d’analyse collective d’une équipe. Les méthodes de calcul progressant à une vitesse effrénée, nul doute que nous allons voir certains de ces modèles émerger dans la prochaine décennie. Nous les attendons avec grande impatience : participer au partage de la compréhension du football est un enjeu absolument passionnant.

Laisser un commentaire