Intervention à l’université de Lille le 9 novembre 2023 avec 3 experts de la data et du sport. L’intervention est recoupée en 4 parties.

    Dans cette vidéo: La troisième partie présentée par Paul-Antoine Girard, CEO de GrAIg (https://www.linkedin.com/in/paul-antoine-girard/).

    Il nous parle de l’utilisation de la donnée pour personnaliser les entrainements.

    video 1: L’usage de la data dans le foot (https://youtu.be/TsxgYYQEWWk)
    video 2: L’usage de la data dans le foot au Stade de Reims (https://youtu.be/t2PISXWU2nk)
    video 4: L’usage de la data pour détecter les futurs talents et comment les entrainer (https://youtu.be/vUn7RCZYXnA)

    Parfait et ben déjà bonsoir à tous donc moi je suis paul Antoine cofondateur de Greg donc on va changer un petit peu de sport là après le foot on va passer dans le les sports d’endurance et principalement dans le cyclisme pour commencer donc juste un peu une histoire nous sur l’histoire et

    Les fondateurs de Greg donc gre c’est une start-up qu’on a cofondé il y a maintenant 2 ans parmi les coffondateurs donc on est trois on a tous euh une licence en fait de math appliqué qu’on a ensuite continué pour Samuel et moi avec un master en dectta science for business

    Et Doron qui a continué lui sur un master en mathématique approfondie il me semble ou appliqué je sais plus donc tout avec un profil vraiment scientifique et des applications en data science et notre objectif était donc de faire le lien entre euh ce que nous avions appris au niveau

    De la la data et notre passion commune pour les sport d’endurance pour vous parler un petit peu plus donc nous de ce que nous proposons au niveau de Greg c’est permettre dans un premier temps aux entraîneurs des sportif d’endurance d’agréger au même endroit et donc dans une même base de données toutes les

    Différentes sources de données de leurs athlètes donc qui passe par tout ce qui vient des objets connectés euh montre connecté euh ordinateur sur les sur les vélos tout ce qui est au niveau de la météo donc savoir le temps qu’il va faire l’altitude toute une branche aussi qui

    Est sur la psychologie de la tête avec de nombreux questionnaires qu’on a sur une application mobile pour savoir comment l’athlète se sent aujourd’hui comment il a dormi comment est-ce qu’il a des courbatures et cetera toute une partie également sur la récupération et sur le sommeil avec des capteurs qui sont assez

    En vogue en ce moment par par exemple Whoop et ourura qui permet d’avoir des données sur la qualité du sommeil sur le temps passer dans chaque phase également sur des valeur de récupération avec la variabilité de la fréquence cardiaque et les deux derniers points qu’on récupère également qui sont plus sur la partie

    Nutrition donc quels repas sont mangés au niveau aussi de l’hydratation et enfin au niveau médical donc plus avec tout ce qui est au niveau des blessures de test physiologiques et et cetera donc le but avec cette base de données cette collecte de données c’est vraiment d’agréger le plus de possible

    De sources pour avoir la la meilleure estimation et la meilleure représentation de l’évolution d’un sportif au cours du temps et du coup ensuite de pouvoir utiliser ces données et développer par-dessus des modèles de machine learning deep learning suivant les applications pour d’un côté permettre aux athlètes d’améliorer leur performance bien sûr de

    Réduire les risques de blessures et d’un autre côté permettre aux entraîneurs de gagner beaucoup de temps sur le suivi de leurs athlètes sur la prescription des séances et surtout d’améliorer euh leur prise de décision qui est un sujet assez commun avec le machine learning donc je vais vous présenter

    Trois cas euh que nous utilisons principalement le premier qui est forcément le moins intéressant euh nous c’est surtout avec du coup de la visualisation de données donc c’est leur permettre d’avoir au même endroit de nombreuses visualisations très simples d’accès une des grosses problématiques du coup pour des des

    Posts au niveau plus data analyste dans ce cas-là c’est d’être capable de représenter de manière très simple et très concise des données qui peuvent parfois être complexes ou qui apportent des informations qui qui sont euh qui sont contraires et donc c’est vraiment un très gros enjeu d’être capable de de

    Simplifier au maximum euh la donnée ensuite euh donc la deuxième application pour nous c’est surtout au niveau du machine learning donc être capable de développer des modèles pour assister les entraîneurs le premier point c’est pour que ce soit très concret c’était dans le cadre du Tour de France 202 3 euh don

    D’être capable de prédire la performance des athlètes sur les étapes donc pour recontextualiser un petit peu le tour de France c’est 3 semaines de compétition avec tous les jours une étape pour chaque étape les profils sont différents avec plus ou moins de montagnes plus ou moins dénivelé et

    Cetera et sur les étapes de montagne il est essentiel euh si on va être devant de euh de développer beaucoup coup de Wat Watt c’est la mesure qui est utilisée en cyclisme pour mesurer l’effort avec des capteurs qui sont compris soit dans les pédaliers soit sur les pédales et qui

    Sont vraiment des valeurs de référence et donc dans le cyclisme il y a ce qu’on appelle les coureurs grand tour donc c’est ceux qui vont courir pour les 3 semaines du Tour de France avec objectif de mettre le moins de temps possible sur ces 3 semaines et sur les étapes de

    Montagne c’est là où il y a des risques les plus importants de perdre beaucoup de temps dû à une contrepformance ou ce genre de chose mais c’est également aussi les meilleures états pour faire des écarts et gagner du temps et donc une des principales problématiques c’est également de savoir sur la dernière

    Ascension de ces étapes de montagne qu’elle va être capable que va être capable de de fournir comme effort le le coureur et donc pour nous c’est une tâche de prédiction assez class être capable de prédire la puissance que va pouvoir développer le coureur dans un effort maximal sur cette montée donc ça

    Être capable de lui donner des données dans un premier temps sur la montée qu’elle va être sa distance qu’elle va être son la la pente quelle va être le gain au niveau de l’altitude quelle sera la fatigue au pied cette montée donc la fatigue qui a été générée sur la

    Première partie de la course aussi être capable de lui donner des informations sur l’entraînement qu’est-ce qui a été travaillé à l’entraînement sur les semaines précédentes et donc savoir derrière est-ce que cet entraînement est bénéfique pour la prédiction tout un aspect aussi au niveau de ces données de récupération

    Dont je parlais un petit peu plus tôt au niveau de la variabilité de la fréquence cardiaque et du sommeil parce que quand on regarde sur une semain sur une course qui dure 3 semaines bah forcément la forme elle fluctue et la récupération n’est pas forcément très bonne tous les

    Jours et le dernier point c’est forcément sur utiliser des courses passées dont tu es capable de lui donner des valeurs de puissance sur des efforts similaires dans le passé donc ça c’est un des modèles qu’on a beaucoup utilisé pour les étapes et du coup qui nous permet de dire bah par

    Exemple sur tiib Pino sur telle étape telle montée voilà la puissance qui va être capable de développer aujourd’hui mais une grosse problématique euh au niveau de la prédiction et des modèles prédictifs c’est d’être capable de savoir pourquoi cette prédiction et donc pourquoi aujourd’hui ce modèle va prédir donc là c’est un changement

    D’unité qui est utilisé beaucoup donc en wat par kilogram va être capable de prédire 6.27 wat par kil comparé à 5.92 quand on sait que par exemple un 6.3 ça peut permettre de gagner l’étape alors que un 5.9 peut être 4e et donc c’est là où il

    Y a des jeu d’interprétabilité donc de comprendre pourquoi le modèle effectue ses prédictions et quels sont les features qui joue derrière cette prédiction c’est essentiel pourquoi parce que ça permet de comprendre sur quel facteur on peut jouer au niveau de la performance et du coup sur quel facteur le staff peut

    Jouer que ce soit comme je revenais sur sur sur le slide précédent pardon au niveau de l’entraînement donc nous ça nous permet de faire des simulations que si on change l’entraînement et on l’adapte avec un plan d’entraînement différent avec plus de séance d’un autre type dans quel sens cela va impacter les

    Prédictions et du coup derrière de pouvoir vraiment avoir des des modèles qui sont actionbles actionnables pardon au niveau de l’interprétabilité ce qu’on utilise beaucoup nous c’est ce qui s’appelle les shap values qui permet de découper par features le rôle jouer dans chacune de ces prédictions donc ça c’est un exemple

    Qui vient justement du football parce que je n’avais pas sous la main mais qui vous permet de dire pour chaque features bah voilà le pourcentage d’implication dans telle ou telle prédiction et du coup derrière de pouvoir découper et donner beaucoup plus de sens à euh au modèle prédictif que l’on

    Développe donc voilà sur ce cas numéro 2 donc là c’est un cas assez simple simple prédictif qui permet plus euh au niveau des courses et l’optimisation de la stratégie de cour dans une étape dans des étapes de du Tour de France et le dernier point qui

    Est euh un cas d’usage un petit peu différent nous au niveau de Gray qui nous permet dans ce cas de viser beaucoup plus euh les sportifs et d’aller directement au niveau des sportifs pour leur permettre d’analyser le leur séance donc pour prendre de manière assez simple comment on découpe

    Le travail d’un coach euh au quotidien c’est de dire d’un côté il y a toute la partie analyse des données analyse de l’entraînement et de l’autre côté prescription de l’entraînement prescription du plan d’entraînement et quelle sera la la prochaine séance à effectuer et donc là nous c’est un enjeu

    Au niveau de Greg d’être capable de développer un assistant Ia pour euh effectuer ces deux tâches donc la première au niveau de l’analyse de l’entraînement donc ce qu’on récupère principalement c’est euh des des séries temporelles des séries temporelles donc là par exemple sur une séance de 3 ou 4 heures de vélo

    Avec des données secondes par seconde pour différents paramètres donc on voit celles qui sont dessus au niveau de la puissance dont on a parlé précédemment au niveau de la fréquence cardiaque au niveau de la cadence de pédalage de la vitesse de la température extérieure de l’altitude et donc donc ces données qui

    Sont quand même assez généreuses parce qu’on parle quand même de du coup quatre fois 3600 secondes dans ce cas-là et c’est être capable du coup de comprendre avec un modèle de machine learning derrière et donc avec des algorithmes être capable de comprendre les moments importants dans ces séances d’entraînement

    Comprendre à quoi elles correspondent et du coup derrière de pouvoir les évaluer donc nous c’était une grosse tâche qui se découpe en plusieurs phases la première qui est donc compréhension du streams savoir détecter le début et la fin d’un intervalle savoir classifier ce type d’interval savoir ensuite faire des groupes d’intervalles classifier la

    Séance et à partir de cela être capable du coup de générer directement du texte parce que ce qui est quand même en VOG en 2020 23 être capable d’avoir une générationnelle pour contact être avoir un contact direct avec euh le consommateur et nous dans notre cas le sportif et donc la finalité

    De tout ça c’est avoir euh des notifications directement après une séance avec euh le rendu l’analyse automatisée de la séance effectuée par le coureur et le second point du coup au niveau de l’aut de la de l’automatisation du coach si je si je peux appeler ça et de l’utilisation de

    De modèle dia pour euh avoir un coach personnalisé par athlète c’est au niveau de la prescription de l’entraînement et donc pour cela euh nous c’est utilisé une branche de liia qui s’appelle le reinforcement learning qui est euh qui sont des algorithmes qui fonctionnent un petit peu comme un comme un être humain

    C’est-à-dire qui va fonctionner par euh trilon and error donc par essaiis et euh erreur c’est ce qu’on appelle du coup c’est ce qui est représenté sur ce schéma par le rectangle jaune qui est du coup en fait notre agent qui est un agent qui est dans un environnement l’environnement

    C’est l’environnement dans lequel évolue le sportif donc cet agent qui est notre modèle d’intelligence artificielle va préscrire et donc recommander une séance d’entraînement à notre sportif ce sportif va donc effectuer la séance à partir de cette séance on va avoir de nombreux capteurs qui vont nous permettre de collecter des données sur

    Cette séance donc que ce soit au niveau euh de l’entraînement que ce soit ensuite au niveau de la récupération du coup à J +1 comment il a dormi comment ont été ses valeurs euh de variabilité de la fréquence cardiaque qu’est-ce qu’il a mangé est-ce qu’il y a eu des

    Blessures et cetera et à partir de cette données-là être capable de fournir un retour au modèle au niveau euh du coup d’une reward où on le félicite ou on le gronde s’il s’est trompé sur sa recommandation et donc c’est un cycle littératif comme ça où au

    Fur et à mesure le modèle apprendre ses erreurs pour déterminer la stratégie optimale et donc le plan d’entraînement optimal pour le sportif concerné donc les objectifs derrière C nous c’est quelque chose qui est encore en développement au sein de la société parce que c’est beaucoup de Red notamment beaucoup de problématiques au

    Niveau de la mesure de la performance euh pour être tout à fait précis c’est pour pouvoir dire que un sportif évolue au cours du temps il faut être capable de mesurer son évolution et donc être capable d’extrapoler des mesures de performance à partir de ces données d’entraînement voilà pour euh cette

    Explication et donc euh çaen est tout pour mes trois cas d’usage euh sur la data il y a dans le cyclismeine merci c’était moi je trouvais que c’était super clair et puis je pense que ça nous a changé un peu du cout donc maintenant on va passer aux

    Questions alors tout le monde j’ai réactivé le son donc s’il vous plaît j’ai besoin de de calme de silence et euh donc on va prendre trois questions je sais pas si tu as le temps tu as tu as le temps aussi qu’on prenne juste trois questions ou temps oua ok merci alors les

    Questions bon il y en a moi qu’on fout apparment chanceux il y a même pas de questions ils ont tout compris euh le reinforcement learning vous avez compris cette partie de reinforcement learning le comment comment ça fonctionne la la la recommandation de de l’entraînement est-ce que tu pourrais

    Juste réexpliquer cette partie aller sur les slides tu tu vois une fois que la première partie tu vois que on a déjà analysé les entraînements avec ouais donc c’est c’est quoi réexpliquer au niveau du rforement learning oui oui voilà ce que c’est et puis exactement comment ça fonctionne à ce

    Niveau-là au niveau du RL c’est des modèles qui sont beaucoup utilisés par exemple on en a entendu beaucoup parler par exemple chez SpaceX pour l’atterrissage des des différents étages de leur fusée où en fait c’est permet d’avoir de la simulation de ce qui va se passer dans tel ou telle si on effectue

    Telle ou telle stratégie et donc à partir de toutes ces simulations tester des millions voir des milliards de possibilités pour déterminer telle qui est optimale et donc en appliquant ça dans notre cas c’est avoir un comme si on était capable de simuler pour telle personne donc par exemple pour moi aujourd’hui panttoine toutes

    Les possibilités d’entraînement possies et de mesurer impact de chacune d’entre elles sur sur ma performance pour déterminer du coup la stratégie qui est optimale pour atteindre mon objectif dans un temps fixé et donc c’est euh c’est des modèles qui coûte très cher au niveau au niveau des calculs parce que c’est des essais

    De millions et de millions de stratégies possible ok ok d’accord ben je je te remercie euh je te remercie paul Antoine et bon ben finalement il y a pas d’autres questions alors moi si jamais j’en ai une du coup ah ok si si si c’est si c’est possible du

    Coup parce que du coup comme on parlait quand même de donné je pense qu’ sont quand même assez privés sur le côté sommeil choses un petit peu comme ça c’està dire que du coup vous travaillez directement avec certains club cyclistes enfin je enfin de certaines équipes

    Entre guillemets et du coup moi je suis juste intéressé de savoir un peu alors je sais pas si vous avez droit de citer des noms si vous avez citer des nom c’est cool sinon quel est un peu le type un peu de typologie d’équipe avec lesquel vous pouvez être amené à

    Travailler et du coup petite question subsidiaire est-ce que vous auriez pu venir voir euh enfin venir voir venir pas très français ça mais la défaillance de Pogy lors du dernier Tour de France euh du coup pour répondre à la première question nous on travaille surtout avec des équipes du coup World Tour des

    Équipes qui qui participent au Tour de France donc on est à globalement neuf sur les 18 qui sont World Tour aujourd’hui donc c’est surtout sur un niveau professionnel et pour faire un petit peu le parallèle à à ta présentation juste avant nous on n pas les mêmes problèmes dans le sens où les

    Données appartiennent à l’athlète et ce qui fait que quand un athlète rejoint une équipe il vient avec toutes ces données d’entraînement des saisons précédentes donc il nous permet d’avoir beaucoup plus euh de données pour entraîner les modèles et sur sur la deuxème euh question de la réponse euh la

    Deuxème partie de la question euh justement c’est l’objectif avec ce modèle que j’ai présenté c’est être capable de de prédire ce genre de défaillance et du coup de pouvoir adapter la stratégie en fonction et du coup nous on s’est rendu compte justement en 3e semaine du Tour de

    France que c’était à partir de ces données euh de variabilité de la fréquence cardiaque et aussi de fréquence cardiaque de repos que ça ça nous apportait beaucoup d’informations au niveau des prédictions et que il y avait des écarts qui étaient énormes certains jours ok ben

    Leave A Reply