La puck roulait pas pour nous autres... : 44 saisons de la LNH décortiquées
114 pages
Français

Vous pourrez modifier la taille du texte de cet ouvrage

La puck roulait pas pour nous autres... : 44 saisons de la LNH décortiquées , livre ebook

-

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus
114 pages
Français

Vous pourrez modifier la taille du texte de cet ouvrage

Obtenez un accès à la bibliothèque pour le consulter en ligne
En savoir plus

Description

Comment gagne-t-on la Coupe Stanley? Grâce à la défense ou à l’attaque? Quelle est l’importance de la position de gardien? Qui a été le meilleur attaquant, toutes époques confondues? Quelle est la valeur réelle d’un choix de repêchage?
Autant de questions qui trouvent ici réponse pour la toute première fois grâce à des méthodes statistiques éprouvées. L’ouvrage, au verbe vif et au ton léger, joint au propos l’anecdote, l’humour et des observations éclairées sur le sport national des Québécois.
Préfacé par Mathias Brunet, réputé journaliste sportif de La Presse, La puck roulait pas pour nous autres… passe au peigne fin 44 saisons de la Ligue nationale de hockey, de 1968 à nos jours. Il intéressera non seulement les millions d’amateurs de hockey et de pools du Québec, mais aussi tous ceux qui gravitent dans cet univers professionnel : entraîneurs, journalistes et dépisteurs.

Sujets

Informations

Publié par
Date de parution 02 avril 2014
Nombre de lectures 0
EAN13 9782923794617
Langue Français
Poids de l'ouvrage 4 Mo

Informations légales : prix de location à la page 0,0025€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.

Exrait

LA PUCK ROULAIT PAS POUR NOUS AUTRES...

Montage graphique : André Durocher (syclone.com)
Édition et direction du projet : Sylvain Harvey
Révision : Eve Renaud
Image de la page couverture : Lonely / Shutterstock.com

Première édition, 2014
© Éditions Sylvain Harvey
ISBN 978-2-923794-60-0

Imprimé au Canada

Dépôt légal – Bibliothèque et Archives nationales du Québec, 2014
Dépôt légal – Bibliothèque et Archives Canada, 2014

Éditions Sylvain Harvey
Téléphone : 418 692-1336 (région de Québec)
Sans frais : 1 800 476-2068 (Canada et États-Unis)
Courriel : info@editionssylvainharvey.com
Site Web : www.editionssylvainharvey.com

Diffusion : Les Guides de voyage Ulysse
Distribution au Canada : Socadis

Les Éditions Sylvain Harvey remercient la Société de développement des entreprises culturelles du Québec (SODEC) pour son aide à l’édition, à la promotion et à la numérisation.

Gouvernement du Québec – Programme de crédit d’impôt pour l’édition de livres – Gestion SODEC

Nous reconnaissons l’aide financière du gouvernement du Canada par l’entremise du Programme d’aide au développement de l’industrie de l’édition (PADIÉ) pour nos activités d’édition.

ISBN:
978-2-923794-61-7 (e-pub)
978-2-923794-60-0 (papier)
978-2-923794-62-4 (pdf)



Avant-propos
L’objectif sportif d’un club de la Ligue nationale de hockey est de gagner la Coupe Stanley. Oui, « sportif » : le volet affaires poursuit d’autres objectifs, notamment... s’enrichir. Les championnats n’y participent pas forcément.
Ce livre s’en tient à l’aspect sportif. Il décortique la recette mathématique qui sous-tend la dernière victoire de la saison, la seule qui compte.
Rien que ça! Mais savourez la nuance : « qui sous-tend la dernière victoire ». Celle-ci n’est pas modélisable. Mais la route qui y mène, oui, en partie.
L’approche mathématique du sport ne date pas d’hier : voici plus d’un siècle que les gérants du baseball savent qu’opposer des frappeurs droitiers aux lanceurs gauchers (et vice-versa) met plus d’hommes sur les sentiers. Pour le savoir, ils ont aiguisé leurs crayons à mine et ils ont calculé cet avantage.
Aujourd’hui, la moindre équipe de la NCAA emploie des dizaines d’analystes qui font tourner des macros Excel, qui modélisent des milliers de séquences vidéo et qui ont des gommes au bout de leurs crayons en plus.
Tout ça est devenu très sérieux.
Peut-être un peu trop. Alors, au passage, on s’amusera 1 . Le fatras de chiffres et les conclusions pompeuses, mêmes « scientifiques », n’intéressent en général que ceux qui les rédigent.
Cela dit, les méthodes statistiques employées seront parfaitement kasher. Nous apporterons un soin maniaque à l’exactitude des chiffres extraits, compilés et cités.
Un mot avant d’attaquer le vif du sujet. Il paraît que l’on peut « faire dire ce que l’on veut aux chiffres ». C’est vrai, mais... ils n’ont rien fait à personne, les chiffres. C’est de ceux qui les manipulent qu’il faut se méfier. Or, lecteur, je prends un engagement. Je n’ai aucune idée des conclusions qui surviendront dans les pages qui suivent. J’aurai, comme toi, le plaisir de les découvrir lorsqu’elles surgiront.
Parce que fondamentalement, ce sont des questions que je me pose aussi... depuis l’époque où, enfant, j’écoutais les Nordiques à la radio les soirs de tempête (sinon, le signal ne se rendait pas). L’idée m’est venue d’écrire ce livre en analysant des millions (littéralement) de données sur l’économie internationale. L’analyse économique, c’est mon métier. C’est fascinant; mais quand même un peu « plate »...
Et enfin, puisqu’il faut bien le dire : je suis un hockeyeur plutôt nullissime! Mon fait d’armes est d’avoir marqué deux buts dans le même match au niveau pee-wee; seulement, ils ont été les deux seuls de la saison. Mais je me rappelle encore le « dooong » de la rondelle frappant le fond du filet.
Préface
J’ai longtemps cherché à découvrir quel lecteur se cachait derrière le pseudonyme mikhail_boulgakov.
Je nourris un blogue sur la Ligue nationale de hockey pour le compte de La Presse, depuis 2009. Par chance, et aussi par pur bonheur, quelques personnages d’impact illuminent encore davantage cet espace virtuel fréquenté chaque semaine par plusieurs centaines de milliers d’amateurs de hockey.
Emprunter le nom d’un célèbre écrivain russe sur un blogue destiné au hockey suscitait déjà ma sympathie. Quelle magnifique manifestation de décloisonnement de l’esprit dans un milieu où les gérants d’estrade et les clichés pullulent.
Ses commentaires parfois acerbes, mais toujours étayés par une implacable logique et une rigueur exceptionnelle, m’ont souvent poussé vers une gymnastique intellectuelle encore plus soutenue. Je crois être devenu un meilleur blogueur, du moins je l’espère, au contact de lecteurs lumineux comme « boulga ».
J’ai appris au fil du temps que ce dernier était analyste économique, d’où son caractère très cartésien, ses analyses minutieuses et ses révélations étonnantes sur le hockey, grâce aux statistiques.
Puis, ces derniers mois, le chat est sorti du sac. Philippe Navarro, alias mikhail_boulgakov, m’a annoncé la parution de son livre La puck roulait pas pour nous autres... On y trouve 44 saisons de la Ligue nationale de hockey, de 1968 à nos jours, passées au peigne fin par notre homme, qui manie aussi bien la plume que les chiffres.
Michael Lewis a écrit en 2003 le célèbre Moneyball , dans lequel il décrit la méthode analytique moderne instaurée par le directeur général des A’s d’Oakland, Billy Beane, pour bâtir une équipe puissante en dépit de moyens financiers limités. Le milieu du hockey a toujours réagi de la même façon à Moneyball , c’est-à-dire en arguant que la vitesse du jeu, l’émotion et l’impulsivité des joueurs empêchaient de telles analyses statistiques de s’appliquer à leur sport.
Je leur recommande fortement de lire La puck ro ulai t pas pour nous autres... du brillant Philippe Navarro.
Mathias Brunet
Introduction
Comme toute route, celle qui mène à la Coupe Stanley n’a ni début ni fin; on l’emprunte pour aller de A à B, mais il y a toujours quelque chose avant A, et autre chose après B.
Lecteur, je te promets de ne plus faire de métaphysique après ce coup-là.
Où donc commence cette route? Ce livre escamotera la vision romantique – chère aux vendeurs de houblon – du garçon de sept ans, seul sur un étang glacé de l’Alberta, s’imaginant marquer le but en prolongation du septième match. Plus prosaïquement, nous considérerons que cette route débute souvent à une table de repêchage.
Où se termine-t-elle? Dès lors qu’un club gagne une Coupe, il pense déjà sans doute à la prochaine. Mais nous considérerons cet objectif comme terminal.
En 1987, douze clubs ont laissé passer celui qui allait s’avérer le meilleur pointeur de sa cuvée, sinon l’un des meilleurs de sa génération : Joe Sakic. Québec a échangé un excellent hockeyeur, Dale Hunter, alors au sommet de sa forme et de sa popularité, pour obtenir un deuxième choix de première ronde. Les Nordiques avaient auparavant parié sur un jeune défenseur, Bryan Fogarty, qui noiera un superbe potentiel dans l’alcool.
Il y aura eu entretemps l’échange d’une diva récalcitrante, Eric Lindros, pour des actifs – dont Peter Forsberg, qui valait autant à lui seul – qui s’avéreront supérieurs au final, un déménagement au Colorado, l’addition mélodramatique du meilleur gardien de sa génération en la personne de Patrick Roy, et enfin, ces Coupes de 1996 et de 2001, qu’il a bien fallu gagner à la régulière. Personne ne les donne d’avance au meilleur club « sur papier ».
Et un million d’intangibles avec ça. Mais si l’on doit remonter le filon de ces deux championnats, c’est sans doute jusqu’à cet instant précis où un jeune homme de Burnaby a enfilé un chandail bleu grâce à ce deuxième choix. Bien sûr, à ce moment, on l’ignorait. Et raconter la saga en y plaçant ces accents a posteriori , c’est, il faut bien l’admettre, confondre la succession des événements avec leur causalité. Nous nous en garderons bien.
Mais il reste que chaque Coupe a son histoire. Et aucune de ces histoires ne commence la veille d’une série décisive. Aucun club ne saurait se trouver en position de gagner une Coupe par le seul fait du hasard. La route vers la Coupe est bien longue, et sa destination est – forcément – atteinte seulement par des gagnants. Or, les gagnants – comme les perdants du reste – laissent des traces. Ces traces, au fil des ans, forment un sillon. Et avec patience et méthode, on peut débusquer des patterns.
Il n’y a pas de « recette magique » pour gagner une Coupe Stanley, entendons-nous bien. C’est comme le tabagisme et le cancer. Le lien causal est assez solidement établi. Pourtant, chaque jour, des fumeurs invétérés enterrent des bouffeurs de luzerne. Il leur arrive même d’inscrire leur nom sur la Coupe, quoique ce soit sans doute de plus en plus rare.
Ne pas fumer ne fait pas vivre vieux; cela en accroît la probabilité, tout simplement. C’est même déjà un léger accroc à la logique pure, puisque le seul fait établi est que le tabagisme accroît la propension à mourir prématurément. Mais le savoir ce n’est déjà pas mal. Et il en sera ainsi pour les conclusions auxquelles nous en viendrons concernant le hockey.
Dans un premier temps, nous examinerons ce que doit faire une équipe pour réussir en saison, puis en séries. Dans un deuxième temps, nous examinerons l’apport des joueurs à cette équipe. Enfin, nous examinerons le principal mécanisme de recrutement des joueurs : le repêchage. Ces trois sections peuvent aussi être lues dans le désordre; après tout, les poolers n’ont que faire de la dimension « équipe ». Je ne suis pas de cette tribu, cela dit, malgré ma passion pour les statistiques sportives.
Tout cela participe à la conquête d’une Coupe. Étant entendu qu’il faut bien que la puck roule un peu pour nous autres 2 !
LA MÉTHODE
Ah! La section ennuyante qu’on ne lit jamais, pour sauter directement aux conclusions. Pourtant, il faut invariablement y revenir pour mieux les comprendre. Lecteur, je vais t’éviter ce puéril chassé-croisé et faire ça court.
Sinon, rendez-vous au chapitre « L’équipe ».

L’ athlétométrie
Un mot d’ordre général avant d’attaquer le particulier. Plusieurs disciplines puisent dans le vaste corpus de méthodes mathématiques et statistiques : la physique, le génie, bien entendu, mais aussi la médecine, la climatologie, l’économétrie.
L’ athlétométrie (si l’on se permet de forger un néologisme) se prête parfaitement à ces méthodes. Elle a même un avantage : la donnée « dure ». Le hard data , en opposition au soft data . Or, dans notre époque obsédée par les chiffres – Jules César n’a jamais su le PIB de l’Empire – il y a beaucoup plus de soft data que l’on n’imagine.

Il a fait 27,2 degrés à Montréal hier. Hard data ? Où ça à Montréal? À quelle heure? À quelle hauteur du sol? Endroit densément peuplé ou non? Selon quel instrument de mesure? Calibré quand? Le Québec a exporté 44,5 millions de dollars d’aluminium vers la France en 2012. Vraiment? Comptabilisé ou livré? En quelle devise? Sous quel code d’exportation? En incluant ou non le transport et les assurances? Combien de tonnes sont passées par les Pays-Bas? Avant de conclure qu’il fait plus chaud à Montréal en 2013 qu’en 1993, avant de conclure que l’aluminium a remplacé les peaux de castor dans le commerce transatlantique, les climatologues et les économètres sérieux se lèvent de très bonne heure. Parce que leurs données mêmes, à la base, sont en réalité formidablement vaseuses, et qu’ils le savent.
Mais ce qui est bien avec l’ athlétométrie , c’est qu’elle est fiable : George Laraque a très exactement marqué 506 buts de moins pour le Canadien que Jean Béliveau (et passé seulement 97 minutes de plus au banc des punitions en carrière). Pas 505, pas 98. Non : 506 et 97. Bien sûr, marquer 50 buts par saison dans les années 1980 ne signifie plus la même chose qu’aujourd’hui (et nous adresserons cette issue 3 ); mais la donnée, elle, est hard .
Or, une méthode statistique ne peut cracher un résultat meilleur que la donnée qu’on lui donne à gober!
L’ athlétométrie est une discipline qui a de l’avenir.

44 saisons décortiquées
La période d’analyse principale s’échelonne de la saison 1968 à la saison 2012. L’année de clôture de la saison réfère à la saison complète : par exemple, la saison 1985-1986 sera la saison « 1986 ». Ainsi, l’année de référence des séries et de la Coupe correspondent avec la saison. La « période » dans le texte, ce sera ces 44 saisons – pas 45, puisqu’un lock-out a annulé la saison 2005.
Pourquoi 1968? L’expansion à douze clubs donne un plus gros échantillon statistique que six clubs et deux rondes de séries. Ce n’est pas un décret quant à la qualité tactique et stratégique du hockey des années 1940 à 1960. De fait, c’était de l’excellent hockey! Pourquoi 2012? Ça prend du temps, calculer et rédiger tout ça, et bon « adon » : 2013 n’a été qu’une demi-saison, et en 2014, on réaligne les divisions. Bon timing pour faire un bilan! Cela nous évitera aussi d’avoir à statuer sur cette formidable aberration des conférences asymétriques!
La période sera parfois raccourcie, ou pourra exceptionnellement inclure 2013, en fonction des données disponibles, ou pour d’autres raisons qui seront précisées en temps et lieu.
Ces 44 saisons représentent un échantillon de 39 923 parties en saison régulière, au cours desquelles 253 328 buts ont été marqués. En séries, l’échantillon est de 3 124 parties et 18 527 buts. Après trois défaites consécutives – ou parfois trois buts dans une période – un bon coach commence déjà à avoir une idée de ce qui cloche...
: : SOMME RÉÉLLE DES MATCHS JOUÉS
La somme réelle des matchs joués entre 1968 et 2012 est le double (79 846 en saison régulière et 6 248 en séries), puisque chaque match joué est compilé dans les statistiques des deux équipes l’ayant disputé.
Le lecteur qui aura fait un rapide calcul mental sera arrivé à la bonne conclusion : il se marque historiquement plus de buts en saison qu’en séries (3,17 et 2,97 buts pour, respectivement). Mais ne brûlons pas le punch! D’ores et déjà, le lecteur averti peut déboulonner un mythe : un joueur qui aurait connu une « baisse de régime » en carrière de 6,5 % de points par match en séries ne serait pas nécessairement un choker !
La source principale des chiffres est le site de hockey-reference . Le site de la LNH et l’incontournable hockeydb ont aussi largement servi. Quand on parle de hard data : en dix ans de navigation sur ces sites, je n’ai jamais trouvé une seule information contradictoire, et pas davantage dans le cadre de la rédaction de cet ouvrage.
Un petit mot sur un sujet bien futile, mais tout de même... Nous utiliserons la transcription cyrillique-français des noms russes. Elle est du reste la norme au Québec : on écrit bien Poutine et non « Putin », n’est-ce pas? Alors pourquoi diable écrirait-on Malkin plutôt que Malkine? Parce que l’un est un homme politique et l’autre un joueur de hockey? Un peu absurde!

Il se serait marqué 18 529 buts en séries si on incluait les buts refusés à Alain Côté en 1987 et à Joe Sakic en 1995 : c’est cruel, le hard data . Nous ne chercherons pas à démontrer le désamour de la ligue pour les défunts (et putatifs) Nordiques, même si ce serait assez amusant.

Les livres ne balancent plus!
Un mot sur un sac de nœuds : le maudit point pour défaite en prolongation.
Ce point – véritable scrupule dans la chaussure statistique –, institué durant la saison 2000, sera le plus souvent considéré comme une nulle après 60 minutes. Ce ne sera pas toujours possible. Ce n’est pas tant ce point qui est problématique, du reste, que le troisième point, accordé automatiquement au gagnant, qui plus est, depuis l’instauration des tirs de barrage en 2006. Entre 2000 et 2012, 32 027 points ont été récoltés en 14 678 matchs joués, alors que sans point prime, l’enjeu n’aurait été que de 29 356 points. Une vraie saison de 0,500 avant 2000 équivaut donc à une saison de 0,545 après 2000. En clair, une fiche de 11-9-0 n’est plus vraiment une fiche gagnante, ou à peine. C’est un peu consternant, mais passons!
Il faudrait donc, en principe, appliquer une correction à la baisse de 9,1 % aux moyennes d’après 2000 lorsque nécessaire.
J’entends hurler : ce n’est pas parfait comme méthode. Un club qui gagnerait et perdrait tous ses matchs « à la régulière » verrait sa moyenne ajustée à la baisse, alors que tous ses points seraient mérités. Les trois points de l’enjeu ont aussi davantage tendance à rehausser la moyenne des clubs faibles (qui annulent de peine et de misère après 60 minutes) que celle des clubs forts (qui ont une propension accrue à gagner par des écarts francs). La seule méthode vraiment rigoureuse serait de décortiquer ces 29 356 matchs un à un et de refaire un classement pour chaque année, en attribuant un point de nulle à la fois pour une victoire ou une défaite en prolongation ou en tirs de barrage. Mais du coup, ce serait le classement qui ne serait plus bon... Qui a pourtant servi de base pour faire ou non les séries!
Ça ne marche pas. On choisit ses batailles. Conclusion : nous adopterons des méthodes qui permettront d’appliquer cette correction de 9,1 % le moins souvent possible.
Mais ce n’est pas tout. Il faudra aussi soustraire de la colonne des « buts pour » par club et, au total, si nécessaire, les buts comptabilisés à la fin de la séance de tir de barrages depuis 2006 : ces buts ne sont pas attribués à un marqueur, pas plus qu’ils ne sont imputés à un gardien. Ce sont des buts « comptables », en quelque sorte, mais qui « débalancent » les livres (en effet : la somme des buts pour ne correspond plus à la somme de la colonne des marqueurs!). Il y a tout de même eu 1 138 buts comptabilisés ainsi pendant les sept saisons entre 2006 et 2012. Ça joue sur les centièmes de décimale une fois ramenés en buts moyens par club, mais tout de même, on ne peut pas ne pas faire la correction 4 .

Mario Lemieux et Patrick Roy, sans doute les deux joueurs québécois les plus dominants de leur génération, sont nés exactement le même jour, soit le 5 octobre 1965. Ce livre se gardera bien de porter indûment à l’attention du lecteur ce genre de rapprochement saugrenu.

La « loi de la moyenne » et autres sophismes
Nous ne donnerons pas dans les chakras. Même s’il était vrai que les clubs portant un chandail vert n’ont jamais perdu les dimanches du Super Bowl, cela ne veut pas dire qu’ils gagneront lors du prochain, ni qu’il faille précisément jouer les dimanches, avec un chandail vert, et encore moins qu’il y ait un lien avec la couleur du gazon, et encore moins que c’est bel et bien la couleur de l’optimisme, la preuve étant qu’ils ont gagné, banane!
Idem pour les autres sophismes, parfois plus subtils, mais en définitive aussi idiots : la fiche des clubs qui perdaient une série deux matchs à trois depuis 1950 n’a aucune incidence sur le sixième match qui se jouera demain. Il n’y a qu’une certitude statistique pour les esprits simples qui croient aux martingales : ils ont une propension plus élevée à recevoir la visite d’un shylock .
Remonter zéro match à trois dans une série quatre de sept n’est pas improbable parce que ça ne s’est fait que deux fois depuis le débarquement de Normandie; c’est improbable par que c’est difficile en soi , et que cela se démontre.
Même chose pour la « loi de la moyenne » qui, voyez-vous, n’existe pas! Un événement n’est jamais « dû » pour se passer. C’est une illusion d’optique mathématique qui s’explique. Considérons deux équipes de force égale : les chances que l’une batte l’autre sont de une sur deux, et deux fois d’affilée de une sur quatre. Les chances qu’elle la batte trois fois d’affilée sont de une sur huit, et quatre fois d’affilée, de une sur seize. Mais ce postulat vaut dès avant que le premier match soit joué! L’illusion vient du fait qu’une suite de quatre gains est peu probable lorsqu’on la considère a priori . En cours de route, après trois gains, les chances de réaliser le quatrième sont de une sur deux. Il n’y a pas de loi de la moyenne qui favoriserait le « rattrapage » de l’équipe qui vient de perdre trois matchs. Cette erreur d’optique vient du fait que le scénario de quatre gains ou défaites d’affilée était peu probable dès le départ.
La seule chose qui s’apparenterait à une « loi de la moyenne » est le constat, a posteriori , que des équipes de force égale auront tendance à se partager les honneurs et ce, d’autant plus que l’échantillon de matchs les opposant sera grand.
On fera lorsqu’il le faudra la nuance entre la médiane et la moyenne. La médiane est tout simplement la donnée centrale, une fois les données classées. C’est parfois plus parlant. C’est que la moyenne est décidément une méthode assez galvaudée, même si elle est très prisée. Il est souvent fait état, par exemple, de la taille « moyenne » d’une brigade défensive. Un groupe de cinq défenseurs entre six pieds et six pieds trois pouces ne gagne pas nécessairement un pouce « en moyenne » parce qu’il joue avec Zdeno Chara (6 pieds 9 pouces).
Il faudra aussi se méfier des raisonnements circulaires que nos profs de philo nous ont patiemment appris à débusquer 5 . Un club marquant beaucoup de buts pourrait gagner une part appréciable de matchs, comme Edmonton dans les années 1980, par exemple, mais ceci expliquerait (peut-être) cela dans ce cas-ci. On ne saurait tirer une conclusion générale de cette observation. La description n’est pas l’explication; à ce compte, la principale cause de divorce est le mariage!
Il arrivera aussi que 15 buts et 33 passes = 47 points, pas 48. Ne sautez pas sur vos claviers pour accabler l’auteur. C’était 14,6 + 32,6 = 47,2.
Est-ce qu’une erreur pourra se glisser? Certainement. Il s’en glisse toujours. Même au Ritz, il y a parfois des coquerelles entre les draps. Est-ce qu’une erreur à ce point crasse met en péril les conclusions de cet ouvrage? Non.

Le quantifiable et le moins quantifiable
Un mot, aussi, sur la « psychologie ». Elle existe, c’est entendu : une équipe plus « motivée », plus « émotive », plus « prête », aura souvent raison d’une équipe qui n’est rien de cela, même à talent inférieur. C’est vrai pour tous les sports, mais peut-être encore davantage au hockey. Dans ce sport de teignes, limite voyou les mauvais soirs, un club lymphatique a vraiment hâte que le match finisse... quitte à le concéder. Même si ces observations relèvent aussi parfois davantage de l’épiphénomène que de la modélisation systémique. Mais cette réalité explique aussi peut-être en partie pourquoi le hockey est sans doute le dernier sport majeur nord-américain à résister à la modélisation statistique.
Il reste que tout cela est largement du domaine du post hoc 6 . L’entraîneur fait un discours galvanisant entre les périodes et il s’ensuit effectivement une remontée. Donc , (et c’est précisément ce donc qui est fallacieux) c’était grâce au discours. Les joueurs « ont la tête au golf » après trois défaites en séries. L’équipe perd le quatrième match. Donc , c’était à cause du golf... Bobby Clarke casse la cheville de Valeri Kharlamov, les Soviétiques perdent, donc ... Oups, non, là c’était peut-être un peu plus un vrai « donc » causal...
Bien sûr, ces événements s’observent réellement certains soirs. Même si l’esprit humain oublie commodément toutes les défaites après des discours galvanisants, et toutes les victoires qui feront 1-3 dans une série, tout de même perdue au final. Mais il faudrait une base de données de tous les discours prononcés... des coups salauds... de ce qui traverse l’esprit de chaque joueur, de tout temps... Et c’est là que les « logues » et les « istes » prennent des chemins divergents.
Au final, toutes les réalités ne sont pas toutes quantifiables. La psychologie sur la glace est un intangible. Du reste, tant pour un club que pour l’autre, le désir de vaincre accru après deux défaites peut se transformer en découragement, et le relâchement après deux victoires, en acuité renouvelée. Comment départager cela? Ça fait sans doute de la bonne télé et c’est de bonne guerre, mais nous devrons, dans le cadre de ce livre, faire largement abstraction de tout ce qui relève de la psychologie sportive.

Ce livre ne cédera pas au jargon des économètres : aucune corrélation r carré n’est au-dessus de 0,05, ce qui signifie que 1 % de la variance en tirs peut s’expliquer par la variance des bagarres... Ouf...
Lecteur : c’est ma job ce genre de jargon et, bien franchement, je dois toujours relire ces damnées phrases deux fois pour les comprendre. Alors, si je décide de faire plus simple dans cet ouvrage, ce ne sera pas parce que je te prends pour un idiot!

Les logarithmes au placard
Nous éviterons le piège de la modélisation à outrance. Par exemple, « l’expectative de Pythagore », développée en « sabermétrie », est pour ainsi dire une loi (une vraie, celle-là) qui prévoit le pourcentage de victoires d’un club de baseball au cours d’une saison en fonction des points marqués et encaissés. Ça marche aussi pour le hockey, mais en moins élégant (le baseball est l’incarnation sportive des mathématiques).
C’est de l’économétrie, en réalité. Des régressions. C’est très costaud, causal, ce genre de choses, mais c’est un tantinet assommant. C’est très pertinent, les logs, les r 2 et tout ça. On en trouve de très bien faits sur le web.
Mais entre nous, appliquer des logarithmes, même aux statistiques astronomiques de Wayne Gretzky, c’est plutôt violent, n’en déplaise aux kids qui sortent des HEC. Nous laissons les logs aux distances entre les étoiles, aux exportations de pétrole du Koweit et aux climatologues quand ils veulent faire croire que la hausse du taux de CO 2 est vraiment alarmante.
Non, lecteur, je n’ai pas envie de te perdre. Déjà, j’ai écrit « logarithme » alors que je n’aurais pas dû, et j’ai fait une blague sur l’environnement.
Nous chercherons le juste milieu. Peut-être une régression linéaire par-ci par-là, mais en cachette. Les calculs, c’est comme les armatures de soutien-gorge : il faut que ça soutienne le propos, mais discrètement.
La corrélation de rang sera une méthode fréquentée. Mais c’est une méthode sans doute supérieure, dans ce cas précis, aux autres méthodes basées sur les chiffres absolus (comme les régressions). Un de ses avantages non négligeables, déjà, est d’annuler de nombreux biais statistiques, notamment celui introduit depuis 2000 par la fréquence aléatoire de matchs de trois points. Les moyennes sont toutes à la hausse, les buts pour et contre sont à la baisse, mais un premier rang est toujours un premier rang.
: : LA CORRÉLATION DE RANG
La corrélation de rang examine seulement les rangs au sein d’un groupe : par exemple, dans une classe de 10 enfants, le classement (et non les résultats absolus) après un test de mathématiques. Pas leurs notes, seulement leurs rangs : 1 er , 2 e , 3 e , etc. Oui, c’est volontairement réducteur : un enfant peut arriver au 8 e rang de sa classe avec un résultat absolu qui lui aurait conféré le 2 e rang de la classe voisine. Le résultat absolu dit qu’il est « bon », mais dans sa classe il s’en trouve tout de même 7 meilleurs que lui. Chaque méthode apporte son éclairage sur la même réalité.
Or, ce sont les rangs, au hockey, qui déterminent ceux qui iront en séries (en clair, les gagnants et les perdants) – pas les chiffres absolus. La première étape vers la Coupe – la saison régulière – n’exige pas un seuil de points, de victoires ou de buts engrangés, mais bien l’obtention d’un rang prédéterminé. En séries, l’équipe qui soulève la Coupe termine au 1 er rang des victoires acquises, inévitablement.
Mais qu’est-ce qu’une corrélation de rang ? C’est comparer deux classements, pour établir leur degré de similitude. Par exemple, les rangs des mêmes 10 enfants, mais cette fois après un test de français. Les deux classements sont-ils comparables? Les premiers en maths ont-ils aussi fini dans les premiers en français? Et inversement? Ça se calcule.
Au hockey, il faut aligner deux classements côte à côte, par exemple, Montréal, Chicago, New York, Détroit, Boston, Toronto : 1, 2, 3, 4, 5, 6. Ça pourrait être leur rang au classement de la saison cinquante quelque. Puis on refait le classement, mais cette fois en fonction d’un autre facteur, par exemple, les buts pour. Admettons, pour les besoins de la démonstration, qu’il soit identique : Montréal, Chicago, New York, Détroit, Boston, Toronto. On applique une formule mathématique 7 .
Dans ce cas, le résultat est une corrélation de 1,0 (parfaite). Si les classements sont « miroirs » comme 1,2,3,4,5,6 et 6,5,4,3,2,1, on obtient le résultat de -1,0, qui est aussi une corrélation parfaite (parfaitement inversée). Le résultat tend vers 0 lorsqu’il n’y a pas de corrélation, par exemple 1,2,3,4,5,6 et 3,5,2,1,6,4. Plus la valeur absolue du chiffre est élevée, plus ce chiffre est concluant, bien qu’il faille éviter de conclure séance tenante.

La chaîne de causalité
Y a-t-il pour autant un lien causal lorsque les mathématiques nous disent que deux classements sont corrélés entre eux? C’est ici qu’Excel débarque et que le jugement embarque. Car une corrélation peut être ou ne pas être « causale » 8 . Toutes sortes de choses sont corrélées sans pourtant avoir de causes directes (ou même indirectes). Les buts marqués procurent des victoires. Causalité démontrable, puisque c’est dans le règlement : il faut marquer un but de plus que l’adversaire. Est-ce que les bagarres procurent des victoires? Même si les victoires et les bagarres étaient corrélées entre elles, cette causalité resterait à démontrer.
Ce livre cherchera à s’en tenir à la chaîne de causalité la plus rigoureuse possible.
C’est comme les entrées aux urgences et les accidents de la route. C’est corrélé et c’est causal. Mais quand un jeune, saoul, qui roule trop vite, s’envoie dans le décor, c’est l’inexpérience, l’alcool, ou la vitesse qui est en cause? Les trois? Peut-être. Mais pas forcément. Là encore, on trouve beaucoup de réponses toutes faites...
Quittons ces marécages polémiques... Et parlons sport.
: : WEB ET WIKIS
Autre chose? On expliquera à mesure : quelques encadrés méthodologiques encadreront le propos. Des capsules jetteront un éclairage plus anecdotique. Sinon, en cette ère de wikis, nous faisons le pari de nous passer de lexique. Les encadrés, ça fait très xx e siècle. Un livre en papier aussi, mais puisque vous l’avez entre les mains...
L’ÉQUIPE
La saison
Patience : il y a de l’enfonçage de portes ouvertes de catégorie AAA dans ces premières pages. Mais il le faut : la rigueur de la conclusion est à ce prix!
La Coupe se gagne par suite d’un processus éliminatoire à paliers. L’équipe doit franchir chaque palier. Il y en a deux. Le premier au terme de la saison, le second dans les séries.
La saison est un round-robin (imparfait) qui a pour objectif d’éliminer, au bas mot, la moitié des clubs en vertu d’un rang prédéterminé au classement.
C’est au passage assez brutal. C’est comme une meute de députés qui veulent devenir ministre, sauf avec pas de dents.
: : LE ROUND-ROBIN
Un round-robin , ou « tournoi à la ronde » est une formule de tournoi sportif qui voit chaque adversaire affronter une fois chacun des autres adversaires.
Avant d’espérer gagner la Coupe, l’équipe doit donc « faire les séries ». En clair, obtenir un rang. Le meilleur rang possible, croit-on : de 1968 à 2012, les clubs ayant terminé au 1 er rang durant la saison ont gagné la Coupe 18 fois (40,9 %). Au cours de cette période, le gagnant de la Coupe a obtenu le 2 e rang médian durant la saison qui a précédé son championnat. Le rang moyen est le 3,3 e . Le rang moyen est plus bas que le rang médian en partie parce que New Jersey a gagné en 1995 en partant du 10 e rang, et Los Angeles du 13 e en 2012 (le record). Ce genre de performance est plutôt exceptionnel : le trophée n’a échappé à un club hors du t op 6 au classement général que six fois au cours de la période.
Il serait facile d’y voir une « tendance ». On peut présumer qu’une équipe dominante durant 82 matchs aura une propension à poursuivre cette domination durant les 16 (à potentiellement 28) matchs suivants. On a beaucoup présumé ça à Vancouver récemment et à Québec à une autre époque.

L’esprit sagace (et porté à la contradiction) aura même remarqué que les clubs ayant terminé premiers... ont échappé le trophée dans 59,1 % des cas! L’esprit porté sur la pataphysique conclurait même qu’il faut, du coup, éviter le premier rang pour avoir une plus grande chance de gagner – et il n’aurait pas tout à fait tort.
Or, il n’y a pas de causalité particulièrement tangible entre le fait de terminer à un rang élevé au classement (voire le premier) durant la saison, et gagner la Coupe dans les séries qui s’ensuivent.

Les Pingouins n’aiment pas la chaleur! Pittsburgh est parti du 7 e rang au classement général pour remporter la Coupe en 1991, du 6 e en 1992, et du 9 e en 2009. A contrario , Pittsburgh a terminé au 4 e rang du classement général en 2008, mais a perdu en finale contre Détroit. La bande à Mario Lemieux s’est fait sortir au 2 e tour en 1993 après une Coupe du Président! En 2013, la bande à Sidney Crosby s’est fait sortir en 4 matchs en demi-finale après avoir fini 2 e au classement...
Mais tout cela est circonstanciel; les matheux ont une sainte horreur du anecdotal evidence . Obtenir un bon classement n’est pas une condition nécessaire avant même d’être vaguement causale. La seule condition nécessaire (ce qui ne peut pas ne pas être, comme l’écrivait Aristote) est d’engranger assez de points pour obtenir le rang d’accès prédéterminé, soit le 8 e sur 15 dans le système qui a prévalu jusqu’en 2013, et qui est essentiellement aussi celui du wild card instauré par la suite.
C’est de là qu’on part!

L’important n’est pas de participer
Comment est établi le rang? Par total de points. Comment obtient-on des points? En gagnant, bien entendu. Mais pas seulement. Annuler aussi (ou perdre en prolongation depuis 2000) est en relation causale avec le rang au classement, puisque cela procure un point. Un point, ce n’est pas gagner, mais c’est tout de même ne pas perdre .
: : MEILLEUR AVEC 40 VICTOIRES EN MOINS
L’optimum théorique dans une saison de 82 matchs (en supposant 2 points pour une victoire et 1 point pour la nulle) est une fiche de 82-0-0 (164 points). Or, un club avec 82 nulles (fiche de 0-0-82, bonne pour 82 points) termine devant un club présentant une fiche de 40-42-0 (80 points). Ne jamais sous-estimer la nulle; c’est du reste pourquoi certaines disciplines prévoient 3 points pour la victoire (au foot et aux échecs, par exemple).
C’est pour cette raison que régulièrement, au hockey, des clubs finissent quelques rangs au classement derrière des clubs avec moins de victoires, un état de fait qui n’aura de cesse de choquer les fans de baseball. Les distorsions sont parfois plus significatives, et ont empiré avec les satanés matchs de 3 points 9 . Exemple récent : en 2010, Philadelphie a obtenu 41 victoires (au 14 e rang de la ligue à ce chapitre) mais a néanmoins terminé au 20 e rang du classement général.

En 1970, Boston a terminé 1 er au classement général – en route vers sa 4 e Coupe – avec 40 victoires en 76 parties, tandis que Chicago, 2 e , en récoltait 45. Boston avait fait 19 matchs nuls, ce qui représentait précisément le quart de la saison.
Notre premier test statistique sera donc de déterminer s’il est plus payant de gagner que d’annuler pour engranger un maximum de points. C’t’ivident 10 ! Mais le degré de l’évidence se mesure, et la curiosité exige de le mesurer. Les nulles feront varier ce résultat – et nous verrons jusqu’à quel degré.
: : LE CLASSEMENT GÉNÉRAL

  • Accueil Accueil
  • Univers Univers
  • Ebooks Ebooks
  • Livres audio Livres audio
  • Presse Presse
  • BD BD
  • Documents Documents