Il national bias. Introduzione

Si possono guardare le gare di pattinaggio e basta, per molti anni ho fatto così. Oppure si possono guardare le gare e ci si può porre qualche domanda, e quando le domande diventano tante prima o poi si raggiunge un punto di non ritorno. Io non posso più guardare le gare e basta, e probabilmente arriverà il momento in cui deciderò semplicemente di non guardare più le gare, perché non ho più energie emotive da investire in un sistema in cui ho smesso di credere.

National bias.

Tutti abbiamo i nostri pregiudizi, i nostri preconcetti, le cose che amiamo e quelle che detestiamo. Tutti siamo influenzati da una quantità incredibile di fattori, molti dei quali sono talmente invisibili da agire senza che noi ci rendiamo neppure conto della loro esistenza. L’ho già citato e lo cito di nuovo, leggete Pensieri lenti e veloci di Daniel Kahneman per capire un po’ meglio il funzionamento della nostra mente, del nostro modo di comportarci, per imparare a riconoscere le situazioni in cui possiamo essere mossi da qualche bias, perché la consapevolezza è l’unica cosa che ci può impedire di commettere determinati errori. Sempre se non vogliamo commetterli. E se invece non ci importa di essere di parte e anzi è quello il nostro scopo?

Recentemente ho postato una lunga serie di testi dedicati ad alcuni degli episodi meno simpatici del pattinaggio. Per lo più si tratta di voti scorretti assegnati dai giudici ai propri connazionali o a specifici atleti in base ad accordi fra federazioni. Tutte cose di cui ho letto ma su cui non ho fatto nessuna rivelazione sconvolgente visto che io sono al di fuori del mondo del pattinaggio. Quello che posso fare è guardare i documenti di gara. I protocolli sono pubblici, tutti possiamo leggerli e interrogarci sui voti assegnati dai giudici.

Fino alla stagione 2015-2016 i voti erano dati in forma anonima, i giudici li assegnavano e un computer li mescolava, così che non fosse possibile stabilire chi aveva assegnato un determinato voto. Non che in alcuni casi non sia evidente, ma anche certe evidenze non possono essere presentate come dati di fatto. Dalla stagione 2016-2017 però i voti sono diventati palesi, sappiamo quali GOE, o quali components, hanno attribuito i giudici a ciascun elemento, a ciascun pattinatore. Sarebbe bello, per i GOE, che i giudici dovessero dichiarare quali bullet positivi e quali detrazioni hanno attribuito, ma probabilmente per l’ISU sappiamo già fin troppo, non c’è mica bisogno di sapere tutto. Per esempio, non le ho lette per intero, però ho guardato le Special Regulations Single & Pair Skating Ice Dance emesse dal 57° congresso ordinario nel giugno del 2018. Non so se avete fatto caso, il testo inizia dalla regola numero 300 e censura 252 delle successive 500 regole contrassegnandole come reserved. Noi conosciamo solo una parte del regolamento, mi domando perché.

Va bene, prendo atto dei limiti entro cui posso fare controlli e vado avanti. Sono quattro stagioni, due con il vecchio codice di punteggi, la 2016-2017 e la 2017-2018, e due con il nuovo, la 2018-2019 e la 2019-2020. Questa stagione non la considero non tanto perché è appena iniziata, quanto perché le gare sono eventi domestici e come tali non posso prenderle sul serio. È giusto dare ai pattinatori la possibilità di gareggiare, se si riesce a farlo in sicurezza, ma chiamare Skate America (o Cup of China, o Rostelecom Cup o NHK Trophy, il discorso non cambia spostandoci da una nazione all’altra) una gara che ha la stessa organizzazione e la stessa importanza del neonato Gran Premio Italia è ridicolo. Magari farò qualche commento su queste gare, ma i voti che sono stati assegnati non sono entrati nelle mie medie.

Per queste quattro stagioni ho guardato i protocolli di gara delle tre discipline dell’artistico. Ho lasciato stare la danza perché anche se alcuni giudici si occupano sia di artistico che di danza, altri si occupano solo di uno dei due rami del pattinaggio, e aggiungere i nomi di altri giudici mi avrebbe reso ancora più complicato gestire un file enorme. Mi spiace che, per i giudici che giudicano anche la danza, i dati sono forzatamente parziali [edit: in seguito ho guardato anche i giudici delle altre nazioni e i giudici della danza, con il tempo ho capito come gestire al meglio i dati. Ne ho parlato sia in italiano che nel mio pessimo inglese]. Per cercare di avere statistiche significative ho allargato il più possibile il mio sguardo: Challenger Series, Grand Prix (junior e senior), World Team Trophy, Campionato continentale, Campionato del mondo (junior e senior) e Giochi olimpici. Le nazioni a cui ho dedicato la mia attenzione sono le prime sei classificate nell’ultimo Team Event olimpico, nell’ordine Canada, Russia, Stati Uniti, Italia, Giappone e Cina. La presenza della Cina per me è fondamentale, perché due giudici cinesi sono stati sospesi per national bias, e guardando loro ci possiamo fare un’idea di cosa non sia accettabile per l’ISU. Va bene, uno dei due è stato davvero scandaloso, ma il comportamento dell’altro è interessante perché ci permette di ragionare su altri giudici. In questo caso si tratta di 137 giudici (31 canadesi, 17 cinesi, 17 italiani, 25 giapponesi, 21 russi e 26 statunitensi) e dei loro 1.915 giudizi (in alcuni casi erano presenti diversi di questi giudici, quindi lo stesso programma può essere citato più volte).

I calcoli che ho fatto sono sul national bias perché è la cosa più semplice da verificare. Lo scandalo del 2002 è scoppiato perché un giudice francese ha confessato di aver assegnato la vittoria ai russi e non ai canadesi, che a suo giudizio avevano eseguito un programma migliore, a causa delle pressioni che le aveva fatto il presidente della sua federazione. Ripeto le nazionalità. La federazione francese ha imbrogliato aiutando una coppia russa a spese di una canadese. Senza una confessione, senza una prova, chi compie imbrogli di questo tipo la fa franca. Posso fare tutti i calcoli che voglio, ma il national bias qui non prova nulla. Posso vedere che i giudici della nazione A amano i pattinatori della nazione B e assegnano regolarmente voti bassi ai pattinatori della nazione C, ma non ho in mano elementi concreti per fare accuse. Magari, studiando i protocolli di gara con abbastanza attenzione, riuscirò comunque a trovare qualcosa, ma questa per ora è solo un’ipotesi di lavoro. Il national bias è verificabile con una certa facilità, basta solo avere tempo e pazienza, quindi è quello che ho guardato. Com’è che ho fatto i miei calcoli? Sono partita da grafici come questo pubblicati da Skating Scores:

Come potete vedere in questo caso si tratta del libero della gara maschile al Campionato del mondo 2017. Il giudice israeliano, Anna Kantor, ha assegnato al suo connazionale Alexey Bychenko, voti superiori rispetto alla media di 13.42 punti. Contemporaneamente con gli altri pattinatori si e fermata 3.00 punti sotto la media. Di conseguenza il suo national bias in questo programma è di 16.42 punti. Per lei Bychenko ha eseguito il settimo libero, per la totalità dei giudici il dodicesimo. Questi voti ci fanno capire che bisognerebbe davvero controllare tutti i giudici in tutte le gare. Nel discorso che farò più in basso io mi sono basata sulla somma, se avessi analizzato il bias di Anna Kantor il suo valore in questa gara sarebbe stato 16.42. Per quanto alto, non è un valore preciso, in genere il bias è più alto di quando non appaia da questo grafico, ma per vederlo bisognerebbe davvero guardare voto per voto, e serve tantissimo tempo. Mi limito a fare un solo esempio, sempre basato su questo programma.

Il giudice canadese, Jeff Lukasik, è un altro che è stato scandaloso, nella sua nazione è uno di quelli che spiccano in senso negativo, ma ci arriverò. Il giudice cinese è Weiguang Chen, uno dei due giudici sospesi dopo i Giochi olimpici, arriverò anche a lui. Quindi c’è il giudice spagnolo, Daniel Delfa.

Non ho inserito nei miei calcoli i giudici spagnoli perché già così i numeri che ho controllato sono tanti, oltretutto con il ritiro di Javier Fernandez gli spagnoli sono rimasti senza pattinatori in grado di puntare alle medaglie, almeno nell’artistico, ma per l’esempio mi soffermo sul giudice spagnolo. Vediamo cos’ha fatto Delfa. Per lui il bias nel solo programma libero è di 6.36 punti, quindi piuttosto alto. Nel programma corto era stato di 2.44 punti. Però quel 6.36 punti è dato dalla somma dei 5.22 punti in più assegnati a Fernandez con gli 1.14 punti non assegnati agli altri pattinatori. Ma, diciamolo francamente, cosa poteva importare a Delfa di quello che avrebbe fatto, per esempio, Jason Brown? Fernandez puntava al titolo, o al limite al podio, Brown, con un ottavo posto nel programma corto e nessun quadruplo in programma, puntava a una posizione nelle prime dieci, facevano due gare diverse. Per questo con lui Delfa non era guidato da solidarietà nazionale e poteva giudicarlo molto più serenamente. Vediamo allora più nello specifico cosa ha fatto Delfa:

Delfa ha assegnato voti più bassi rispetto alla media a tutti i diretti avversari di Fernandez, come evidenziato nel rettangolo il rosso. In viola ho evidenziato come, secondo lui, il libero di Fernandez sia stato il terzo e non il sesto. Per maggiore chiarezza ho guardato attentamente l’andamento di tutta la gara.

La colonna A è il punteggio ottenuto dai pattinatori nello short program, perciò nel momento in cui viene disputato il libero è un dato di fatto, si parte da qui. La colonna B indica la posizione in classifica occupata al momento dai singoli pattinatori. L’ordine in cui li ho elencati è legato alla colonna E, l’ordine in cui sono scesi in pista per eseguire il programma libero, in modo da seguire meglio l’andamento della gara. La colonna C indica il vantaggio che Fernandez aveva sugli altri pattinatori. Le colonne F e G sono un’indicazione dell’andamento della gara, il numero di quadrupli che ciascun pattinatore ha presentato e gli eventuali GOE negativi che ha ricevuto. Fernandez, come Patrick Chan, aveva in programma tre quadrupli, Nathan Chen ne aveva in programma sei ma è stato davvero falloso, tutti gli altri ne avevano in programma quattro. La colonna H indica il punteggio effettivamente ottenuto da ciascun pattinatore nel programma libero, la colonna I la somma dei punti ottenuti nei due segmenti di gara. Questi sono dati che chiunque può vedere facilmente dai documenti ufficiali, e in genere ci fermiamo qui. Quelle interessanti sono le ultime tre colonne, dati che possono essere ricavati dal protocollo di gara ma che di solito non guardiamo, perché per guardarli dovremmo metterci a fare calcoli. Nella colonna J vediamo il bias di Delfa nei confronti dei singoli pattinatori. A Hanyu Delfa non ha assegnato 5.69 punti che gli sono stati assegnati dagli altri giudici, e questo in un pannello di giuria che non comprendeva un giudice giapponese ma in compenso comprendeva un giudice canadese (non a caso il più severo con Hanyu) e un giudice cinese, con Patrick Chan e Boyang Jin che erano diretti rivali di Hanyu:

Noto che anche il giudice inglese, Margaret Worsfold, è stata piuttosto severa e che nei components ha assegnato un punteggio più alto a Chan, magari prima o poi la guardo da vicino, mentre per il giudice ucraino Igor Fedchenko il migliore nei components è stato Shoma Uno, sotto l’aspetto tecnico il migliore è stato Boyang Jin. La cosa è particolarmente grave perché il valore base dei due pattinatori è molto simile, 103.70 punti per Jin, 103.43 per Hanyu, il che significa che di GOE Fedchenko ha assegnato a Hanyu 22.10 punti, a Jin 22.30 punti, e per quanto Jin sia simpatico, la qualità degli elementi proposta dai due pattinatori non è assolutamente paragonabile.

Torniamo a Delfa. A Hanyu non ha assegnato 5.69 punti, sommato ai punti in più che avrebbe assegnato a Fernandez, il bias totale sui due pattinatori è di 10.91 punti, non di “soli” 6.36. Per contestualizzare meglio, con questo libero Hanyu è arrivato a 321.59 punti totali. Fernandez partiva da un programma corto di 109.05 punti, con il vantaggio di 10.66 punti che aveva, per superare Hanyu avrebbe dovuto ottenere più di 212.54 punti. In carriera, in una gara internazionale, Javier aveva superato questa cifra una sola volta, al Campionato del mondo di Boston 2016, dove aveva ottenuto 216.41 punti. Delfa però ha assegnato a Hanyu non 223.20 punti, ma 217.43, il totale fa 315.82. Se Delfa fosse stato l’unico giudice, a Fernandez sarebbero bastati 206,77 punti, cifra molto più abbordabile (anche se Javier non l’avrebbe più raggiunta, il suo secondo miglior punteggio di sempre è il 201.43 della finale di Grand Prix 2015), per classificarsi al primo posto.

Hanyu ha eseguito un programma perfetto e più di tanto non lo si può abbassare? Esistono sempre gli altri gradini del podio. Dopo Hanyu è sceso in pista Chen, che era molto staccato e ha fatto diversi errori. Con lui Delfa è rimasto sotto della media di 4.76 punti, il bias totale è di 9.98 punti. Quindi è stata la volta di Jin. Jin era quarto provvisorio, eseguiva il quadruplo Lutz, l’ha pure fatto bene, ma sugli altri elementi sono arrivati quasi solo +1, un voto basso costante che non ha riscontro da parte di nessuno degli altri giudici. E per andare sul sicuro ha abbassato i voti nei components.

7.00 in transitions? È stato il quindicesimo voto. Il giudice inglese è stato assurdo dall’altro lato, gli ha assegnato un 9.50, lo stesso voto che ha assegnato a Hanyu (consiglierei una bella visita dall’oculista), ma 7.00? Chi ha fatto meglio per Delfa? Chan e Fernandez (9.75), Hanyu e Brown (9.00), Uno (8.75), Chen (8.00), Vasiljevs e Fentz (7.75), Reynolds, Ge e Brezina (7.50), Kolyada, Kvitelashvili, Kovtun, Tanaka e Yee (7.25), mentre Bychenko (7.00) è stato al suo livello. Alcuni di loro hanno fatto anche diversi errori ma tant’è, le transition di Jin a Delfa proprio non sono piaciute. Sempre meglio della sua capacità d’interpretare la musica, dove lo ha visto al ventesimo posto. Con Jin c’era lotta diretta, alla fine Jin ha vinto il bronzo, superando Fernandez, quarto classificato, di 2.39 punti. Sarà un caso che il bias di Delfa nei confronti di Jin è il più alto, 13.67 punti? Quindi è stata la volta di Chan. Patrick era terzo provvisorio, ma era l’unico ad avere in programma lo stesso numero di quadrupli di Fernandez, era staccato di 6.92 punti dopo il programma corto, e ha commesso due errori gravissimi. Sul primo triplo Axel ha messo la mano a terra, si è praticamente fermato, poi, dopo una visibile esitazione, ha eseguito un doppio Salchow che è uscito dal punteggio perché quella che ha proposto più che una combinazione è stata una sequenza, e di tipo non valido. Nel punteggio perciò è entrato un solo salto, e con GOE molto negativo. Quindi sul secondo quadruplo toe loop ha fatto uno step out e ha messo sul ghiaccio entrambe le mani. Anche qui il GOE è stato molto negativo. Chan si è tolto da solo dal discorso medaglie, e il bias di Delfa nei suoi confronti è stato molto contenuto, solo 0.73 punti. Può essere stato un caso, ma può essere stata la consapevolezza che in questo modo chi avesse guardato solo la media e non lo svolgimento della gara avrebbe trovato numero un po’ meno strani.

Shoma Uno è stato il penultimo a scendere in pista, ed era il secondo provvisorio. Sarà un caso che, dopo Jin, è stato il pattinatore più penalizzato da Delfa? A lui ben 9.14 punti in meno. La gara è stata chiusa da Fernandez. I voti degli altri erano già stati assegnati, Delfa ha fatto del suo meglio per aiutarlo ad andare sul podio, purtroppo Javier ha sbagliato tanto e ha concluso al quarto posto complessivo. Però Delfa i suoi voti li ha tenuti alti, fosse stato per lui Fernandez avrebbe vinto il bronzo. Il bias medio considerando tutti i pattinatori è stato di 6.36 punti, ma se guardiamo i soli pattinatori che hanno concluso la gara davanti a Fernandez, la media del bias diventa di 14.72 punti. Tutto questo per dire che nelle tabelle che pubblicherò qui sotto io ho considerato la media indicata da Skating Scores per comodità di calcolo, ma che se ci mettessimo davvero a guardare lo svolgimento delle singole gare, e a considerare solo i confronti con i pattinatori che erano diretti rivali dei connazionali dei giudici, molti numeri diventerebbero ancora più preoccupanti.

Torniamo alle sei nazioni iniziali e vediamo il loro national bias complessivo. Ho diviso i calcoli in programma corto, con relativa media, programma libero, con relativa media, e somma delle due medie. Questo perché non sempre i giudici giudicano entrambi i programmi, e perché non sempre la presenza di pattinatori connazionali dei giudici rimane costante. Per esempio, nel programma corto del team event femminile all’Olimpiade il national bias del giudice francese, Anthony Leroy, è stato di 4.08 punti, (a livello di punti piuttosto elevato, a livello di classifica no visto che per lui, come per altri quattro giudici, Mae-Berenice Meite ha eseguito il nono programma). La Francia si è classificata decima dopo il programma corto, i suoi atleti non hanno presentato il libero, e Leroy ha giudicato il secondo programma senza essere influenzato dal national bias. In alcune competizioni un atleta non supera il taglio e non disputa il libero o, in qualche caso più raro ma che comunque ho incontrato, un atleta si infortuna e non disputa il libero. Questa la tabella dei national bias, con i calcoli fatti stagione per stagione e una media finale relativa alle quattro stagioni. L’ordine in cui ho elencato le nazioni è dal bias più alto a quello più basso.

I giudici più di parte sono quelli cinesi seguiti nell’ordine da quelli russi, quelli italiani, quelli statunitensi, quelli canadesi e quelli giapponesi, come mostrato dalla colonna AFU. In rosso ho evidenziato i casi in cui il national bias complessivo è superiore a 6.00 punti, cinesi e russi hanno superato questa soglia in tre stagioni su quattro, italiani, statunitensi e canadesi in una sola, i giapponesi mai. In grassetto ho evidenziato in quale stagione il national bias si è fatto sentire di più. Non sorprendentemente per quattro nazioni, Cina, Italia, Stati Uniti e Canada, i valori più elevati sono nella stagione olimpica. Quando è stata disputata la gara più importante i connazionali sono stati sostenuti di più. Fanno eccezione la Russia, che ha avuto il suo valore massimo nella prima stagione in cui i voti sono stati pubblici, e che forse si è contenuta per non farsi notare troppo, ma che è comunque rimasta su valori altissimi, e il Giappone, i cui valori sono nettamente i più bassi e che sono andati in calando, come se i giapponesi si fossero resi conto che i voti che assegnavano erano di parte e abbiano lavorato per correggerli. Di fatto il national bias più basso che troviamo nell’intera tabella è quello dei giudici giapponesi delle ultime due stagioni, e che sulla somma dei due programmi siano rimasti sotto i 3.00 punti è notevole. Oltre al Giappone ci è riuscito, con valori leggermente più alti, solo il Canada, nelle stesse due stagioni, ma fra le due nazioni c’è una differenza fondamentale. Nelle due discipline individuali il Giappone lotta per le medaglie che contano, il Canada no, non più. Dopo la stagione olimpica Meagan Duhamel/Eric Radford, bronzo a PyeongChang e quattro volte sul podio mondiale (oro nel 2015 e nel 2016) si sono ritirati, e con loro sono finite le medaglie mondiali. Stesso discorso in campo femminile, con il ritiro di Kaetlyn Osmond, bronzo olimpico e oro mondiale nel 2018. Al mondiale maschile del 2019 le prestazioni insoddisfacenti di Keegan Messing (15°) e Nam Nguyen (16°) hanno addirittura fatto perdere alla nazione il diritto d’inviare due atleti. In questo momento il Canada è l’ombra di quello che è stato negli anni passati. Questo può aver influito sui voti dei suoi giudici? Non lo so. Per molte nazioni è cambiato poco, con Russia e Stati Uniti che sono cresciute in campo maschile e l’Italia che, stranamente, in questo momento è più forte in campo maschile che in campo femminile.

Se sopra ho guardato le variazioni nel bias da una stagione all’altra, è possibile anche guardare le variazioni a seconda della disciplina.

La Cina lotta per le medaglie nella gara maschile, con Boyang Jin, e nelle coppie di artistico, soprattutto con Wenjing Sui/Cong Han. Mi sa che non è un caso che il bias è più forte in queste discipline e meno forte – la cifra è comunque alta, non riesco a definirlo un bias debole – nella gara femminile. La Russia spinge soprattutto nelle coppie di artistico, ma è molto vicina anche ai pattinatori dell’individuale, i giudici italiani trascurano un po’ le coppie di artistico, quelli americani hanno una netta simpatia per gli uomini quindi, a scendere, per donne e per coppie di artistico, disciplina in cui è da parecchio tempo che non hanno speranze di medaglia. Il Canada sembra poco interessato agli uomini, ma teniamo presente che l’ultima medaglia importante è stato l’argento di Patrick Chan a Sochi, l’ultima medaglia in un Campionato del mondo è l’oro di Chan del 2013. Poi, certo, Chan ha vinto l’oro al Four Continents Championship 2016, in una gara disertata da Hanyu, ora sappiamo che lo ha fatto perché all’epoca stava lottando con la lesione di Lisfranc (e naturalmente mancava anche il campione del mondo in carica perché troppo spagnolo per potersi iscrivere al Four Continents Championship), ma dal 2015 in poi Chan ha vinto quest’unica gara e tre gare di Grand Prix, per il resto non è più salito sul podio. Le speranze per una medaglia canadese in campo maschile erano drasticamente calate rispetto al periodo compreso fra Vancouver 2010 e Sochi 2014. Chiude il Giappone, con le donne sostenute in modo discreto – solo Canada nella gara maschile, Stati Uniti e Italia nelle coppie di artistico e ancora Stati Uniti nella gara femminile hanno valori di national bias inferiori – gli uomini che usufruiscono di un national bias molto basso nonostante successi notevoli (nel quadriennio considerato sono un oro olimpico e un oro e due argenti mondiali, un oro e un argento nella finale di Grand Prix e un oro e un argento al Four Continents Championship per Yuzuru Hanyu, che è salito sul primo o sul secondo gradino del podio in tutte le gare a cui ha partecipato, un argento olimpico, due argenti mondiali, un oro, un argento e un bronzo al Four Continents Championship e due argenti e un bronzo alla finale di Grand Prix per Shoma Uno), e le coppie di artistico che praticamente non ricevono alcun aiuto.

Questo per le tendenze delle nazioni, ma ogni giudice fa storia a sé, non è che se la media dei voti dei giudici cinesi è alta tutti i giudici cinesi sono accecati dal national bias. Per esempio, Fan Yang, che nelle ultime due stagioni ha giudicato una gara maschile, una femminile, e due di coppie di artistico, ha un national bias molto basso, solo 1.46 punti. D’altro canto la giapponese Akiko Kobayashi, che ha giudicato tre gare maschili e sette gare femminili, ha un national bias di 8.17 punti. Le tabelle relative ai singoli giudici però le pubblicherò in un altro post, per oggi mi sembra di avervi già sommersi con una quantità notevole di numeri.

This entry was posted in pattinaggio and tagged . Bookmark the permalink.

1 Response to Il national bias. Introduzione

  1. Pingback: Sportlandiaより「ナショナルバイアス」 | 惑星ハニューにようこそ

Leave a ReplyCancel reply