Mentre io gioco con i numeri, mettendone assieme il più possibile per scoprire se viene fuori qualcosa di interessante, Lys legge articoli stranieri e trova considerazioni altrettanto interessanti. Una è questa:
La citazione deriva da quest’articolo: https://sportrbc.ru/news/5fca44e29a79477fc1a2691d?ruid=NaN.
Bisogna trovare un metodo scientifico? Per il passato, quando i voti dei giudici venivano scollegati dalla loro nazionalità ed era impossibile conoscere il voto di ciascuno, era diverso, ma ora è possibile analizzare i voti in modo matematico. E non serve neanche chissà quale formazione, io ho studiato Lettere con indirizzo in Storia dell’Arte, mica matematica. Servono solo tempo e pazienza. E visto che non sono convinta che l’ISU stia facendo un buon lavoro nel monitorare i giudici, lo faccio io. Comunque se l’ISU o il CIO (IOC per i non italiani) volesse i miei numeri per qualche controllo per decidere se un determinato giudice va sospeso dalle gare, sono pronta a darglieli.
Chi è Jeroen Prins, la persona che ha fatto queste affermazioni?
Jeroen Prins long has been deeply involved in figure skating, with a wide range of expertise.
Prins, 54, was a national-level skater in the Netherlands who now is an international referee and technical controller in singles, a technical controller in pairs and a judge in ice dance. He holds several positions in the figure skating section of the Dutch Skating Federation and is a candidate for membership on the International Skating Union’s singles and pairs technical committee. He is a figure skating commentator for Eurosport Netherlands.
Si tratta dell’inizio di un articolo di un paio di anni fa di Philip Hersh: https://www.globetrottingbyphiliphersh.com/?offset=1527797965998&category=2014+Sochi+Olympics. Decisamente una persona che di pattinaggio ne capisce. Anche se ha giudicato parecchie gare, nelle ultime quattro stagioni, da quando sappiamo quale giudice ha assegnato ogni singolo voto, Prins non ha giudicato spesso suoi connazionali, sono in tutto due programmi corti e quattro liberi. Il suo bias medio è di 1.83 punti, quindi decisamente basso, possiamo dire che lui fa del suo meglio per comportarsi in modo corretto. Eppure riesce a dire cose come
– Oh, it is too difficult to single out specific countries.
Sul fatto che servirebbero migliori tecnologie gli do assolutamente ragione, dovrebbe essere una delle priorità dell’ISU per cercare di avere gare il più corrette possibile, e che ancora non sia stato fatto è preoccupante. Quanto alle singole nazioni, ho già spiegato in quale modo ho fatto i miei controlli, ma visto che non posso pretendere che chi vuole capirmi si debba andare a rileggere quello che ho scritto in passato, lo spiego brevemente. Se andate su SkatingScores ed entrate nella pagina della gara che volete controllare, vi trovate davanti, nella prima riga dedicata a ciascuna disciplina, la scritta National Bias Chart. Cliccando lì sopra viene fuori un grafico come questo:
Il grafico in alto è dedicato al programma corto, quello in basso al libero. Non sempre i giudici dei due grafici coincidono perché a volte qualche giudice viene sostituito. Le colonne in verde indicano quanto i voti assegnati da ciascun giudice si discostino dalla media per il pattinatore o i pattinatori di cui è connazionale. Le colonne in rosso indicano la differenza rispetto alla media per i pattinatori di cui il giudice non è connazionale. In questo caso di pattinatori messicani ce n’era uno solo, Donovan Carrillo, perciò le valutazioni del giudice messicano, Sasha Martinez, sono indicate in verde per Carrillo, in rosso per tutti gli altri. I pattinatori statunitensi erano tre, Jason Brown, Tomoki Hiwatashi e Camden Pulkinen, perciò i voti di Roger Glenn riguardano la sua valutazione di tre pattinatori da un lato e degli altri 22 (21 nel libero) dall’altro. Glenn in questo caso è stato il giudice più di parte, con 5.10 punti di bias nel programma corto (2.59 punti in più rispetto alla media per il terzetto Brown-Hiwatashi-Pulkinen, 2.51 in meno per gli altri) e 7.55 punti di bias nel programma libero, ha avuto un bias complessivo di 12.65 punti. È un bias altissimo, da sospensione. Ricordo che dopo i Giochi olimpici l’ISU ha sospeso Feng Huang, che nella gara di coppie di artistico ha avuto un bias di 8.83 punti. Il bias di Glenn è stato superiore di 3.82 punti. Potrei sbagliarmi, ma non mi risulta che lui sia stato sospeso.
Una notazione tecnica: per fare il calcolo del national bias la persona che gestisce SkatingScores usa tutti i voti assegnati dai giudici, senza scartare il voto più alto e il più basso, quindi se volete fare qualche controllo dovete tenere presente questo dettaglio. È il motivo per cui a volte ci sono piccole discrepanze sui numeri, a seconda se il calcolo è stato fatto su tutti i voti assegnati o solo su quelli che sono entrati nel punteggio finale.
Questi grafici sono più che sufficienti per fare il calcolo per nazioni, ma visto che nella prima riga della schermata iniziale dedicata a ciascuna gara, subito prima del National Bias Chart, troviamo Panel of Judges, ho incrociato i dati del grafico con quelli dell’elenco dei giudici. È un lavoro lungo, anche perché ho considerato tutte le gare più importanti delle ultime quattro stagioni: Challenger Series, Grand Prix (sia senior che junior), Campionato Europeo, Four Continents Championship, Campionato del mondo, World Team Trophy e Giochi olimpici. Ho guardato tutte e quattro le discipline. Ho cercato di uniformare i nomi dei giudici, che non sempre sono scritti allo stesso modo. I dati sono tantissimi, spero di non aver fatto errori, ma se qualcuno dovesse trovarne sono pronta ad apportare tutte le necessarie correzioni. Io voglio tabelle il più corrette possibile. Ho anche controllato se il passaggio dal vecchio sistema di giudizio al nuovo avesse modificato in modo significativo il valore del bias. Ipotizzando una cosa che non possiamo davvero sapere, che i giudici abbiano sempre lo stesso tipo di atteggiamento, vediamo che nelle ultime due stagioni il bias medio considerando tutti i giudici è calato.
Mi scuso con chi legge qualcosa che per lui è una ripetizione, ma più in basso aggiungerò parecchi dati nuovi e voglio che il discorso che sto facendo sia chiaro per tutti. La tabella è divisa in tre fasce, una per il programma corto, una per il libero, una per il totale. Nella colonna somma ho sommato tutti i bias del programma corto, nella prima riga per il quadriennio, in quelle sottostanti per la stagione indicata. Dividendo il numero totale per il numero di programmi giudicati nel periodo considerato, è venuta la media. La media finale, l’ultima colonna, è data dalla somma della media del programma corto con la media del programma libero.
La stagione in cui il bias medio è stato più basso è stata la 2018-2019, seguita dalla 2019-2020. Questo significa che posso riunire tutti i dati con la tranquillità che che se un bias – gli 8.83 punti di Huang – era alto nel 2018, è alto pure ora. Con questa premessa, serve solo un po’ di pazienza per verificare quello che, secondo Prins, è difficile da verificare, quali nazioni in questo quadrimestre hanno avuto il bias più alto:
Per rendere più facile vedere quali nazioni hanno i giudici più partigiani ho colorato le righe secondo specifiche fasce, indicando chi è al di sopra della media totale. In media i giudici più scorretti sono i giudici georgiani, seguiti dai turchi, dagli uzbeki e dagli israeliani. Escludendo le nazioni i cui giudici sono stati poco presenti o hanno avuto poche occasioni per giudicare connazionali, i giudici più corretti sono stati i croati, seguiti dai danesi, dagli australiani e dagli sloveni.
In tutto sono 50 nazioni, ma visto che non tutte le nazioni hanno la stessa importanza a livello mondiale – la correttezza è ugualmente importante che si lotti per il primo o per il decimo posto, ma la visibilità degli atleti e il prestigio del risultato sono diversi – ne ho estrapolate tredici, quelle che hanno avuto almeno un atleta sul podio nelle ultime quattro stagioni ai Giochi olimpici, al Campionato del mondo (solo senior), al campionato continentale o alla finale di Grand Prix (solo senior).
Fra queste solo quattro nazioni, Canada, Finlandia (per la nazione un solo podio, un bronzo nella gara femminile del Campionato Europeo 2019, ma anche la Georgia ha vinto solo un bronzo continentale), Germania e Giappone rimangono sempre al di sotto del bias medio. Se Prins ha dubbi sulla correttezza delle singole nazioni, sono pronta a fornirgli la risposta.
Il bias medio della nazione, però, secondo me non è sufficiente. Si possono sospendere i giudici di un’intera nazione se si ritiene che quella nazione non li formi in modo corretto, è già stato fatto nel 1977. Però secondo me bisogna guardare anche i singoli giudici. Per esempio, anche se il bias complessivo dei giudici tedeschi è basso, Elke Treitz, che ho notato facendo qualche controllo sulle coppie di artistico, è alto. In diciotto programmi corti il bias di Treitz è di 4.05 punti, in tredici liberi è di 7.40 punti, la media totale è di 11.45 punti, quindi molto al di sopra di un valore per cui un altro giudice è stato sospeso. Questo è stato un lavoro che mi ha richiesto parecchio tempo. Vi mostro solo uno screenshot dei dati totali per farvi capire come ho lavorato.
Le colonne CX-DE (sì, è un file enorme) contengono i dati di tutte le gare in cui ciascun giudice ha giudicato un suo connazionale. Guardo Mona Adolfsen perché è semplice, visto che ha giudicato poche gare e che tutti i suoi dati rientrano nello screenshot. Adolfsen è stata presente nel pannello di giuria, con un pattinatore norvegese, in questo caso una pattinatrice perché la L indica che era la gara femminile, in quattro gare diverse. L’ordine con cui sono elencate le gare è dal bias totale più alto al più basso. Da sinistra le indicazioni sono: stagione, gara, disciplina, nome del giudice, nazionalità, bias nel programma corto (in grassetto se superiore a 3.00, in rosso quando è negativo, come avviene in un caso con Ana Luisa Aguilar Gamero), bias nel libero (in grassetto se è superiore a 6.00, in rosso se negativo), bias totale (in grassetto se superiore a 9.00, o se superiore a 3.00 con il giudice che ha giudicato solo il programma corto, se superiore a 6.00 se il giudice ha giudicato solo il libero, in rosso se negativo).
Sotto le quattro gare giudicate da Adolfsen c’è un rettangolo alto tre righe. È il riassunto. In quattro programmi corti la somma di tutti i bias di Adolfsen è stato di 11.56 punti, la cifra divisa per 4 dà un bias medio di 2.89 punti. Ho fatto lo stesso tipo di calcolo con il libero. Il totale, 6.80 punti, è la somma del bias di Adolsen nel corto e nel libero.
Ho fatto questo lavoro per tutti i giudici, il file è lungo 4615 righe. Non voglio nemmeno provare a immaginare quanti screenshot mi servirebbero se volessi mostrarvi tutto. Ripeto, se l’ISU o il CIO desiderano il file per fare un po’ di pulizia fra i ranghi dei giudici, posso tranquillamente inviarlo. A voi mi limito a far vedere il riassunto, e già questo è lungo. [Edit: alla fine ho fatto gli screenshot di tutto il file, li ho postati qui: 1, 2, 3, 4, 5, 6, 7]. Le colonne DG-DK comprendono tutti i riassunti dei bias medi dei giudici, elencati in ordine alfabetico. Le caselle in giallo non sono nulla di sconvolgente, ho semplicemente voluto evidenziare i giudici più attivi, quelli che hanno giudicato almeno in sei occasioni i loro connazionali. Sono 192 giudici su un totale di 506, e proprio perché sono i più presenti secondo me dovrebbero essere guardati con maggiore attenzione. Un giudice che giudica una sola gara può sbagliare per inesperienza, un giudice esperto può riuscire a sfuggire a controlli come quello che ho fatto io proprio perché assegna i voti con attenzione. Un esempio di questo modo di giudicare l’ho già visto quando ho fatto un controllo su Elena Fomina. Andrò avanti a controllare alcuni singoli giudici, compatibilmente con il tempo che ho a disposizione per qualcosa che faccio quando riesco a farla, perché ho parecchi altri impegni.
Al fianco dei giudici elencati in ordine alfabetico, che pubblico in modo che sia semplice cercare qualsiasi giudice di cui volete conoscere il bias, c’è un altro elenco, sono le colonne DM-DQ. I dati sono gli stessi della prima colonna, ma in questo caso i giudici sono elencati in ordine di bias medio, dal più alto al più basso, in modo da vedere con facilità chi sono i giudici dal bias più alto, quelli che dovrebbero essere sospesi.
Una precisazione sui numeri, che ho notato riguardando le tabelle. A volte il bias totale può apparire strano. Per esempio, l’italiana Karol Pescosta ha un bias alto, 4,00 punti nel programma corto, 5,39 nel libero, che mi dà… 9,38 nel totale. No, non ho sbagliato io a fare i calcoli, anche chi ha qualche difficoltà con la matematica si accorge subito che c’è qualcosa che non torna. Io non ho fatto nessun calcolo, è il computer che li ha fatti tutti. Pescosta ha avuto un bias complessivo di 27.97 punti in sette programmi corti, la media è 3,99571428 e così via all’infinito. Ho chiesto al computer di far vedere due cifre decimali, così come fa l’ISU con i protocolli di gara, e naturalmente è venuto fuori un 4.00. Il computer però sa che questo è un arrotondamento, voi vedete il risultato, ma quello che io ho scritto è l’impostazione dell’operazione. Nel libero il bias complessivo di Pescosta è stato di 32.33 punti in sei gare, la media è 5,38833333 e così via. L’arrotondamento visibile è 5.39. Il computer però ha sommato i numeri reali, non i numeri arrotondati. Il totale è 9.38404761 e così via. L’arrotondamento è 9.38. Ogni volta che c’è una discrepanza di 0,01 in più o in meno sul totale è dovuta all’arrotondamento fatto dal computer.



















































Pingback: Figure skating and judges with the ISU Judging System | sportlandia