Data-analytiikka ja edistyneet tilastot jääkiekossa

Maaliodottama on ainakin tuonut esiin sen, että keskimääräinen ymmärrys tilastollisesta todennäköisyydestä on melko heikolla pohjalla. Kuten tässä viestissä yksittäisen anekdootin pohjalta tehty ääritieteellinen ja luotettava analyysi.

Jokaisella maaliodottamaestimaatilla on oma varianssinsa, jonka suuruus riippuu siitä kuinka paljon datan sokeita pisteitä tilanteessa on. Yksittäisten tilanteiden virheet ovat mallinnuksessa täysin odotettavia, mutta sillä ei ole mitään merkitystä kunhan mallin ennustekyky on riittävän hyvä tarpeeksi suuressa määrässä laukauksia.

3 tykkäystä

Minähän sanoin, että tuo on “jälleen yksi anekdootti”. Käsitteet “ääritieteellinen” ja “luotettava” ovat sinun käyttämiäsi, ei minun. Puhu omasta puolestasi.

Lisäksi: MTV:n julkaisema Wisehockeyn data oli odottanut nopean laskun perusteella lähes sata maalia vähemmän kuin tuohon mennessä oli tehty. Suhteellinen ero siis vain jotain 10 %:n luokkaa, mutta kuitenkin.

KalPa näytti olevan ainoa joukkue, joka oli viimeistellyt mitenkään mainittavasti maaliodottaman alle (-9,8 maalia). Kuopiolaisten lisäksi miinuksella olivat ainoastaan HPK (-0,9) ja Pelsu (-0,2), joskin nämäkin joukkueet olivat vain juuri ja juuri pakkasella.

Kaikki muut joukkueet ovat viimeistelleet enemmän tai vähemmän yli maaliodottaman – eniten Tappara (+26,6!), Ilves (+22,8!) ja Jyp (+20,5!). Moni muu joukkue, kuten IFK ja Lukko, on useamman maalin plussalla.

Että ei tuo xG niin kauhean priimaa ole tässäkään katsannossa, kun noin päin sitä itseään menee useammankin joukkueen kohdalla. Asiaan lienee tosin syytä palata uudelleen runkosarjan päätyttyä.

Eksplikoitakoon, että tämä(kään) analyysi ei ole ääritieteellinen.

1 tykkäys

Tuo keskimäärin yli menevä koko Liigan maaliodottama voisi kertoa liigan tason laskusta. Nykyinen ei vertaudu entiseen.

Toki kyseessä voi olla osittain pelitavallinenkin muutos, ei peruutella enää niin paljon mitä ennen, mikä näkyy yleisissä luvuissa.

Ja joku SaiPa on todennäköisesti huonompi kuin ykskään ennen liigan huonoin puolustuksellisesti. Sinne on monet mättäneet ylimääräistä maalia. Kerhossakin voi olla samaa.

Oletko muistanut ottaa pois tyhjiin tehdyt maalit sekä rl-kilpailuista syntyneet voittomaalit? Nuo ovat mukana MTV:n taulukossa. Tyhjiin tehtyjä maaleja on tähän mennessä tullut 50 ja rl-kilpailun voittomaaleja 17, joten koko liigan osalta xG-summa ei ole loppujen lopuksi kovinkaan paljon toteutuneiden maalien määrää perässä.

1 tykkäys

Onhan tyhjiin tehdylle maalillekin odottamat olemassa yhtä lailla. Tai rankkareille.

Helposti koodattavissa sisään. Ja kukaan ei varmaan tiedä onko niin tehty vai ei?

1 tykkäys

Mitä tuo maaliodottama analysoi. Jossain videossa puhuttiin että käsittelee vain sitä mistä laukaus lähtee eikä muuta.

Juuri näin. Jos maaliodottama ei osaa ottaa huomioon edes sitä, että lauotaan tyhjään maaliin, niin tämä vain alleviivaa pointtiani. Uskoisin tosin, että kyllä xG:ssä tuo huomioidaan. Noita rl-voittomaaleja ei varmastikaan huomioida, mutta se ei varsinaisesti pelasta xG:n epätarkkuutta tähän mennessä.

Mutta kuten sanoin, on asiaa syytä tarkastella uudelleen runkosarjan päätyttyä.

Yksinkertaisimmillaan se muuttaa laukaisukartan lukuarvoksi. Kuuleman mukaan Wisen datasta saadaan jotain fiksumpaakin, koska siinä on mahdollista hyödyntää pelaajien ja kiekon liikkeitä.

Täältä voi katsella Veikkauksen varjosarjataulukoita myös viime kauden osalta ja vertailla miten lopulta kävi.

Tyhjille maaleille ei tule Liigan luvuissa odotusarvoa, eikä oikeastaan kovin monessa muussakaan mallissa huomioida näitä. Pelitilannerankkareille toki tulee lukemat, yleensä näissä annetaan staattinen lukema kuten jalkapallossakin rangaistuspotkuille. Tyhjiä maaleja ei yleensä huomioida sen takia, että ne sekoittavat etäisyysmuuttujan arviointia ja niiden sisällyttäminen tuo enemmän kohinaa kuin signaalia kaikkien pelitilanteiden maaliodottamasummaan.

Ainakin Sihvonen selvittää maikkarin videolla siihen suuntaan, että maaliodottama olisi vain että “mistä laukaus lähtee”. Tämä on käsittääkseni Sihvoselta virheellinen ymmärrys. Wisehockeyn data ottaa huomioon myös sen, onko laukauksen edessä porukkaa, onko laukaus lähtenyt poikittaissyötöstä jne.

Sihvonen antaa videolla ymmärtää, että “subjektiivinen maalipaikka” olisi kovin eri asia kuin “objektiivinen maaliodottama” mutta nykyään näin ei ole, kiitos juuri tuon älykiekkodatan.

Noh, silmällä kun on noita maalitilanteita katsonut, niin aika suodatettua ja tasapäistettyä dataa se on.

Ei osaa arvostaa edelleenkään riittävästi syöttöjä ja epäilen myös, että maskipelaamisen mallintaminen kunnolla on varsin epämääräistä.

Nämä ovet kuitenkin asioita, jotka eniten vaikuttavat maalin syntyyn. Samalla vaikein asia mallintaa.

1 tykkäys

Monesti ollut pelejä joissa Tapparalla ollut vaikka 4 avopaikkaa ekaan erään mistä periaatteessa pitäisi iskeä yhdeksän kertaa kymmenestä, mutta silti maaliodottama näyttänyt yhtä. En aina ihan ymmärrä tuota tilastoa enkä siihen kyllä täysin luota.

Juu, voi hyvin olla, mutta pääpointti viestissäni oikeastaan oli, että Sihvonen selittää videolla maaliodottaman periaatteen väärin.

2 tykkäystä

Tai selittää tuon klassisen mallin, huomioimatta Wisen mahdollisuuksia.

1 tykkäys

Tähän aihealueeseen sopii hyvin podcast Dataa & kiekkoa by Liiga (Tuomas Nyholm Wise Hockeyn työntekijöiden kera)

xG on ensimmäisen jakson puheenaihe ja avaa erinomaisesti sitä ajatusmallia, joka Liigan xG:n takana on.

Itselle omaan päähän noussut esimerkki kyseisestä podcast-puheesta on se, että tietty laukauspaikka luo todennäköisyyden, että heität nopalla 1 tai 2 niin kiekko on maalissa. Tuota kutsutaan xG:ksi ja se kertoo todennäköisyyden tuhansiin muihin vastaaviin vetopaikkoihin. Sitten eri pelaajat heittävät erilaista noppaa omaan taitoarsenaaliinsa perustuen. Poikittaissyöttöön yv:llä Patrik Laine saattaisi heittää kuusisivuisella nopalla ja Oskari Luoto esimerkiksi 20-sivuisella nopalla. Molemmilta pelaajalta sata pelitilannevetoa samalta paikalta synnyttää varmasti eri tuleman maalimäärässä, mutta isossa massassa ne harmonisoituu xG-arvoksi.

Yksittäinen pelaaja pystyy takomaan toiseen pelaajaan verrattuna parempaa jälkeä kuin joku toinen, mutta ainakaan vielä datamäärä ei riittäne yksittäisen pelaajan xG-arvoa tuottamaan statistiikkaan suurelle yleisölle, mutta ilmeisesti toive ja tavoite sitä kohti on.

Hyvä podcast juuri tähän aihealueeseen - suosittelen.

Tässä X:n ketjussa on poimittu alkukauden yleisömäärät ja verrattu historiaan:

Aika timanttinen kommentti tämän päivän Ilves JYP lehdistötilaisuudessa kun Hintsanen kysyy maaliodottamasta. Pennanen ja Jukka naurahtaa ja Pennanen tuumaa että ne on ihan höpö höpöä meitä Jukan kanssa kiinnostaa ihan muut asiat…

Mielestäni tuo vaikutti enemmän puolustusreaktiolta. Hintsasen kysymyksen asettelun voi kokea niin, että kaikenmaailman sohvakoutsit tietää asioista paremmin.

Maaliodottama arvona on yksi tilasto, joka kertoo jotain pelinkulusta. Se kertoo enemmän kuin pelkkä laukaisumäärä tai maalivahdin torjuntaprosentti. Sitä kuitenkin pitää osata myös tulkita kuin mitä tahansa muutakin tilastoa.

Pennanen on aiemmin puhunut maaliodottamasta positiivisessa kontekstissa. Ehkä tarkoitti jotain muuta kuin Wisehockeyn luomaa mallia. Samoin Wisehockeyn haastattelussa kehui modernia dataa ja datankeräystä kuitenkin painottaen tulkinnan tärkeyttä.

1 tykkäys

Tää on kyllä tilasto mihin en oikein ikinä pääse kiinni. Kun monesti pelissä ollut laatupaikkoja ihan A sektorilta ja silti odottamat näyttää alle yhtä. :laughing: Ei ole kyllä oikein ikinä antanut mielestäni todellista kuvaa pelin kulusta tai siitä kumpi on vaarallisempi.

Tässä linkissä on Puhakan TPS-pelin ekan erän maalipaikka: https://streamable.com/mg6hbc

Jos samanlaisia paikkoja olisi 10, niin niistä saataisiin maaliodottamaksi 0,86. Ja voin taata, että hyvin harvassa pelissä on edes viittä noin selkeää häiritsemätöntä laukaisupaikkaa aivan keskisektorista ja suht läheltä.

4 tykkäystä