Tämä on ihan odotettavissa, sillä maalin takaa merkitään lähinnä laukauksia jotka päätyvät maaliin. Datasta ei siis voi johtaa minkäänlaista todellista arviota tuollaisille laukauksille, koska niille ei ole minkäänlaista vertailukohtaa. Vähän kuten jalkapallossa, missä raa’an datan pohjalta jotkut todella kaukaa tulevat laukaukset saavat kohtuuttoman korkean arvon, sillä pelaajat ovat laukoneet harvoin noilta etäisyyksiltä ja todennäköisesti tilanteessa, jossa maalivahti on ollut joko poissa maaliltaan tai kaukana alueensa ulkopuolella.
On sitten mallin ulkopuolinen päätös miten tuollaiset arvotetaan, ts. annetaanko suoraan nolla mikä taas vääristää hieman pelaajan kykyä viimeistellä yli odottaman, vai annetaanko jotain yli nollan mikä taas vääristää ottelukohtaista odottamaa. Itse ottaisin tällaiset maalit kokonaan pois esimerkiksi pelaajan maalimäärän ja -odottaman vertailusta.
Kyseisistä tilastoista pelaajan yksilöllinen hyökkäysalueaika ja korkean nopeusalueen pyrähdykset ovat paikkadatan mahdollistamaa jossakin määrin hyödyllistä analytiikkaa, muut ovat joko laukauskartan johdannaisia mukavilla visualisaatioilla varustettuna tai sitten voittamisen kanssa vähäisesti korreloivia ja täten epäkiinnostavia triviatietoja. Tämä ei ole mitenkään yllättävää sinänsä, sillä todellisesti hyödylliset analyysit paikkadatalla rikastetulla tiedolla säilytetään NHL:n ja seurojen käyttöön.
Noin viidestäkymmenestä luvusta siis vain muutama olisi näitä oikeasti hyödyllisiä detaljitason mittareita, ja viime viikon lupausten perusteella Liigan sivuille olisi siis tulossa huomattavasti hyödyllisempää tietoa. Kun kerrankin Liiga toimii datan suhteen järkevästi, sietää antaa edes jonkin verran suitsutusta eikä heitellä täysin perusteettomia kommentteja “haistapaska xG-luvuista”.
Liigastahan tämä kaikki on ollut saatavilla useamman vuoden ajan, mutta ei ole nähty tarpeelliseksi - tai siis todennäköisemmin johdossa ei ole ollut riittävästi ymmärrystä datan hyödyntämisestä - tuoda esille suuren yleisön käyttöön. Nettisivu-uudistuksen perusteella ehkä parempi näin, sillä resurssien kohdistaminen teknologiapuolen uudistuksiin on ollut kautta linjan surkeaa riippumatta siitä kuka tai ketkä on palkattu Liigalle töihin.
NHL:ssä on nyt hyvä esimerkki siitä kuinka xG luku voi heittää häränpyllyä. Edmontonilla on liigan paras xG 5vs5 pelissä. Mutta huppista liigan 2. viimeinen ja saman verran pisteitä kuin Sharkseilla
Paskaa tuuria ja helvetin huonoa maalivahti- sekä puolustuspeliä. Generoivat myös aika paljon xG:tä, kun jahtaavat jatkuvasti. Tosin ovat olleet ns. korkean maaliodottaman paikoilla useinkin, mutta eivät vain saa viimeisteltyä.
Jos ns. hyviltä paikoilta vastustajan maalivahti torjuu n. 90 % yrityksistä, mutta omasi vain 60 %, niin eipä siinä oikein mikään auta.
Etsin palstalta ketjua , jonka nimi olisi “Päivän Sihvonen”, mutten löytänyt…Kuuluisiko tämä tähän ketjuun?
Pelitavalla on vaikutuksensa ja selvästi nyt molemmat tamperelaisjoukkueiden valmentajat ovat keksineet, miten kannattaa pelata. Uusi pelitapa vääristää nyt pahasti vanhaan datan perustuvia tilastoja.
Tietysti johtopäätös seuraa, että se mihin noista maaliodottamista oikein on. Juttu ei paljastanut vaikuttaako laukaisija itse odottamaan. Onhan se selvä, että Liedeksen prosentti on Granathia parempi, jos miehet pääsevät samanlaiseen tonttiin. Malli pitää laittaa uudelleenkoulutukseen.
Juuri tänään päivällä olin lukevinani Maikkarin jutun, missä Sihvonen kehui Tapparaa ja sitä, että ovat parantaneet. Kuten olen sanonut, hänen rooliinsa kuuluu olla itsensäkin kanssa eri mieltä
Kun katsoo laukaisu- ja edistyneitä tilastoja, niin silmämääräisesti niillä ei juuri näyttäisi kovin isoa korrelaatiota pistekertymään. Ja samaa tarinaa kertovat itse tilastoarvotkin - tässä joidenkin tilastojen korrelaatioita:
laukaisuhallinta (corsi%-c) -0,1
kiekonhallinta 0,48
maaliodottama ja maaliodottama vastaan välinen suhde 0,25
Eli laukaisunhallinnalla ei näyttäisi olevan mitään merkitystä voittamisen suhteen. Yllättäen kiekonhallinnalla olisi isompi merkitys kuin maaliodottamasuhteella.
Jos tämä pitää paikkansa, niin luvut kertovat siitä, että pelejä pystyy voittamaan erilaisilla strategioilla.
On kuitenkin huomioitava, että laskin korrelaation joukkueiden kokonaistilastosta, en siis yksittäisten pelien pohjalta. Olisi mukavaa, jos joku pystyisi laskemaan nuo korrelaatiot yksittäisten pelin pohjalta.
Ja vielä on niinkin, että pitäisi pystyä laskemaan esim. maaliodottamat ennen kuin peli ratkeaa (eli samaan tapaan kuin tuo Corsi%-c, jolloin peli on tasan ensimmäisessä tai toisessa erässä ja maaliero on korkeintaan yksi), mutta se ei taida olla mahdollista yleisesti saatavilla olevien Liiga-tilastojen perusteella.
Mielenkiintoiset laskut. Mutta eikös corsi%:n tarkoitus ole ennustaa tulevaa, ei kertoa nykyisestä jos nykyistä tilannetta haluaa katsoa, niin varmaan maaliero on parhaiten korreloiva joukkueen sijoituksen kanssa. Nykyinen maaliero ei tosin ennusta tulevaisuutta läheskään yhtä hyvin kuin corsi. Corsia pitäisi siis seurata ajassa T-1 kun verrataan saatuja tuloksia aikaan T.
Tämä on mielestäni hyvä tiivistys siihen, mitä on hyvä myös ajatella.
Vaikka meillä on kuinka hienoja tilastoja tahansa, pysyy edelleen tärkeimmät Voitot/ Pisteet vs. häviöt merkitsevimpänä tilastona. Kaikki muut ovat mielenkiintoisia, mutta ei niin merkittäviä jos asian pahasti kärjistää.
Tilastot ovat seurausta pelitilanteista, eikä yksittäisestä tilastosta voida suoraan näkemättä välttämättä hirveästi päätellä. Pallolajeissa on useita tapahtumaketjuja ja niissä on aina tekijä nimeltä sattuma mukana. Isolla otannalla sattuman merkitys vähenee, mutta yksittäisessä pelissä sen vaikutus voi olla isokin. Ja hyvä joukkue pystyy kaivamaan räkäisen voiton silloinkin, kun mikään ei muutoin meinaa onnistua. Tässä mm. Tapolan vuosian sisäänajama systeemi evoluutioineen, tuotti tulosta.
En osaa välttämättä oikeilla termeillä sanoa, että mitä hain. Mutta jotain sellaista, että mikä on eri tilastomuuttujien yhteys saatuihin pistekertymiin. Eli kai siinä jotain ennustavuutta ajattelin, että miten vaikkapa maaliodottama ennustaa ottelun voittoa. Ja toisaalta ajattelin sitä niinkin, että voiko tilastoista katsoa jälkeenpäin, että “oliko voitto ansaittu”.
Mainitsemasi maaliero ei tässä mielessä ole kiinnostava, koska se on pisteiden kannalta ikään kuin “itsestään selvää”, että voittajan maaliero on parempi kuin häviäjän.
Tilastonknoppi 1: maalieron korrelaatio saatuihin pisteisiin on 0,97! Teoriassa maalierohan voi tosin kokonaislukemissa olla vaikka paras vaikka olisi pisteissä heikoin, jos voittaa yhden peli 40-0.
Tilastoknoppi 2: Luistellun matkan korrelaatio pisteisiin oli -0,07 ja pdo:n 0,83.
Joo, hain kommentillani sitä, että oikeat tulokset ennustettavuudesta saataisiin, jos otetaan kaikkien jengien corsi% nyt, ennustetaan niiden avulla joukkueita mitkä kerryttävät eniten pisteitä seuraavaan 20 otteluun, ja katsotaan kuinka hyvin ennusteet pitävät paikkansa. Eli tämän hetken corsin ei ole tarkoituskaan korreloida suoraan tämän hetken pisteiden kanssa, vaan tulevaisuudessa kerrytettävien pisteiden kanssa. Laskelmasi tosiaan vastasivat lähinnä tuohon viimeiseen kohtaan "voiko tilastoista katsoa jälkeenpäin, että “oliko voitto ansaittu” → Ainakaan Corsin suhteen ei ilmeisesti kovin hyvin.
Laitetaan vaikka tänne ketjuun, kun tuli nyt kerran mieleen:
Kuinka moni muistaa sen Halloranin käytännössä tyhjän maalin paikan viime perjantain Ilves-ottelun ensimmäisessä erässä? Siis se, jossa Halloranin laukaus epäonnistui täysin ja lumienkeleitä tehnyt Gunnarson torjui kiekon räpylällä maaliviivalta.
Tuon tilanteen sisältäneen ensimmäisen erän jälkeen Tapparan maaliodottoma oli noin 0,5. Tässä jälleen yksi anekdootti, joka osoittaa tuon xG-lukeman aivan totaaliseksi hölynpölyksi, sillä on täysin selvää, että pelkästään em. tilanteesta Halloran laittaa kiekon reppuun huomattavasti useammin kuin kerran kahdesta.