Sport, adat, elemzés: sportadat-elemzés

Sport Data

Sport Data

Egyéni hozzájárulás mérése csapatsportokban...

2018. december 10. - u1sd

A csapatsportban a csapat a fontos, de nyilvánvalóan nem mindenki veszi ki egyformán a részét a sikerből – habár ideálisan mégiscsak ez lenne a jó. Hogyan mérjük, hogy valaki mennyit tesz hozzá a közös produkcióhoz? Egy cég életében sem könnyű meghatározni, hogy valójában ki mennyit ér, nemhogy egy olyan csapatsportban, ahol az egyes feladatok, hatáskörök és pozíciók nemcsak, hogy nem munkaköri leírással vannak körülbástyázva, de jelentős mértékben át is fednek.

Sokan az egyéni mutatókat, főleg a jól megjegyezhető számokat igyekeznek a siker legfőbb tényezőjeként említeni. Közvetítésekben, meg általában a kevésbé hozzáértő szurkolóknál a gólok száma szokott dominálni. A kézilabdában a legjobb játékos sokak szerint, aki sok gólt dobott. Akit kizárólag védekezni hoznak be, így ugye esélytelen a „legjobb játékos” címre, miközben a hozzájárulása a védekezésben akár több gólnyi értékű is lehet. Arról nem is beszélve, hogy például az amerikai fociban így a védekező sor jelentőségét marginalizálnánk, miközben hosszú évek óta a legjobb védelmű csapat nyeri a végén az aranygyűrűt.

Egy vállalat esetében a hozzájárulás mértéke az előállított szolgáltatás vagy termék értékétől függ, legalábbis így logikus – ha nem is könnyű – mérni a kapitalizmusban. Pontosabban a kiindulási és a létrehozott érték közötti különbség maga az az értéknövekmény, amelyet egy konkrét személy alkalmazása jelent, és amely a cég szempontjából ideálisan nagyobb, mint amennyit az illetőnek fizetünk. A sportban is hasonlóan érdemes gondolkodni, ugyanakkor míg egy vállalati környezetben sokféle kimenetel és együttműködés lehetséges, a sportban olyan ki-ki küzdelmek vannak, csak a másik rovására lehet pontot szerezni, és nem a pénz az elsődleges elszámolási alap, hiszen a siker kulcsa többnyire a pont- vagy a gólszerzés.

blogbni-testimonial-super-powers-photo-1024x759.jpeg

Kulcstényezők

A legfontosabb tehát a kulcstényezők felállítása, amelyben a sikereket mérjük egy csapat esetében. A legfontosabb kulcstényező a szerzett pontok vagy gólok száma, illetve az ellenfél által szerzett pontok vagy gólok száma ellenünk. A legtöbb sportágban azonban nem illik megállni pusztán ennél a számnál, hiszen számtalan más sikertényező is van, illetve lehet. Például a labdás játékokban a pont- vagy gólszerzési kísérlettel befejezett támadások (pl. kosárra dobások, leütések, kapura lövések) száma is fontos tényező, hiszen a pontok, gólok ezekből származnak. De pont emiatt ennek a fordítottja, a védekezési oldal is fontos, azaz a pontszerzést potenciális megakadályozó jó védekezések (pl. blokkok, labdaszerzések) száma is számítanak. Emellett pedig a pontszerzést meghatározó egyéb járulékos előnyök (pl. kiállítások, büntetők) is fontosak, amely a dominancia egyik fokmérője lehet. Összesítve így például az alábbi listát állíthatjuk össze:

  • Elsődleges mutatók
    • pontok/gólok/kosarak stb. – most itt röviden pontok – száma: saját és ellenfélé
  • Másodlagos mutatók
    • Sikeresen befejezett saját pontszerzési kísérlek száma: saját és ellenfélé
    • Sikeresen kivédekezett akciók száma (labdaszerzések, blokkok): saját és ellenfélé
    • Előnyszerzési mutatók (kiállítás, büntető stb.): saját és ellenfélé

A nevezett mutatók, természetesen, a teljes csapat együttes teljesítményét írják le, az egyéni eredmények ebben nem szerepelnek közvetlenül. Több út is vezethet az egyéni értékeléshez, lássunk pár ilyet, először is az ezen a téren komoly hagyományokkal bíró jégkorong világából.

Plusz-mínusz mutató

A plusz-mínusz mutató (PMM: plus-minus metric) az egyik legrégebben használt ilyen mutató a jégkorongban, már az 1950-es években alkalmazta  a Montreal Canadiens csapata. Nagyon egyszerű az elve: ha a csapat játékosan a jégen van, amikor a csapata gólt szerez, akkor a csapat összes tagja +1 pontot kap, ha pedig gólt kap, akkor pedig -1 pontot kap. A plusz-mínusz mutató tehát egy játékosra vonatkozóan egy gól differencia:

PMM = Csapat lőtt góljai – Csapat kapott góljai
(amikor a játékos a pályán van)

A plusz-mínusz mutató azért jellemzően a hokiban is a sorokra jellemzőbb mutató, mint a játékosra, hiszen ha a sorok nem cserélődnek túl gyakran, akkor a sor összes tagja lényegében azonos pontot kell kapjon. Hosszabb távon, persze, az egyéni értékek el fognak térni. Az elv mögötte egyszerű: bárki aki a pályán segíti a csapatot, az hozzájárul kvázi egyformán a sikerhez. Azonban több probléma is van vele. Most csak párat vetünk fel, de a sor nagyon hosszú:

  • A bajnokcsapat mutatója, és így a játékosok „jósága” is jelentősen jobb lesz a többieknél ha amúgy hasonló képességű játékosok is vannak a különböző csapatokban, azaz a „nagyobb”, „drágább” csapatokban lehet kiemelkedni. Erre a legjobb példa a kapus, akinek a mutatója döntően olyan dologtól függ, amelynek csak a feléért felel.
  • Ha valakit kiállítanak – esetleg végleg, cserével – viszonylag gyakran és a csapat akkor kap gólt, akkor formálisan nincs jégen, amikor a csapat gólt kap, azaz látszólag nem veszi ki a részét a negatív trendből, miközben az egésznek ő az okozója. Jellemzően az előnyben szerzett és a büntető találatok emiatt nem veszik bele a PMM értékbe, de az eredmény szempontjából nem lényegtelen kérdés, hogy ezeket ki okozta, okozhatja.
  • A védők és a támadók értéke nem válik el élesen egymástól, mindenki mindenért felel, azaz egy remek védősor teljesítménye végül a támadásban jeleskedni hivatott „bénázása” éppúgy lehúz, mintha az egész sor egyformán rosszul teljesítene.
  • A kapus teljesítménye túlhatározza a csapat eredményét. Ha a kapus „mindent kivéd”, akkor nagyon jó Corsi pontok jönnek ki, ha pedig „béna”, akkor csinálhat akármi a támadásban a csapat – jellemzően negatív érték lesz a vége.

A Corsi szám, avagy a SAT

A Corsi szám (az NHL-ben lövési kísérlet, azaz Shot ATtempts: SAT – a hivatalos neve) története bár kicsit kacifántos, maga a történet a lényegen sokat nem változtat: a plusz-mínusz mutatót próbálták vele felváltani azért, hogy jobban képet adjon az egyének hozzájárulását illetően a végső sikerhez. Talán meglepő, de ez a szám inkább a szurkolók körében lett népszerű, a sportágban egyáltalán nem fogadták el még akkor sem, ha beemelték a hivatalos statisztikák közé. De mi is ez a szám…

Kicsit körülményesen megadva: a gólok száma, a kaput eltalált és a blokkolt lövések száma mínusz az ellenfél hasonló hármas mutatója kizárólag azonos létszámú játék mellett. Kicsit tömörebben:

SAT = Csapat saját lövése – Csapat kapott lövése
(amikor a játékos a pályán van)

A Corsi szám annyival tűnhet jobbnak, mint a plusz-mínusz mutató, hogy a támadások befejezését mennyire engedi az egyik vagy másik csapat, azaz a kapus teljesítménye kevésbé befolyásolja az eredményt. De hasonlóan a plusz-mínusz mutatóhoz a Corsi is inkább a sorok jellemzője, mint a személyeké, sőt a csatárok és a védők sem egyenlően részesülnek a sikerekből. Például egy védő, akinek semmi köze egy gólhoz felülértékelt, miközben a csatár, aki nem tehet egy lövésről, alulértékelt. Ennél azonban súlyosabb szerkezeti problémák is vannak.

  • A lövések nem egyformán értékesek, így azok száma nem informatív, ráadásul nincs köszönő viszonyban sem a lövések minőségével, például azok távolságával sem. Márpedig egy 5 méteres lövés nem azonos minőségű és értékű egy 25 méteressel – sem a hokiban, de más sportban sem. A góloknál mindegy, hogy hogyan keletkezett, de a lövéseknél ez már nem igaz.
  • Hasonlóan a plusz-mínusz mutatóhoz a Corsi is egy fordított mérték, amely könnyen félreértésre ad okot. Egy jó, vagy kiemelkedő csapatnak jó Corsi mutatója van. A jó Corsi mutató viszont nem jelenti azt, hogy a csapat jó. A bajnokcsapat itt is felülreprezentált, míg az utolsó pedig alul.
  • Ráadásul a gól és a lövés összefüggése sem egyértelműen összefüggő még akkor sem, ha nyilván lövésből születik a gól. Több gólt lő-e azonban az a csapat, amely többet lő kapura!? Nem. Nagyon sok esetben nem. A labdarúgásban sem az próbálkozik többször, aki többet lő, hanem az, akinek mennie kell az eredmény után. A jégkorongban ennek komoly jelentősége van, mert míg az 1980-as évekhez képest a lövések száma nem változott érdemben, a gólok száma igen: csökkent, azaz a gólok jelentősége sokkal nagyobb az akkori időkhöz képest, mint a lövéseké.
  • Továbbá, amely csapat egy meccsen körbelövi a kaput, mert szélsőségesen jó napot fogott, míg az ellenfél nagyon rosszat, de az összes többin alig tud lőni kapura, akkor is pozitív Corsi mutatóval húzhatja be az idényt; nem stabil, visszatérő az értéke. Másképpen fogalmazva: nagyban függ a pillanatnyi hatásoktól.

A Fenwick szám, avagy az USAT

A Corsi emellett egy másik hibát is vét analitikai szemmel: a blokkolt lövések számának a jelentősége a számításban azonos a kapura tartó lövésekkel. Mivel a blokkolt lövést inkább érdemes jó védekezésnek tekinteni – érvelt Matt Fenwick 2007-ben –, így valójában pozitívumként számolunk el valamit, ami inkább negatívum. Ez alapján az alábbi formulát határozta meg javításként, amit az NHL USAT néven (Unblocked Shot ATtempts – azaz nem blokkolt kapura lövések) tart nyilván:

USAT = A csapat nem blokkolt lövései – Az ellenfél nem blokkolt lövései
(amikor a játékos a pályán van)

A fenti problémákat, persze, ez sem oldja meg érdemben, így nehéz megint valamilyen érdemi leíróképessel rendelkező metrikaként tekinteni a Fenwick számra. Mind a Corsi, mind a Fenwick esetében elmondható, hogy az NHL-ben például a legjobb Corsi vagy Fenwick számmal rendelkező csapatok közül csak három jutott a playoff második körébe. A döntősök mutatói bár átlag felettiek, nem kiemelkedőek, és ez sok esetben így van egy kiegyenlített bajnokságban. Még egyszer: jó csapatnak jó Corsi-Fenwick mutatói vannak, de a jó mutató nem jelent jó csapatot.

A FenClose mutató

Ez a szám egy javítás a Fenwick számra vonatkozóan, amely a Corsi számnál tárgyalt egyik problémát próbálja meg kiküszöbölni, nevezetesen, hogy egy eldőlt meccsen nincs érdemi cselekmény, vagy ne vonjunk le messzemenő következtetéseket egy túl jól/rosszul sikerült napból. A FenClose azt mondja, hogy a Fenwick számot kizárólag akkor számoljuk, amikor az eredmény szoros, azaz nem több, mint egy gól a két csapat közötti különbség. Mivel nagyon szorosak olykor az eredmények a jégkorongban, a gólok egyre ritkábbak, így hosszú távon ez nem tűnik jelentős javításnak a korábbihoz képest.

Megemlítjük, hogy a labdarúgásra is átvitték ezt a mutatót, ami talán az olvasó számára már látható, hogy miért nagyon rossz ötlet. Korábbi cikkünkben is írtuk, hogy általában az a csapat lő többet, amelyik fut az eredmény után – ami a döntetlenre is igaz a labdarúgásban, hiszen az is lehet kizárólag az egyik félnek rossz eredmény.

A PDO vagy SPSV% - a szerencsefaktor

Mint eddig láthattuk, a csapat lövései, góljai nagyon fontosak az egyes mutatókban, de egy-egy kiugró mérkőzés nagyon befolyásolja a végeredményt. Felvetődött az ötlet, hogy ne általában a darabszámot nézzük meg, hanem azt, hogy egy-egy játékos a csapat összteljesítményéhez képest mekkora arányban járult hozzá a sikerekhez. Ezt is lövésre számítjuk gólok helyett, így kapta a hivatalos nevét, az SPSV%-ot (Shooting Plus SaVe Percentage – azaz lövés plusz védés arány) az NHL-ben. Konkrétan:

SPSV% = ( A csapat góljai / összes lövése + A csapat összes védése / Az ellenfél összes lövése )
(amikor a játékos pályán van)

Gyorsan fel lehet fedezni, hogy az összes védés az nem más, mint az ellenfél kapura lövéséből levesszük a gólok számát – azaz tényleg egy védési mutató. Sőt, ha valami nem lett gól, akkor logikusan abból védés lett, azaz amit az egyik helyen elszámolunk, azt a másik csapatnál a másik csapatnál nem fogjuk. Ennek megfelelően egy bajnokságban az SPSV% mutatók átlaga 100-at kell adjon. Mivel az érték hosszú távon a 100-hoz tart, így ez igazán nem ad információt arról, hogy valaki mire képes, ez egy relatív mutató, kvázi szerencsefaktor – hogyan pattan a pakk vagy a labda.

Matematikailag a két százalék összege értelmezhetetlen is, hiszen független események. Legfeljebb arra adhat valamilyen indikátort, hogy jelenleg éppen ki az alul vagy felülteljesítő magához képest, de ezt is csak óvatosan mondanánk. Ugyanis a lövéspontosság és a védési százalék a bajnokságok között – hacsak nincs valami számottevő oka, pl. az öregedés, trauma stb. – nem változik érdemben, egy adott érték körül mozog, képességnek megfelelően. Például labdarúgásra értelmezni értelmetlennek tűnik számunkra.

A VVN vagy WOWY mutató

Mi – ha valamit alkalmazunk – az a Veled Vagy Nélküled (VVN, angolul With Or Without You)  mutató, amely pontosabb képet adhat egy-egy játékos jelentőségéről, de még ettől is tartózkodnánk más mutatók nélkül értelmezni. Mi az alapötlet? Az, hogy a teljesítményt a csapathoz képest, annak képességeihez igazodva viszonyítsuk, vagyis nem azt kell nézni – szerintünk sem – hogy mennyi lövés vagy gól történik egy-egy játékossal, hanem mi történik a csapattal, ha valaki nincs jelen. Ez kiküszöböli a „bajnokcsapat” problémát, amikor egy-egy gárda kiemelkedik a többiek közül, illetve hosszú távon a szélsőséges mérkőzéseket is. Röviden a mutató:

WOWY = ( a gólok száma, amikor a játékos jelen van – gólok, amikor nincs jelen ) / az összes gólok száma

 Mindenekelőtt látni kell, hogy a gólok száma bármelyik metrikával cserélhető, így ugyanúgy számítható blokkokra, kiállításra, lövésre stb. Sőt, még lövéspontosságra is. Valójában ez az igazi ereje és mi is ezért használjuk szívesen, ugyanis összehasonlíthatóvá tesz akár részcélok alapján is játékosviselkedéseket, teljesebb képet kapunk általa a játékról. Előfeltétele, hogy mindig tudjuk, hogy éppen ki van a pályán - és ez nem minden sportban adott, például a vízilabdában, sőt, olykor kézilabdában sem tartalmazza ezt a jegyzőkönyv.

A mutató nagyon csábít arra, hogy egy-egy játékos hozzáadott értékét jelenítsük meg vele, de ez hiba volna. Egyrészt a játékos, hogy ténylegesen hozzájárult-e a gólhoz, az továbbra sem fedi le, így sok „baleset” lehet, vannak szerencsésebb ("jókor jó helyen") játékosok, és vannak szerencsétlenebbek. Különösen mondjuk labdarúgásban, ahol összesen három csere áll rendelkezésre. Másrészt nem csak a játékos teljesítménye határozza meg az értéket, hanem a többiekkel levő összhang is. Hiába zseniális egy támadó, ha nem kap labdát, mert nem tudják olvasni a csapattársak sem, mit akar csinálni a pályán. Hasonlóan, ha két személy nem jön ki egymással a pályán kívül, az bizony befolyásolja az együttműködésüket a pályán is, jellemzően negatívan – például nem passzolnak egymásnak, elveszik a másik elől a lehetőséget, stb. Ennek megfelelően ez inkább egy csapategységes mutató szám, mint valódi hozzájárulás. Mi ezt a vízilabdában már többször alkalmaztuk sikerrel, de kifejezetten a csapategység, vagy a játékos adott taktikában betöltött szerepének igazolására.

Természetesen a mérkőzés „élességét” nem kezeli ez sem, azaz egy lefutott meccs esetében, hogy mi történik, az jelentősen torzítja a számokat ebben az esetben is.

Hogyan lehetne mérni még az egyéni hozzájárulást?

A labdarúgásban a WOWY mutatót, de akár a plusz-mínusz mutatót is lehet szűkíteni például akciókra – azaz akinél a labda/korong megfordult, vagy aki mellett adott távolságon belül elhaladt, annak írjunk jóvá valamilyen értéket.  Ennek sem lenne azonban jelentősen jobb leíró képessége az eddig tárgyaltaknál. Adatelemzőként ezért azt kell mondjuk, hogy van, amit nem tudunk elég egyértelműen kimondani – és a játékos hozzájárulása a csapat összteljesítményéhez ilyen –  ténylegesen is egy tisztán szakmai, edzői kérdés kell legyen. Azt meg tudjuk mondani, ha valami nem vagy nagyon jól működik, azt azonban sokkal kevésbé, hogy mennyire múlik az egyik vagy másik sportolón az eredmény.

Bár a mélyebb matematikai részt nem tárgyaljuk ezen a helyen, a valódi probléma adatelemzőként az, hogy az adatelemzés maga nem képes, nem is feladata ok-okozati összefüggéseket keresni. Kizárólag jelenségekről tud állításokat megfogalmazni. A jelenségek megértéséhez, rendszerezéséhez valódi szakmai tudás kell. De fontos, hogy ezt is ki tudjuk mondani, ki is kell mondanunk, és legyünk tisztában az adatelemzés és az adatelemző korlátaival. Aki a számok alapján egy elemzésben az itt leírtaknál erősebbet mer állítani, mondani, az – szerintünk, és ebben nagyon határozottak vagyunk – nem mond igazat. Ha ilyennel találkoznak, fogjanak gyanút.

süti beállítások módosítása