We use cookies - they help us provide you with a better online experience.
By using our website you accept that we may store and access cookies on your device.

A na siedmy deň stvoril Bob Sunesson rozdelenie šancí

Priznajme si, nikto nemôže popierať, že rozdelenie šancí je najdiskutovanejšou témou vo svete Hattricku. Či už sa na túto tému pozeráme ako na príliš náhodnú alebo príliš predvídateľnú, neprejde týždeň, aby na konferenciách nebol tento algoritmus súdený. Takže, na čo vo svojej kancelárii myslel Bob Sunesson, keď rozdelenie šancí navrhol? Poďme to zistiť. Začneme krokom späť a pozrieme sa, ako šance fungujú vo všeobecnosti.

Ako možno viete, šance sú rozdeľované do troch kategórii.

1) normálne šance
2) zvláštne udalosti (špecky)
3) ... a všetky ostatné

Normálne šance sú skutočne základom v zápasovom generátore. Buď sú vytvorené v konkrétnom sektore (ľavý, pravý, stredný) alebo sa objavia ako štandardná situácia (priamy kop alebo pokutový kop). Pretože sú normálne šance zodpovedné za drvivú väčšinu šancí na Hattricku, budeme sa teraz na ne sústrediť a necháme ostatné kategórie na ďalší článok. Pohľadom do vnútra zápasového generátora zistíme, ako to všetko funguje.

V každom zápase existuje 15 normálnych šancí, ktoré sa môžu rozdeliť medzi dva tímy v základnom hracom čase. Päť z týchto šancí je "otvorených", čo v preklade znamená, že môžu byť pridelené hociktorému z dvoch súperiacich tímov. O každú takúto otvorenú šancu budú tímy bojovať pomocou svojej zálohy. Ak tím túto bitku prehrá, dostane šancu súper a použije ju. Navyše okrem spomínaných otvorených šancí existuje tiež ďalších 5 šancí na tím, ktoré sú určené jednotlivým tímom v zápase, čo vytvára ďalších celkovo 10 šancí (dohromady teda 15). Tieto šance rovnako podliehajú boju, ale ak tím tieto "svoje" šance stratí, nedostane ich súper a namiesto toho len vyšumia do prázdna.

Keď to zhrnieme, každý tím musí bojovať so súperom, aby si mohol vytvoriť hocijaké šance, pričom existuje limit 10 normálnych šancí na tím a zápas.

Čas na štatistiky!

Na lepšie porozumenie a vysvetlenie výsledkov tohto systému sme sa rozhodli pozrieť hlbšie do našej databázy.

Zhromaždili sme vzorku 10 000 zápasov pre každý z nasledovne popísaných šiestich rôznych scenárov držania lopty. Rovnomerné rozloženie 50:50% nasledované zápasmi, kde mal jeden zo súperov hornú hranicu držania lopty buď 55%, 60%, 65%, 70% alebo 75%. Vylúčili sme všetky zápasy, kde boli použité určité taktické manévre jedným zo súperov a tiež sme odstránili zápasy, kde bola odchýlka v konečnom držaní lopty v jednotlivých polčasoch vyššia ako 1%. Urobili sme to preto, aby sme si boli istí, že sme vybrali len zápasy vhodné na porovnanie.

Prvý graf zobrazuje rozloženie priradených šancí pre každý prípad držania lopty. Môžete sa z neho dozvedieť špecifický počet pridelených šancí na vzorke 10 000 zápasov. (Pre vyššiu presnosť si pozrite aj posledný graf v tomto článku, ktorý bol vytvorený s výrazne väčšou vzorkou.)

(https://i0.wp.com/devblog.hattrick.org/wp-content/uploads/2016/02/NumberOfHomeChancesDistributions-1.png?ssl=1)



Ako je vidieť, s držaním lopty 50% je najpravdepodobnejšie, že tím dostane v zápase 5 šancí. Ako sa však držanie lopty zvyšuje, tak je aj počet získaných šancí vyšší. Nič neočakávané. Čo ale hovorí štatistika minimálneho a maximálneho počtu šancí v zápasoch? V štatistike existuje starý vtip, ktorý hovorí, že ak si dáte hlavu do trúby a nohy do ľadu, priemerná teplota je tak akurát. Práve to je dôvodom, prečo nevidíme ako sa správajú hranice v každom prípade, keď mám iba priemer. Preto sme pridali ďalší graf nazvaný "box plot" (pozn. prekladateľa: viac o tomto grafe sa dozviete v nasledovnom odkaze (https://cs.wikipedia.org/wiki/Boxplot)), ktorý poskytuje hlbšiu analýzu.

Box plot (alebo niekto môže preferovať krabicový graf alebo krabicový diagram) je štandardizovaná cesta zobrazovania rozloženia dát založených na zhrnutí piatich čísel; minima, prvého kvartilu, mediánu, tretieho kvartilu a maxima.

Ak začneme odspodu, prvá horizontálna čiara znázorňuje minimálnu hodnotu v súbore dát, krabica (farebný štvorec) začína v spodnom kvartile (25% dát, ktoré sú nižšie ako táto hodnota), horizontálna čiara v strede krabice je medián. Krabica končí v hornom kvartile (25% dát vyšších ako táto hodnota) a posledná horizontálna čiara na vrchu zobrazuje maximum. Krabica teda tvorí 50% objemu získaných dát. Dosť s definíciami. Teraz k nášmu prípadu.

(https://i0.wp.com/devblog.hattrick.org/wp-content/uploads/2016/02/NumberOfChancesBoxplot.png?ssl=1)



Pozrime sa bližšie na zelené pole s 55% držania lopty. Ako to môžeme preložiť do jazyka Hattricku? Hranice pola sú medzi hodnotami 6 a 8 na zvislej osi a z definície box plotu to znamená, že polovica zápasov s držaním lopty 55% bude mať 6, 7 alebo 8 normálnych šancí. V jednom zo štyroch zápasov bude počet šancí menší ako 6 a v jednom zo štyroch zápasov bude počet šancí vyšší ako 8.

Dobre, Bob, ale čo sú tie malé bodky pod hranicou 3 šancí? Znamená to, že boli zaznamenané aj zápasy s podobným držaním lopty, ale počet šancí bol 1 alebo 2. Tie sa volajú odľahlé hodnoty, tzv. outliery (stávajú sa aj zlé veci!). Sú to izolované prípady, ktoré nie sú dostatočne bežné na to, aby boli považované za minimálne a maximálne počty šancí. Vo väčšine prípadov v normálnom rozdelení šancí je menej ako 1% dát označovaných ako outliery. Týždenne sa na Hattricku odohrá približne 1 200 000 zápasov. Čo to znamená? Viacmenej 12 000 z týchto zápasov môže byť outlierom. Ak tvoj tím je jedným z týchto prípadov, pokojne si môžeš hovoriť, že si nemal šťastie... alebo skôr mal poriadnu smolu!

Stačilo? Nie. Ešte nekončíme. Čo s ostatnými prípadmi? Čo sa stane v zápase s držaním lopty 53% alebo 85%? Nebolo jednoduché nájsť porovnateľné dáta pre každý prípad. Preto sme spustili simuláciu jeden miliónkrát pre každé držanie lopty medzi 50% a 90% a spočítali priemerné čísla normálnych šancí, ktoré tímy dostali a tieto dáta sme vykreslili ako zmapovanie rozdelenia. Tu sú grafy s výsledkami:

(https://i0.wp.com/devblog.hattrick.org/wp-content/uploads/2016/02/AverageChancesInSimulation.png?ssl=1)



Vidíte to? Až do 65% držania lopty sa zdá byť sklon lineárny. Každý percentuálny bod môže spraviť rozdiel a prideliť vám normálnu šancu navyše. Čo si myslíte o držaní lopty 65-70%? Oplatí sa také úsilie? Je na vás, ako sa rozhodnete!

A na záver si môžete prezrieť detailné rozdelenie šancí pri jednotlivom držaní lopty od 50% do 99%. Čo si o tom myslíš, Bob? "Mohol by som povedať, že čím viac, tým lepšie."

(https://i0.wp.com/devblog.hattrick.org/wp-content/uploads/2016/02/SimulationDistributions.png?ssl=1)





Článok je prekladom anglického originálu And on the seventh day, Bob Sunesson created the Chance Distribution…, ktorý zverejnil HT-Tasos (10800601) na blogu
(https://devblog.hattrick.org/2016/02/and-on-the-seventh-day-bob-sunesson-created-the-chance-distribution/)

2016-04-04 08:57:26, 2361 views

Link directly to this article (HT-ML, for the forum): [ArticleID=19498]

 
Server 071