Problémy malého vzorku v sázení


Problémy nedostatečného vzorku v sázení


⏱ Čtení na 10 minut, které vám pomůže posunout vaše sázení na vyšší úroveň.


Článek hlavního analytika CBB pro Ratingy, který se specializuje na BIG MARKET, ve kterém vám poměrně detailně popíše krok po kroku, jakým způsobem lze sázením vydělávat. Čtení je to velmi zajímavé, rozhodně doporučujeme přečíst všem, kteří to myslí se sázením vážně a kteří si chtějí sázením vydělávat.


👨‍💻 Mark, hlavní analytik pro Ratingy: "Všechny zdravím, tady Mark, mám na starost tým analytiků, kteří každý den, zatímco vy spíte, jíte, bavíte se, pracujete.. provádí neustále detailní a zdlouhavé ratingové rozbory, které nám vydělávají zajímavé peníze a ze kterých chceme udělat nejlepší investiční sázkařský nástroj. V tomto článku bych vám chtěl vysvětlit základní chyby při nedostatečném vzorku v sázení.


Abyste následující řádky lépe pochopili, doporučuji vám si nejdříve přečíst článek, ve kterém je dost dobře popsaná metoda výpočtu očekávaného počtu gólů neboli (xG) - www.pinnacle.com/cs/betting-articles/Soccer/how-to-calculate-expected-goals-for-soccer-matches/. Naše ratingové rozbory zahrnují nepřeberné množství informací, které máme k dispozici z veřejných zdrojů (zdarma), tak i uzavřených zdrojů (placených) a například tato problematika nedostatečného vzorku dat včetně teorie pravděpodobnosti tvoří v kompletním ratingovém rozboru přibližně pouze 1/3 celé analýzy."


Úvod


V letošní sezóně Real Sociedad ve španělské LaLize na sebe výrazně upoutal pozornost: 1. místo po 10 odehraných kolech, fenomenální výsledky podle xG statistiky a dokonce plané naděje fanoušků na mistrovský titul. V tomto článku se na příkladu právě Realu Sociedad zamyslíme nad problémem nedostatečného odběru vzorků a zjistíme, co je důvodem úspěchu Basků na začátku španělské LaLigy v letošní sezóně + na konci vyvodíme důležitý závěr, který bude pro nás všechny velmi užitečný v našem dalším sázení.


Posouzení maximální pravděpodobnosti


Strukturální «zkreslení» ve správně provedeném výběru – to je z matematického hlediska velmi obtížně řešitelný problém. Jeho myšlenkou je, že ve skutečnosti máme nějaké apriorní znalosti o pravděpodobnosti detekce systémů s daným stupněm předvídatelnosti.


Například, dám vám tašku naplněnou 100 míčky a řeknu vám: v tašce je od 0 do 100 míčků – černých a od 0 do 100 míčků – bílých (a co je nejdůležitější, všechny možnosti jsou stejně pravděpodobné, tzn. že v tašce může být 57 černých/43 bílých míčků a stejně tak například 22 černých/78 bílých míčků). Vytáhnete z tašky jeden míček, zapíšete si jeho barvu, odložíte ho na stranu a tento postup zopakujete ještě 9-krát, přičemž vytáhnete celkem 9 bílých a 1 černý míček.


Na základě průměrné hodnoty vašeho vzorku (90% bílých a 10% černých míčků) můžete předpokládat, že taška obsahuje 90 bílých a 10 černých míčků. Tento postup je známý jako «Metoda maximální věrohodnosti».


Ale protože předpokládáme, že každá počáteční konfigurace míčků byla stejně pravděpodobná, tak náš průměr vzorků již nebude sloužit jako nejlepší odhad počtu bílých míčků v tašce (i když asymptoticky to přeci jen bude, a to znamená, že jakmile počet míčků, které z tašky vytahujeme, se bude blížit ke konci, průměr vzorku se bude blížit k očekávanému počtu bilých míčků v tašce).


Jinými slovy, nehledě na to, že jedinou nejpravděpodobnější možností v našem případě (vytáhli jsme 9 bílých a 1 černý míček a žádná jiná pevná data k tomu nemáme) je, že v tašce je skutečně 90 bílých a 10 černých míčků, nicméně očekávaný reálný počet (neboli očekávání aposteriorní pravděpodobnosti) bílých míčků v tašce je ve skutečnosti nižší – cca 83,32, Ale pokud bychom změnili původní podmínky a vytáhli nikoliv 10, ale rovnou 90 míčků ze 100 a vytáhli bychom 81 bílých a 9 černých míčků (tzn. stejně jako minule 9 ku 1), pak by se naše nestranné posouzení a skóre zvýšilo a dosáhlo by na více než 88 bílých míčků v tašce.


Rozdělení skutečných ukazatelů úspěchu


Pojďme přenést naše úvahy na kurzové sázení na sport. Předpokládejme, že máme jednoho sázkáře, který sází na ty události, jejichž pravděpodobnost byla bookmakery oceněna na 50% (tj. na ty sázky, které by bez marže sázkových kanceláří měly kurz 2.00). Náš sázkář vsadil 40 SOLO tiketů, z nichž vyšlo 29, tedy 72,5% tiketů.


Na příkladu s míčky jsme tvrdili, že všechny možné kobinace míčků v tašce jsou stejně pravděpodobné. Můžeme předpokládat totéž i pro našeho sázkáře, tzn. předpokládat, že pravděpodobnost jeho úspěchu je rovnoměrně rozdělena? Že ještě před odehráním prvního z jeho 40 vybraných zápasů jsme mohli předpokládat, že může být se stejnou pravděpodobností z dlouhodobého hlediska naprostým prorokem, který dokáže mít 100% úspěšnost, tak i naprostým "looserem", který bude mít pouze 10% úspěšnost (navíc jak si pamatujete z našich podmínek, tak náš sázkář nesázel na vysoké kurzy s nízkou pravděpodobností výhry, sázel právě takové sázky, kde bookmakeři odhadovali šance 50/50).


Ve skutečnosti je však tento předpoklad (100% nebo 10% úspěšnost) nereálný. Mnohem reálnější je, že rozdělení skutečných ukazatelů úspěchu bude vysokým vrcholem s dlouhými ocasy (viz. názorný graf níže). Vrchol takového rozdělení je 50% (úspěšnost) a dlouhé ploché ocasy znamenají jen malou šanci, že náš sázkář najde sázkařskou strategii s velmi vysokou úspěšností.


binom-cbb


Podstata těchto příkladů je následující: s experimentální pravděpodobností úspěchu binomické události by měla být vaše očekávaná míra úspěšnosti vždy posunuta směrem k 50% (směrem k pravděpodobnosti, kterou vypsali v kurzech bookmakeři). Tohle je nezbytné z důvodu neúčinnosti odhadu maximální pravděpodobnosti úspěchu.


Vrátíme-li se k našemu příkladu: i kdybychom viděli, že náš sázkář po 40 sázkách vykázal výsledek 72,5%, stále si můžeme být více než na 99% jistí, že skutečná pravděpodobnost jeho úspěšné predikce je nižší než 65% (proto je mnohem více pravděpodobné, že náš sázkář měl jen velké, opravdu velké štěstí než skutečnost, že dokázal najít systém, který mu dokáže předpovídat tipy s více než 65% šancí na výhru u událostí s 50% pravděpodobností).


Poučení pro vás: nyní by už každému z vás mělo postupně docházet, proč u prodejců tipů na sázení nevidíte skoro nikdy dlouhodobou verifikovanou statistiku s počtem tipů 1000 a více – čím více tipů, tím více přichází o faktor "štěstí" a dostávají se do ztráty.


Faktor ruční korekce


Abych tento problém odstranil, zavedl bych faktor ruční korekce kurzu, který se zvyšuje spolu s tím, jak se výsledky odchylují od očekávaného vrcholu směrem k dlouhým ocasům (viz. graf výše). Tento poměr je také ovlivněn velikostí vzorku. Čím menší je vzorek a čím více se pohybujeme od vrcholu směrem k ocasům, tím více ruční korekce kurzu opraví náš výsledek v opačném směru (směrem k vrcholu). Jinými slovy, pokud náš sázkář úspěšně předpovídá 72,5% sázek, upravil bych tento odhad směrem dolů, řekněme na 56-57%. A teprve toto číslo již lze považovat za naše nestranné posouzení pravděpodobnosti jeho úspěšných sázek, například k určení jejich velikosti podle Kellyho kritéria.


S růstem vzorku sázek a změnou procenta úspěšně predikovaných sázek je nutné pokračovat v úpravách odhadu. Například pokud náš sázkář po 200 sázkách úspěšně předpověděl 56% výher, mohli bychom tento odhad snížit pouze na 54,5-55%, protože vzorek výrazně vzrostl a odchylka se již tolik neposunula směrem od vrcholu (50) k ocasu. Upozorňuji, že toto NENÍ interval spolehlivosti, je to jen náš odhad.


Nedostatečný vzorek a ukazatelé xG statistiky


V sázení se bohužel s problémem nedostatečného vzorku setkáváme téměř všude. Naší další s vámi "zastávkou" bude xG statistika fotbalových týmů, čímž se plavně blížíme k naší RATINGOVÉ METODICE 2.0, která je pro veřejnost postavena především na faktoru právě xG statistiky. Jak už jsem na začátku tohoto článku naznačil, tak se podíváme na výsledky Realu Sociadad, které vzbudily rozruch v celém Španělsku. Jde o to, že po prvních 10 kolech se Baskové nacházeli na první příčce španělské LaLigy, přičemž předváděli fenomenální výsledky z pohledu xG statistiky a jen málo kdo nesrovnával jejich výsledky s Liecesterem z dob pod vedením italského trenéra Claudia Ranieriho , který získal dvě kola před koncem svůj historický první ligový titul, pod kterým se svými výkony výrazně podepsali hráči Jamie Vardy, N'Golo Kanté a Riyad Mahrez. Pojďme se tedy podívat na statistiky Realu Sociedad po 10 odehraných kolech – na screenu níže můžete vidět veškerá podrobná data.


real-sociedad-10


Ukazatele jsou následující:


xG90 – 2.08

xGA90 – 0.74

xG90/xGA90 – 2.81


(musíte souhlasit, opravdu fenomenální statistiky)


Těm, kteří ještě nejsou zcela obeznámeni se statistikami xG, to vysvětlím ve zkratce: indikátor xG90/xGA90 nám říká, že během 10 kol tým vytvořil téměř třikrát větší nebezpečí u branky soupeře (2.81), než dovolil svým soupeřům vytvořit před svou. Jak můžete vidět na screenu výše, tak ten samý údaj u Atletica Madrid byl v té době 2.47, u Realu Madrid 1.50 a u Barcelony 1.72. Podíváme-li se na dvě poslední celé sezóny, tak uvidíme, že nejlepší údaj v rámci xG90/xGA90 měl Real Madrid 2.59 v sezóně 19/20, Barcelona 2.11 v sezóně 18/19 a Atletico 2.17 v sezóně 19/20. Proto 2.81 u Realu Sociedad po 10 odehraných kolech vypadá opravdu působivě. Souhlasíte?


Je ale všechno opravdu tak dobré, jak na první pohled vypadá?


Pojďme se nad tím zamyslet, je tady alespoň nějaká šance, že Real Sociedad se skutečně dostal během příprav na novou sezónu na takovou fenomenální herní úroveň? Samozřejmě, že ne. Podíváme-li se na předchozí sezónu, tak uvidíme, že výkon Basků byl mnohem skromnější: xG90/xGA90 byl pouze 1.19 (nyní 2.81). V létě nejen že tým nepřivedl žádé světové hvězdy či jinak globálně velmi talentované hráče, ale dokonce přišel hned o několik důležitých hráčů. Diego Llorente přestoupil do Leedsu za 20 mio €. Tým se také rozloučil s Davidem Zurutuzou, který po 15 letech strávených u Basků ukončil kariéru. Aby toho nebylo málo, tak skončilo hostování Martina Ødegaarda, který měl vynikající sezónu a zaslouženě se vrátil do Realu Madrid (později ho Real poslal na hostování do Arsenalu). A jako náhradu za tyhle veškeré "ztráty" tým dostal pouze 34letého Davida Silvu a my můžeme směle říci, že Real Sociedad se díky tomu silnějším rozhodně nestal. Neexistuje tedy žádný důvod se domnívat, že výkonnost klubu prudce vzrostla díky přestupové politice a vložení velkých finančních prostředků.


Jelikož se soupiska Realu Sociedad nezlepšila a je mnohem horší než soupiska tří nejlepších španělských klubů, můžeme s jistotou říci, že xG90/xGA90 je právě ten výše zmiňovaný a nagrafu znázorněný "ocas" (pamatujete?) a my, stejně jako v předchozím příkladu s našim sázkářem, který správně předpovídal 72,5% výsledků, můžeme s jistotou více než 99% říci, že skutečný xG90/xGA90 Realu Sociedad bude mnohem nižší. Navzdory působivému ukazateli xG90/xGA90 2.81 u Realu Sociedad po 10 kolech, tak po jeho změření na konci sezóny během ostatních kol 11-38, můžeme očekávat regresi k průměru. A protože nemáme důvod předpokládat, že se úroveň hry týmu výrazně zvýšila, uplatnil bych i zde manuální korekční faktor. Jak si pamatujete z příkladu s našim sázkářem, tak tento koeficient se zvyšuje spolu s tím, jak se aktuálně výsledek pohybuje směrem k ocasu a také jak silně závisí na velikosti vzorku. Jelikož průměr minulé sezóny byl 1.19 a nyní je to až 2.81, tak všichnu už asi chápeme, že tento údaj je velmi daleko od průměru a navíc i distance 10 kol je příliž malá. Upravil bych tedy tento odhad směrem dolů, řekněme na 1.40-1.60, což znamená, že v kolech 11-38 bych očekával, že u týmu Realu Sociedad uvidím xG90/xGA90 na úrovní 1.40-.1.60.


Díky této korekci jsme po zbytku letošní sezóny vydělávali sázením "proti" Realu Sociedad v rámci našich interních neboli privátních Ratingů, protože pouze díky takovému odbornému přístupu lze sázením vydělávat dlouhodobě, vše ostatní, co tady vidíte na CZ/SK trhu, jsou pouze "tipéři", kteří sází podle intuice a domněnek a dříve nebo později se jejich výsledky vrátí zpět k průměru, kde je dostane do ztráty při nejlepšm jen marže sázkových kanceláří (mírná ztráta) nebo při nejhorším se brzy projeví jejich neprofesionální přístup k analýze sportu a nedostatečné množství dat (velká ztráta) a z trhu sázkových poradenství "zmizí" nebo si založí novou statistiku s nadějí, že se jim bude opět zezačátku dařit a podaří se jim na své krátkodobé zisky "nalákat" nové neinformované klienty, kteří i po všech předchozích pádech pořád věří v "zázraky".


real-sociedad-35


Návrat k průměru potvrzen


Po 10. kole Real Sociedad již odehrál 25 zápasů. A jak se dalo i očekávat, jeho ukazatel xG90/xGA90 dramaticky poklesl a po 35. kole dosahl na hranici pouhých 1.57 přesně podle našich předpokladů viz. pár řádků výše (1.40-1.60).


Navíc v prvních 10 kolech hrál Real Sociedad pouze s outsidery a průměrnými týmy LaLigy, jedinou výjimkou byl Real Madrid ve druhém kole.


Výsledkem provedené analýzy je, že jsme bez jakýchkoli obtíží, jen při pohledu na čísla a data, našli vhodnou příležitost pro sázení, kterou jsme také v náš prospěch využili. Tajemstvím fenomenálního startu letošní sezóny Realu Sociedad byl "jednoduchý" herní kalendář zkraje sezóny a velké štěstí při vytáření šancí před brankou soupeřů a předcházení velkých šancí u branky své. Proto bylo na místě předpokládat, že v budoucnu v dalších kolech dramaticky poklesne výkon Realu Sociedad a nastoupí regrese k očekávanému průměru.


Shrnutí na závěr


Tento příklad s Realem Sociedad je unikátní právě tím, že si ho můžete nyní "hravě" přenést i na služby sázkových poradenství – pokud si za Real Sociedad dosadíte téměř jakékoliv sázkové poradenství s nedostatečným vzorkem výsledků, tak si můžete po 10 zápasech (tipech) nebo jednom povedeném týdnu či víkendu naivně myslet, že jste narazili na ziskové poradenství, ale až dostatečný vzorek dat (výsledků) vám teprve ukáže reálné schopnosti díky návratu k očekávanému průměru.


Sečteno podtrženo – právě z tohoto důvodu na CZ/SK trhu sázkových poradenství nenajdete téměř žádné dlouhodobě ziskové služby, které by byly v zisku po 1000 a více zveřejněných tipech, aniž by kradli tipy zahraničním sázkovým poradenstvím. V takovém případě může jejich statistika vypadat dobře, protože v zahraniční existuje pár velmi dobrých zdrojů, které své služby nabízí veřejnosti a jsou dlouhdobě v zisku, jenže u takových zahraničních ziskových zdrojů existuje pro sázkáře z ČR a Slovenska jeden velký problém – zahraniční profesionální sázkáři sází často na tzv. SMALL MARKETY, které české a slovenské sázkovky v nabídce moc nemají (např. zkuste najít asijský handicap -1.0 na výsledek zápasu ve 3. německé lize nebo jakýkoliv asijský handicap na rohy či žluté karty apod.).


Proč nenabízíme naše interní Ratingy veřejnosti?


Je to v podstatě stejný důvod, který popisuju výše u zahraničních zdrojů, naše interní Ratingy jsou totiž cílené právě na SMALL MARKETY, protože právě tam dělají bookmakeři největší chyby při vypočítaávání očekávané pravděpodbnosti a i přes jejich marži lze na SMALL MARKETECH vydělávat velké peníze. Jednu dobu jsme plánovali nabídnout investiční projekt, tzn. vy nám pošlete peníze a my budeme za vás sázet a ze zisku si strhávat provizi a z toho důvodu abychom vám ukázali čeho všeho jsme schopni a na čem jsme vydělali největší peníze, jsme pár měsíců naše interní Ratingy verifikovali na verifikační stránce zde – www.verifiedbets.eu/pages/3263-czech-big-bet-cbb-rating-ako-club-world-betting, kde můžete vidět zisk +80% za necelé 4 měsíce 📈 (jen si tu verifikaci pro zajímavost prohlédněte a zaměřte se na různorodost samotných tipů, můžete tam vidět, že sázíme na asijské handicapy u ofsajdů, střel na bránu, rohů apod. – na tohle si v ČR a na Slovensku téměř vůbec nevsadíte), jenže později jsme zjistili, že bychom s tím měli spoustu starostí a takový investiční projekt by nám zabral spoustou času, který bohužel nemáme a proto jsme z toho projektu "couvli" a přestali verifikovat.


RATINGOVÁ METODIKA 2.0 ⚽️💻📈


A proto zhruba před rokem jsme se v našem týmu domluvili, že vyzkoušíme upravit naši RATINGOVOU METODIKU a přizpůsobit ji nabídce českých a slovenských sázkových kanceláří. Upravená metodika dostala označení «2.0» a rovnou jsme začali Ratingy 2.0 v rámci našeho RATING CLUBU 2.0 také prodávat a verifikovat – www.verifiedbets.eu/pages/3491-cbb-rating-club-2-0 a i přes to, že jsme si první "ostrý" měsíc připsali zisk +13.7%, tak jsme nebyli s upravenou metodikou a výsledky zcela spokojeni a pustili se do velkých úprav, které se ve finále protáhly až téměř na 1 ROK, jelikož po úpravách u nás přichází také testování, abychom měli co? Správně = DOSTATEČNÝ VZOREK VÝSLEDKŮ.


Takže téměř po roce tvrdých příprav a vylaďování naší unikátní RATINGOVÉ METODIKY 2.0 ⚽️💻📈 jsme konečně spustili testování s vámi – veřejností.


👨🏻‍💻 TESTOVACÍ OBDOBÍ:


⚠️ Stále probíhá testování nové upravené RATINGOVÉ METODIKY 2.0 ⚽️💻📈, které bohužel zatím prodloužily další úpravy a dolaďování k finální podobě. Během testování se nejedná o “oficiální” Ratingy, ale i tak mohou být "testovací" Ratingy velmi ziskové (jakmile spustíme Ratingy na ostro, tak jen cena jednoho Ratingu "A" se může pohybovat od 300 Kč – 1000 Kč).


Máte se rozhodně na co těšit!


Díky všem, kteří jste to dočetli až sem za vaší pozornost a doufám, že od teď už si dáte na nedostatečný vzorek v sázení velký pozor a přestanete "bezhlavě" šílet, pokud vám někdo ukáže například 1-2měsíční ziskovou statisitku, protože díky tomuto článku už víte, že to ještě vůbec nic neznamená...


📩 Dotazy: https://t.me/cbb_manager


Mark

hlavní analytik pro Ratingy