Výzkumné agentury STEM/MARK a STEM realizovaly pro TV Prima stejně jako v prvním kole volební predikci, jejímž cílem bylo odhadnout konečné výsledky souboje mezi Petrem Pavlem a Andrejem Babišem hned zkraje sčítání.
Z predikce bylo hned od začátku nejen patrné, že se prezidentem na dalších 5 let stane Petr Pavel, ale i kolik procent získá a jaká bude volební účast.
První se divákům zpravodajství CNN Prima zobrazila v půl třetí odpoledne.
Podobně jako v prvním kole byly sečteny malé volební okrsky dříve, tentokrát ještě výrazně rychleji než v prvním kole před 14 dny. První data z průběžného sčítání byla dostupná přibližně 20 minut po uzavření volebních místností a první volební predikce vycházela z výsledků 6,66 % sečtených okrsků. Ta ukazovala na jasné vítězství Petra Pavla, kterému přisuzovala podporu těsně nad 58 % voličů.
Obr. 1 Volební predikce při 6,66 % sečtených okrsků (zaokrouhleno na celá čísla)
Výsledné pořadí kandidátů bylo tedy zřejmé již zkraje sčítání a před námi stála otázka, jaký budou mít kandidáti přesný procentuální volební zisk. S predikcí přitom mohla výrazně zahýbat vysoká volební účast přesahující hranici 70 %. „Díky velmi dobré přípravě, podobně jako v prvním kole, jsme měli připravených více metod, jak konečné výsledky odhadovat. Nakonec ale vyhrál přístup, který jsme zvolili hned na začátku a ukázalo se jako dobrá strategie držet se ho i po zbytek sčítání. Díky němu jsme byli schopni při pětině sečtených okrsků říct výsledky, které se od konečného sčítání lišily jen o několik setin procenta“, říká Jan Tuček, ředitel STEM/MARK.
Obr. 2 Volební predikce při 21,11 % sečtených okrsků
Opakovaná úspěšnost predikce STEM a STEM/MARK potvrdila schopnost statistiků matematickými modely přinést velmi brzy velmi přesné výsledky a odsoudila tzv exit polly do propadliště dějin.
Po volbách se určitě objeví spousta analýz a spousta názorů, které budou hodnotit výsledky dle různých charakteristik, případně úspěšnost předvolebních průzkumů. Již dnes se dá říci, že předvolební průzkumy opět velmi dobře popsaly – i když byly realizovány cca týden před volbami – budoucí vývoj. Tedy, že pro výzkumné agentury byly tyto prezidentské volby velmi úspěšné.
Níže přikládáme ještě graf ukazující konvergenci průběžných výsledků sčítání k naší predikci postupně až do 100 % sečtených hlasů.
Obr. 3 Konvergence průběžně sčítaných hlasů a volební predikce k celkovým výsledkům
Ptáte se, jaké výpočty byly za výslednými grafy?
Jedním ze dvou hlavních použitých algoritmů je shluková analýza. Nejprve byly všechny volební okrsky rozděleny do 12 skupin neboli clustrů (o jeden méně než v 1. kole prezidentské volby před 14 dny) podle podobnosti volebních výsledků ve volbách v 1. kole. V každé skupině byl znám počet obyvatel, respektive počet voličů a s přihlédnutím k dřívější volební účasti tak bylo možné přiřadit dílčím skupinám odlišnou váhu. Posledním krokem predikce byl předpoklad, že okrsky, které patří do stejné skupiny, se budou i v letošních volbách chovat velmi podobně. Na základě průběžných výsledků v jednotlivých skupinách pak algoritmus dopočítal souhrnnou volební predikci na celostátní úrovni. Níže přikládáme 4 z 12 použitých skupin. Pro detailnější přehled otevřete přílohu této zprávy.
Obr. 4 Rozdělení všech volebních okrsků do 12 clustrů (oblastí s podobnými volebními preferencemi)
Tisková zpráva STEM/MARK, kontakt: Jan Tuček, tucek@stemmark.cz, tel.: 724 433 888
V Praze, 28. ledna 2023