• Endre Borbáth , Raluca Toma

Am urmărit sondajele privind alegerile prezidențiale 2019 timp de mai multe luni, și înaintea primului tur am trecut în revistă șansele principalilor candidați, conform sondajelor. Acum a venit momentul să vedem cât de aproape de realitate au fost sondajele derulate din august și până înaintea primului tur. Urmează o comparație a estimărilor reieșite din sondaje, care au privit doar populația din România, nu și din afara ei, cu rezultatele finale ale primului tur.

 

Sondajele au supraestimat puțin popularitatea lui Iohannis

Sondajele au anticipat corect ordinea principalilor candidați în clasamentul din primul tur. Cele mai mari diferențe între ce indicau sondajele și ce s-a petrecut în realitate s-au produs în cazul lui Klaus Iohannis. Proporția de voturi luată de Iohannis pe teritoriul țăriia fost cu aproximativ 4 puncte procentuale mai mică decât proporția pe care o estimau sondajele. Pentru că Iohannis a luat multe voturi în afara României, procentul din voturi pe care l-a câștigat în final se apropie de ceea ce indicau sondajele. Totuși, toate sondajele făcute în România au sugerat că va lua mai multe voturi, deci fie s-a produs o eroare de sondare sistematică care i-a afectat numerele, fie sprijinul pentru Iohannis a scăzut în ultimul moment, pentru un motiv care nu este foarte clar.

Popularitatea Vioricăi Dăncilă potrivit sondajelor a crescut constant în timpul campaniei. IMAS a avut în general estimări ceva mai conservatoare pentru Dăncilă și mai optimiste pentru Iohannis decât alte firme de sondare. La CURS s-a produs opusul – aceștia au avut estimări mai optimiste privind-o pe Dăncilă și mai negative privindu-l pe Iohannis decât alte firme – și astfel CURS s-a apropiat mai tare de rezultatul alegerilor prezidențiale 2019. SOCIOPOL a tins să supraestimeze popularitatea ambilor candidați. Iar numerele SOCIOPOL au oscilat în jurul tendinței stabilite de ansamblul sondajelor.


Încearcă un scurt sondaj online și evaluează declarațiile candidaților la alegerile prezidențiale 2019! Poți ghici cine ce a spus?


Cifrele lui Dan Barna din sondaje au oscilat destul de mult, fără să fie vizibilă o tendință clară în timp. În cele din urmă sondajele au fost relativ aproape de realitate și nu s-a putut observa o diferență în funcție de institutul de sondare responsabil. Nicio firmă nu a părut să aibă o tendință sistematică de a îi supraestima sau subevalua popularitatea, comparat cu celelalte firme.

Popularitatea lui Mircea Diaconu a fost estimată ca fiind în constantă scădere începând din momentul în care și-a anunțat candidatura. Popularitatea lui a oscilat mai puțin în sondajele apărute „pe surse” decât în sondajele publicate oficial, în cazul cărora s-a cunoscut cine a făcut sondajul. Acesta este un lucru care s-a întâmplat și în cazul lui Iohannis și care este puțin ciudat, din motive pe care le explicăm mai jos. Dintre institutele de sondare cunoscute, IMAS iese în evidență cu ultimul lor sondaj, în care au supraestimat foarte mult popularitatea lui Diaconu comparat cu celelalte sondaje și cu proporția voturilor pe care a luat-o în cele din urmă.

 

Factorul sursei: contează cine face sondajul?

În evaluarea sondajelor pentru alegeri prezidențiale 2019, experții obișnuiesc să țină cont de multe ori și de sursa sondajului, mai exact care firmă sau institut l-a elaborat. Atunci când o companie sau un institut are o experiență suficient de vastă în spate și rezultatele și metodele lor de-a lungul timpului sunt cunoscute, devine posibilă o evaluare a factorului sursei, ceea ce în engleză este uneori numit „house effect”. Spre exemplu, analiștii de la FiveThirtyEight care produc previziuni privind alegerile țin cont de istoria diferitelor firme de sondare și le dau o pondere mai mare sau mai mică în modelul lor statistic. Noi nu avem la dispoziție date la fel de bogate ca cele din Statele Unite ale Americii, dar putem totuși să facem niște comparații între rezultatele sondajelor și ale alegerilor prezidențiale 2019 și să facem și o paralelă cu anul 2014.

Pentru a evalua cât de aproape de realitate a fost fiecare firmă din România, ne-am concentrat pe primii 4 concurenți din primul tur: Iohannis, Dăncilă, Barna și Diaconu. Apoi ne-am uitat cât de aproape au fost firmele de rezultatul final, calculând abaterea standard a fiecărei firme în jurul procentului obținut de fiecare candidat. Abaterea standard este o măsură care exprimă cât de departe se află un set de cifre față de medie sau o valoare previzionată. Cu cât e mai mare abaterea standard, cu atât este mai mare gradul de dispersare a valorilor. Dacă vorbim de un set de valori care are o așa-zisă distribuție normală – cum ar fi, spre exemplu, distribuția înălțimii în rândul femeilor – atunci în acel caz, aproximativ 68% din toate valorile se vor afla la o singură deviație standard de medie. În cazul nostru, cu cât o firmă are o abatere standard mai mare de la scorul candidaților principal, cu atât a fost mai departe, în general, de rezultatele finale.

Figura de mai jos ilustrează abaterea sondajelor de la scorul obținut de către fiecare candidat în țară (coloanele portocalii) și în ansamblu, inclusiv cu cele 650 mii de voturi din diaspora (coloanele albastre).

Figura aceasta ilustrează un fenomen interesant. Sondajele private, comandate aparent de partide, și ale căror rezultate au fost publicate „pe surse”, par să fi fost mai apropiate de realitate decât sondajele publicate de firme cunoscute. În general, sondajele despre care știm foarte puține cu privire la sursă și metodologie au deviat cam cu 2-3 puncte procentuale față de rezultatele reale, pe când estimările firmelor mai cunoscute au fost în medie la distanță de cam 6-8 puncte de țintă.

O examinare mai atentă a cifrelor privind Iohannis în sondaje ilustrează și ea aceste diferențe între estimările firmelor de sondare mai cunoscute și mai vechi – care în figura de mai jos sunt marcate cu simboluri colorate în interior – și sondajele cu o origine mai dubioasă, în cazul cărora rezultatele s-au scurs în presă fără să fie lansate oficial și despre care s-a spus că sunt sondaje produse pentru partide. Este vorba de sondaje de proveniență incertă și despre care lipsesc informații minime despre metodologie. Acestea din urmă sunt marcate cu simboluri care nu sunt colorate la interior și etichetate cu numele partidului care le-ar fi comandat. Diferența constă în faptul că sondajele nelansate oficial au variat mai puțin în cifrele pe care le-au prezentat și au fost în general mai aproape de tendința care reieșea din totalitatea sondajelor publicate – tendință reprezentată de linia galbenă în figura noastră.

Chiar și în cazul în care întrebările folosite în sondaj și modalitatea de sondare sunt identice de la o firmă la alta, este normal ca sondajele să aibă o anumită variație indusă nu doar de schimbări reale în opinia publică ci și de eroarea de eșantionare. Eroarea de eșantionare este aceea despre care firmele spun (și speră) că în 95% din cazuri ar trebui să nu fie mai mare de +/-3 puncte procentuale. Lucrurile sunt puțin mai complicate în realitate, pentru că marginea de eroare despre care vorbesc firmele când publică rezultate nu se referă la greșeli sistematice de eșantionare, ci doar la probabilitatea unor erori în condițiile unei administrări „perfecte” a sondajului. Dar esența este următoarea: eroarea de eșantionare este practic inevitabilă. În schimb, sondajele care s-au scurs în presă sunt atât de apropiate ca rezultate – unele de celelalte și de tendința generală – încât e aproape ca și cum ar fi imune la probleme de eșantionare. Acest lucru ar putea fi un indiciu că cifrele din sondajele dezvăluite „pe surse” sunt pur și simplu derivate din alte sondaje.

Lăsând la o parte problema sondajelor de proveniență incertă, putem spune că în general, devierile sondajelor de la rezultatul final au fost mici. Dar faptul că estimările tuturor companiilor de sondare au fost mai departe de distribuția voturilor în România decât de distribuția voturilor în România plus străinătate este surprinzător. Pentru că populația în afara țării nu este sondată de aceste firme, ne-am fi putut aștepta la fenomenul opus. Din nefericire, este foarte puțină transparență cu privire la metodele de eșantionare și ponderare a rezultatelor folosite de firmele care se ocupă de sondaje, publicul neavând acces decât la detalii minime, în cel mai bun caz (de obicei firmele cunoscute publică dimensiunea eșantionului, marja de eroare, perioada de colectare a datelor și dacă sondajul s-a făcut prin telefon ori față în față). Fără să știm mai multe nu putem înțelege de ce estimările sondajelor au fost mai aproape de rezultatul final din țară plus diaspora decât de rezultatul din țară exclusiv.

Am încercat să facem și o comparație cu sondajele de la alegerile din 2014, dar am constat că nu este mare continuitate a firmelor de sondare. Lista companiilor care au publicat sondaje între august și noiembrie 2014 este foarte diferită de lista din 2019. O singură companie se regăsește în ambele perioade (SOCIOPOL). Alte firme au publicat sondaje acum dar nu au făcut-o în 2014 ori au făcut sondaje acum 5 ani dar de data asta nu au mai publicat sondaje pre-electorale (precum IRES). În ansamblu, însă, sondajele au fost mai aproape de scorurile principalilor patru candidați din primul tur în 2014 (Victor Ponta, Klaus Iohannis, Călin Popescu Tăriceanu și Elena Udrea). Abaterea medie a fost de 2 puncte față de scorul real al candidaților, o abatere mai mică decât în 2019, dar e greu de zis ce a cauzat aceste diferențe fără să știm mai multe despre metodele aplicate.

Situația este, așadar, una amestecată. Pe de o parte, sondajele au anticipat corect ordinea candidaților în clasamentul din primul tur, ceea ce înseamnă că votanții care erau la curent au putut să voteze strategic dacă și-au dorit acest lucru. Pe de altă parte, pe piața sondajelor prezidențiale (disponibile publicului) par să nu fie mereu aceiași jucători, cee ace înseamnă că e greu să stabilim credibilitatea unui brand pe baza performanței din trecut. Nu ajută la evaluarea calității sondajelor și înțelegerea motivelor pentru care sondajele sunt mai mult sau mai puțin aproape nici faptul că sunt circulate sondaje pe surse și că se găsesc puține detalii despre metodele folosite de firmele de sondare. Din nefericire aceste probleme de transparență nu dau semne de ameliorare din 2014 și până acum.

 


Endre Borbáth este cercetător postdoctoral la Freie Universität Berlin și Wissenschaftszentrum Berlin für Sozialforschung și un colaborator al Median Research Centre.