Počnimo jednim teško prohodnim tekstom. Neka vas to ne zabrine – on je namerno tako odabran. Prema podacima Republičkog zavoda za statistiku, regionalni bruto domaći proizvod u Srbiji bio je 2022. najveći u Beogradskom regionu, 2839814000000 dinara, dok je najmanji bio u regionu Južne i Istočne Srbije – 1077359000000. U Autonomnoj Pokrajini Vojvodini BDP je bio 1871367000000, dok je u regionu Šumadije i Zapadne Srbije iznosio 1306248000000 dinara.
Dok ste čitali ove podatke, da li ste imali neku posebnu strategiju kako da ih sebi učinite shvatljivim? Možda ste brojeve krenuli da čitate s kraja, odvajajući tri po tri cifre, kako biste videli koliko je tu hiljada, miliona, milijardi… Možda ste uočili da poslednjih šest cifara čine samo nule, zbog čega zapravo možemo govoriti o određenom broju miliona. Na primer, beogradski BPD je činilo 2.839.814 miliona dinara. Pa opet, čak i ako dođete do te tačke, ovoliki brojevi su teško uporedivi, upravo zato što su vrtoglavo veliki. Međutim, ako ih prekopirate u Eksel, nakon 2-3 klika sve će postati mnogo jasnije:
Grafikoni su tu da nam jasnije prikažu odnose između određenih vrednosti, bilo da je reč o poređenju pojedinačnih podataka ili praćenju trendova neke pojave kroz vreme. Iako su osmišljeni kako bi predstavljali činjenice, ostavljaju dovoljno prostora za manipulisanje, ali i nenamerne greške. Takvih stranputica nema previše – govorimo o desetak tipičnih formata – a kada se jednom upoznate s njima, lakše ćete ih primetiti i na svojim i na tuđim graficima.
Počnimo od jednog primera očiglednog manipulisanja, gde se obzir prema podacima povukao se pred samopromocijom.
Odakle početi
Kada sagledavamo jedan klasični grafik, obično nam je pogled uprt u stubiće. Međutim, ne bi bilo zgoreg pogledati i levu i donju ivicu grafika, kako bismo proverili postoji li neki problem sa osama X i Y. Manipulacije i greške moguće su u oba domena. Krenimo od ipsilon ose.
Ključno pitanje u vezi sa osom Y odnosi se na početnu tačku. Na primer: ako želimo da uporedimo prosečne plate u zemljama bivše Jugoslavije, da li je startna vrednost nula evra?; ako želimo da uporedimo veličine glavnih gradova u Evropi, da li je startna vrednost nula stanovnika? Nula se nameće kao logično i najopreznije rešenje, ali da li je uvek i najbolje? Ne, i to iz dva razloga.
Prvo: ponekad su razlike između posmatranih vrednosti veoma male, pa je potrebno da „zumiramo“ kako bismo uočili razliku. Ako bi vaš zadatak bio da prikažete procenat kiseonika u vazduhu na različitim nadmorskim visinama, vrednosti bi se kretale u veoma ograničenom rasponu, od 19% do 21%. Krenemo li od nule (koja je u ovom smislu irelevantna, jer ne postoji otvoren prostor bez kiseonika), delovaće da razlike skoro i nema. Sa sličnim problemom suočavamo se i ukoliko bismo putem grafika pratili rast temperature obolele osobe. Zašto bismo kretali od nule? Ona je kao temperatura žive osobe nemoguća, a otežava uočavanje razlika između – na primer – 38 stepeni i 42 stepena. Ono što „na papiru“ deluje kao sitnica, u stvarnosti može biti ozbiljna razlika.
Drugo: nula je neadekvatna opcija i ukoliko se na grafiku predstavljaju vrednosti koje idu ispod nule. Pored zimske temperature (izražene u stepenima celzijusa), koja nam najpre pada na pamet u ovom kontekstu, tu su i podaci koji se odnose na godišnji rast BDP-a, migracioni saldo, prirodni priraštaj ili promene na berzi. Svi ovi parametri mogu se spustiti ispod nule.
Sagledajmo sve ovo na jednom slikovitom primeru.
Trči, trči, pa rupa
Sada kada smo se upoznali sa potencijalnim Y-zamkama, vreme je da pređemo na osu X. Tu su greške uglavnom slične prirode i odnose se na nekonzistentnost podataka. Dobro pogledajte grafik koji sledi i pokušajte da ulovite grešku na njemu. Koliko vam je vremena trebalo?
Manipulisanje X-osom ilustrativno bismo mogli da prikažemo na sledeći način: zamislimo Petra Petrovića koji treba da sastavi svoju radnu biografiju jer konkuriše za novo radno mesto. Imao je nekoliko dobrih angažmana, ali je na svom pretprošlom poslu dobio otkaz zbog mobinga. Petar potom odlučuje da isključi taj sramni momenat i ostavi samo ono što je reprezentativno, nadajući se da komisija neće primetiti „rupu“ u biografiji.
Na isti način se i grafici katkad usklađuju tako da neprimetno „progutaju“ nepovoljne podatke. O tome svedoči i ovaj primer:
Indonežani, da li se čujemo?
Osim problema sa X i Y osama, postoji još nekoliko potencijalnih stranputica. Ponekad jedan podatak u tabeli toliko odskače da je neophodno „skratiti“ ga, kako bi ostali parametri imali ikakvu šansu da se vide. Takvo skraćivanje je legitimno, ali mora biti jasno naznačeno: recimo isprekidanim crticama. Ponekad se umesto stubića koriste i neki drugi elementi, poput ljudskih figura ili zgrada. U tom pogledu treba biti posebno oprezan. Pogledajmo jedan primer izuzetno lošeg grafikona:
Autor Y osu ne započinje nulom, već visinom od 160 centimetara. Distorzija koja nastaje usled takvog odabira je dvostruka: ne samo da prosečan Indonežanin deluje triput niže od prosečnog Holanđanina, već deluje i osam puta manje, gledano spram površine siluete. Zašto? Kada povećavamo visinu klasičnog stubića, on „raste“ u visinu, ali ne i u širinu. Međutim, kada povećavamo ljudsku figuru, mi joj povećanjem visine automatski povećavamo i širinu, i time je činimo neproporcionalno većom od figure s kojom je poredimo.
Ovde smo se uglavnom bavili stubičastim grafikonima, ali red je da sada, na kraju, kažemo i reč-dve o kružnim graficima, ili takozvanim „pitama“. Pitanje svih pita-nja je: da li je to adekvatno grafičko rešenje? Kružni grafici nisu pogodni za prikaz rasta i pada, već im je zadatak da prikažu udeo pojedinačnih elemenata u celini. Zbir tih udela treba da bude 100% – ni preko toga, ni ispod toga. Ako je zbir manji od sto procenata, grafik ne može da bude kružni, jer je predstavlja nedovršenu (nezaokruženu) celinu. Ako je veći od sto, ponovo imamo problem, jer posmatramo više od jedne celine.
Baš kao što nećemo koristiti mikroskop da gledamo zvezde, niti teleskop da posmatramo ćelije, tako nećemo posegnuti ni za prvim dizajnom grafikona koji nam padne na pamet. Razumevanje namena i ograničenja različitih formata nije samo tehničko pitanje – to je pitanje poštenja prema podacima i, što je još važnije, prema ljudima koji će te podatke čitati.
Test
Nakon što ste savladali ovu lekciju, pokušajte da rešite ovaj test sa deset pitanja. Svi oni koji uspešno reše sva tri testa Tragačevog kursa o brojevima i statistici – dobiće sertifikat na kućnu adresu!