sunnuntai 2. elokuuta 2015

Visualisointi tilastojen markkinointia ja myös manipulointia

gapminder world
Hans Rosling visualisoimassa
Hans Rosling tilastojen visualisoinnin uranuurtaja. Minua pyydettiin kirjoittamaan Tietoasiantuntijat-lehteen tilastojen visualisoinnista. Kirjoittaessani juttua en muistanut, että visualisoinnin todellinen guru on ruotsalainen professori Hans Rosling. Ruotsalaiseen tapaan hän osaa markkinoida tilastoja ja niiden sanomaa loistavasti niin visuaalisesti kuin esiintymisellään. Roslingin esitykset ovat kovaa valuuttaa myös YouTubessa. Olin 2000-luvun alussa OECD:n tilastokongressissa Italiassa. Rosling esiintyi ensimmäisenä päivänä pienessä alasessiossa ja sai innostuneen vastaanoton. Seuraavana päivänä hänet nostettiin päätösistunnon pääpuhujaksi. Siitä se maine alkoi kiiriä. Herra on ollut Suomessakin vierailulla vuonna 2013 tilastokeskuksen kutsumana. (1)

Tilastojen lukutaito. Aihe on ollut esillä myös tilastoalan maailmankongresseissa. Reija Helenius tiivistää, mitä hänen mielestään tilastojen lukutaito pitää sisällään:
- tilastollisia tunnuslukuja, kuten moodi, mediaani, varianssi, vaihteluväli
- yhteiskunnan ilmiöitä kuvaavia käsitteitä esim. inflaatio, työttömyys, bkt
- tutkimusmenetelmiä, vaikkapa mikä on kokonais- ja otantatutkimuksen ero
- tiedon visualisointia sekä niiden tekemisen että tulkitsemisen näkökulmasta ja
- tietolähteiden käyttökelpoisuutta. (2)


Keväällä 2015 tekemässäni jutussa Tietoasiantuntijat - lehteen otin lähtökohdaksi eduskuntavaalien vaalipallon /YLE.

Vaalipallo osa tilastojen visualisoinnin trendiä
-          visualisoinnin mahdollisuudet ja sudenkuopat (3)

Vaalitulospalvelun vaalipallo
YLEn vaalipallo 2015
Mediaan on tuotu viime vuosina runsaasti erilaisia tilastojen visualisoinnin keinoja. YLEn vaalipallo on eräs ilmentymä tästä muodista. (1) Sähköisessä mediassa mahdollisuudet ovat suurempia kuin paperimediassa. Vaalipallokin toimii sähköisessä mediassa, mutta ei paperilla.
Visualisointi on BI- tuotteissa ja mediassa uusi trendi.  Kyse ei ole kuitenkaan aivan uudesta aallosta. Tilastoja on kautta aikain visualisoitu. Ja vuosikausia Excel on ollut johtava visualisoinnin väline. Piirakat, pylväät, erilaiset suorat ja käyrät ovat olleet keskeisiä hahmoja. Varsin uutta ovat nämä pallot, pallukat tai muuten kokoa osoittavat hahmot. Pitkään ovat olleet myös visualisoinnin välineenä väritetyt kartat. Ja kaikki nämä muodot voivat olla saatavilla BI- tuotteen Dashboardilla, työpöydällä.  Kaikessa on kuitenkin oltava tarkkana.
Google-haku: Dashboard
Taustana ovat joko absoluuttiset tai suhteelliset luvut. Näiden lukujen taustalla on puolestaan aina erilaisin menetelmin kerätty data. Datan taustalla on puolestaan metadata eli kuvaus siitä, mitä data pitää sisällään.  Datasta luodaan yleensä informaatiota, jota sitten visualisoidaan eri tavoin. Hyvä Dashboard sisältää porautumismahdollisuudet taustalla oleviin lukuihin ja niiden taustaolettamuksiin. Paperilla tämä ominaisuus on haastavampi toteuttaa, koska porautuminen sähköiseen välineeseen verrattuna on mahdotonta.

Visualisoinnin vaarat. Visualisointi korostaa, osoittaa, yksinkertaistaa, jopa harhauttaa lukijan, jos ei osaa olla tarkkana. Muutamaan asiaan kannattaa kiinnittää huomiota:
  • y- ja x-akselien mittasuhteet: aikasarjaa voidaan manipuloida muuttamalla akselien etäisyyksiä (skaalaa) vaikkapa ilmiötä dramatisoimalla tai latistamalla
  • ennusteet ovat aina todennäköisyyksiä, jotka perustuvat joihinkin ennalta tiedostetusti tai tiedostamatta julkilausuttuihin tai julkilausumattomiin oletuksiin
  • hälytysvärien käyttö (kuten vihreä, keltainen, punainen) perustuu aina ilmiön arvojen jakamiseen kolmeen luokkaan – ilmiö voitaisiin jakaa useampaankin luokkaan tai poikkeamaan keskiarvosta, minimistä tai maksimista
Tiede 2015 ja THL:n sairastavuusindeksistä, viite 3
  • kartat on yleensä väritetty myös muutamalla värillä tai yhden värin tummuusasteen muuttamisella: kartta kuitenkin kuvaa yleensä jonkin alueen keskiarvoa, vaikkapa kunnan keskiarvoa; vaihtoehtona on kuvata karttatiedot spatiaalisena, jossa havainto on kytketty tiettyyn alueeseen (kaikkia ilmiöitä ei kuitenkaan voi näinkään kuvata).
Tilastoturisti. Tilastoalan kaksi seniori- Jussia (Melkas ja Simpura) kirjoittivat aiheesta kirjan vuosi sitten. (2) Jussit avasivat virallista tilastomaailmaa monin tavoin. Mielenkiintoisen jaottelu tilastojen käyttäjistä he toivat esille. Meitä tilastojen käyttäjiä on kolmea tyyppiä tanskalaisen mallin mukaan (s. 132 - 133):
  • "turistit" hakevat yksittäisiä tietoja ja ovat tilastojen satunnaiskäyttäjiä, pikakäyttäjiä eivätkä ole myöskään kovin kriittisiä sellaisia
  • "maanviljelijät" käyttävät oman alansa tilastoja taajaan ja osana omaa päätöksentekoprosessiaan; tämä porukka käyttää myös pidemmälle jalostettuja indikaattoreita
  • "kaivosmiehet" kaivautuvat syvälle tilastojen ytimiin, aineistoihin, luokituksiin. tilastojen laatuun, erilaisiin käyttömahdollisuuksiin sekä kriittisiin tekijöihin.
Jokainen meistä tietoasiantuntijoistakin voi olla välillä turisti, maanviljelijä tai kaivosmies. Turistina vaarat ovat suurimmat ajautua virheellisiin tai puutteellisiin tulkintoihin kauniista kuvista ja lukusarjoista. Rolf Dobelli kirjassaan ”Viisaan toiminnan taito” ottaa esille tilastoturistille ominaisia piirteitä. (4) Kolme haastetta on turistilla ylitettävään:
  1. suhtauduttava kriittisesti ulkoa tuleviin ”faktoihin” – ennakko-oletukset on kaivettava esille
  2. suhtauduttava kriittisesti vallitseviin näkemyksiin – erityisesti usein toistettuihin, esittäjän asiantuntemukseen perustuviin väittämiin, joissa keskeistä on ”koska”-sivulause;
  3. suhtauduttava kriittisesti omiin ennakkokäsityksiin.

Lähteet
2.       Jussi Simpura – Jussi Melkas: Tilastot käyttöön –opas tilastojen maailmaan, http://ollintuumailut.blogspot.fi/2013/09/tilastojen-lukutaito-turistit.html
3.       THL: sairastavuusindeksi; Mikko Puttonen: Suomessa asuu kaksi kansaa, Tiede huhtikuu 2015; http://ollintuumailut.blogspot.fi/2015/04/perimalla-ja-elintavoilla-syvat-ita.html
4.       Ralf Dobelli: Viisaan toiminnan taito, HS-kirjat 2013 http://ollintuumailut.blogspot.fi/2013/07/dobellin-viisaudet-52-valtettavaa.html


Viitteet

(1) Hans Rossling: 
http://www.weforum.org/sessions/summary/sustainable-development-demystifying-facts?utm_content=buffer16fee&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer
http://tietotrenditblogi.stat.fi/tieto-tarjoillaan-nyt-nayttavasti-ja-havainnollisesti/
http://tietotrenditblogi.stat.fi/tilastojen-top-chefin-hans-roslingin-jaljilla/
http://www.oecd.org/site/worldforum/oecdworldforumonkeyindicators-firstconference.htm

(2) Tilastojen lukutaito: Reija Helenius: ISI ajaa tilastojen lukutaitoa
http://tietotrenditblogi.stat.fi/isi-ajaa-tilastojen-lukutaitoa/
Heleniuksen perään kuuluttamat peruskäsitteet saa parhaiten selville Tilastokeskuksen tilastokoulutusta: http://tilastokoulu.stat.fi/verkkokoulu_v2.xql

(3) Olli Nylander: Vaalipallo osa tilastojen visualisoinnin trendiä - visualisoinnin mahdollisuudet ja sudenkuopat, Tietoasiantuntija-lehti 2.3/2015, ss. 30-31

Ei kommentteja:

Lähetä kommentti