Hyppää pääsisältöön

Salainen sankaritiede on rohto vaikka mihin maailman ongelmiin

Julkaistu 12.5.2022
Tampereen korkeakouluyhteisö
Pekka Pere katsoo kameraan ja pitelee Tilastotieteen sanasto -kirjaa.
Kuva: Jonne Renvall, Tampereen yliopisto
Tilastotiede on tuottanut ihmiskunnalle huikeita tieteellisiä saavutuksia. Ja kaiken lisäksi se on hauskaa!

Jo nuorena opiskelijana Pekka Perellä oli tutkijanura mielessä. Se kaikkein rakkain ykkösala oli kuitenkin vielä lukioikäisenä löytämättä.

– Matematiikka ja historia viehättivät minua kouluaineista eniten. Lisäksi kodin perintönä pohdin mielelläni paljon yhteiskunnallisia kysymyksiä, Pere kertoo.

Onnekseen Pere kävi siskonsa vinkistä Helsingin yliopiston valtiotieteellisen tiedekunnan esittelytilaisuudessa. Siellä talous- ja tilastotiede kolahtivat nuorukaiseen.

– Liiketalous ei minua kiinnostanut vaan se, että taloustieteessä pääsisin lisäämään ymmärrystäni nimenomaan yhteiskunnan talouden kaltaisista isoista kysymyksistä.

Tilastotiede valikoitui sivuaineeksi. Vielä perusopintojen aikana tämä tieteenala ei varsinaisesti roihauttanut Pereä liekkeihin.

– Harjoitukset olivat varsin mekaanisia ja usein leluesimerkeistä. Oltaisiin vaikkapa voitu pohtia, millä todennäköisyydellä pyykkikorista osuu käteen kaksi sukkaa, jotka ovat pari.

Suosikkialaksi ja ammatiksi

Aineopinnoissa tilastotiede heräsi henkiin. Tilastollisen päättelyn teoria osoittautui jännittäväksi, matematiikka nousi uudelle tasolle todellisen käyttötarkoituksen myötä ja tilastotieteen teoriaa pääsi yhdistämään tosielämän empiirisiin aineistoihin.

Tilastotiede nousi taloustieteen rinnalle Peren suosikkialaksi – ja myöhemmin ohikin.

– Tilastotieteen hienouksia on, että alalla yhdistyvät matemaattinen teoria ja reaalimaailman ongelmien tutkiminen ja ratkaiseminen. Tämä oli minulle ihan täsmäala, nautin näiden molempien puolten tekemisestä ja opettamisesta.

Nyt Pere toimii tilastotieteen yliopisto-opettajana Tampereen yliopistossa. Opetusuransa lisäksi hän tutkii muun muassa tilastotieteen historiaa ja oikeustilastotiedettä. Jälkimmäisen alueella Pere on tutkinut oikeuden päätöksiä kuten rattijuopumustuomioita tilastollisella mallintamisella.

Äärettömät sovellusmahdollisuudet

Yksinkertaisesti sanottuna tilastotieteen menetelmillä voidaan kaivaa mitä erilaisemmista aineistoista esiin numeroin ilmaistavia tosiasioita. Käytännössä tilastotieteen soveltamismahdollisuudet ovat siis rajattomat.

– Röntgensäteiden tavoin tilastotiede paljastaa meille silmälle näkymättömiä todellisuuksia, Pere kuvailee.

Otetaanpa muutama esimerkki. Tilastotieteen ansiosta ilmastonmuutos on voitu osoittaa todeksi ja alan ansiosta osaamme seurata esimerkiksi sitä, millä vauhdilla napajäätiköt sulavat.

Uusien lääkkeiden kehitystyö nojaa sekin voimakkaasti tilastotieteeseen. Lääkkeiden teho ja turvallisuus varmistetaan aina tilastollisesti ennen niiden pääsyä markkinoille. Terveyden alalla tilastotiede voi pelastaa jopa syövältä: nykyinen tietokonetomografia tuottaa viipalekuvansa ihmiskehosta tilastolliseen menetelmään perustuvalla, säteilyä mittaavalla algoritmilla.

Ilman tilastotieteen vastaansanomattomia tutkimustuloksia voisimme jopa vielä uskoa tupakkatehtaiden väittämiin tuotteensa terveellisyydestä.

Yliopisto-opettajana toimiva Pere pyrkii opettamaan alan teoriat kiinnostavasti. Todennäköisyyslaskentaa voi harjoitella vaikkapa 1200-luvun runon avulla, jossa lasketaan todennäköisyyksiä noppien silmälukujen summille.Kuva: Jonne Renvall, Tampereen yliopisto

Päättäjille tilastotiede tuottaa hyvin monipuolista tietoa päätöstensä tueksi. He saavat tietää todennäköisyyksistä, joilla työtön työllistyy tai eri yhteiskuntaluokista päädytään opiskelemaan yliopistossa, miten maahanmuuttajat pärjäävät koulussa, kuinka tehokkaita ovat talouspoliittiset toimet tai milloin betonisillat tai junat alkavat olla korjauksen tai huollon tarpeessa.

Humanistit ja teologitkaan eivät jää tilastotieteen hedelmistä paitsi. Tilastotieteen avulla voidaan ajoittaa arkeologisen puuesineen ikä tai tutkia, löytyykö Uuden Testamentin evankeliumien taustalta jokin yhteinen, kirjoitettu lähde.

Ja niin edelleen.

Miksi meri vetäytyy?

Alan mahtavista soveltamisnäkymistä huolimatta moni opiskelija raahautuu tilastotieteen tunneille tutkintovaatimusten pakottamana ja hieman vastahakoisena. Tämä on Perelle tuttu haaste.

– Se on tietenkin vaikea lähtökohta opiskelulle ja opettamiselle mutta ymmärrän, että opiskelijoilla on erilaisia kiinnostuksenkohteita ja näkemyksiä, Pere sanoo.

Pere toki pyrkii opettamaan alan teoriat kiinnostavasti ja herättämään opiskelijassa halun oppia lisää. Hän etsii mieluusti tehtäviensä taustaksi jännittäviä aineistoesimerkkejä joko uusista tutkimuksista tai tieteenalansa historiasta.

Suomen rannikolla ihmeteltiin, miksi maata tuli vuosien mittaan rantaan lisää.

Todennäköisyyslaskennan harjoittelua varten Pere kaivoi esiin 1200-luvun runon, jossa laskettiin todennäköisyyksiä kolmen nopan silmälukujen summille.

Lineaariseksi regressioanalyysiksi kutsuttua menetelmää opetellessaan opiskelijat puolestaan pääsivät samalla tutustumaan 1700–1800-lukujen suomalaisten maannousun kummasteluun.

– Suomen rannikolla ihmeteltiin, miksi maata tuli vuosien mittaan rantaan lisää. Epäiltiin, että vesi vähenee ja siksi meri vetäytyy hitaasti kauemmaksi.

– Vuonna 1754 Augustin Ehrensvärd merkitsi Hankoon rantakallioon merenpinnan korkeudelle viivan. Se viiva sai vuosikymmenten saatossa uusia seuraajia ja niistä maineikas tiedemies Gustaf Hällström teki 1800-luvun puolella tutkimuksen. Tämän hänen tutkimuksensa toin sitten opiskelijoille tarkasteltavaksi.

Valhe, emävalhe, tilasto?

Peren kaltaiselta historiatietäjältä täytyy kysyä ikivanhasta virnistelyn aiheesta ”valhe, emävalhe, tilasto”. Mistä se on syntynyt? Voiko tilastoja todella käyttää oman etunsa tavoitteluun?

– Aivan aluksi on sanottava, että kunnolla toteutettu, satunnaisotantaan perustuva tilastotieteellinen tutkimus ei valehtele. Niihin voi luottaa, Pere painottaa.

– Valitettavasti aina silloin tällöin eteen tulee myös epäasialliseen aineistoon tai otantamenetelmään perustuvia tutkimuksia.

Kunnollisia tilastojakin täytyy toki osata tulkita oikein. Jos tätä taitoa ei ole, metsään mennään nopeasti. Toimittajat siis olkoot tarkkana tilastoja siteeratessaan.

– Sitten tuo lausahdus, ”valhe, emävalhe, tilasto”. Valitettavasti täysin varmaa tietoa sen syntyhistoriasta ei ole, mutta letkauksen kerrotaan syntyneen brittiläisten valtiomiesten Benjamin Disraelin ja Robert Peelin väittelyssä viljatullien puolesta ja vastaan 1800-luvun puolivälissä, Pere kertoo.

– Kumpikin oli perustellut toiselleen vastakkaista kantaansa omalla datallaan, minkä jälkeen Disraelin kerrotaan päästäneen ilmoille tuon lentävän lauseen.

Kunnolla toteutettu, satunnaisotantaan perustuva tilastotieteellinen tutkimus ei valehtele.

Pere uskoo kuitenkin, että Disraelin ja Peelin väittelyssä ei ollut kyse puhetaidollisista sumutusyrityksistä tai datan tahallisista vääristelyistä. Heidän datansa ristiriidassa epäillään olleen kyse niin sanotusta Simpsonin paradoksista.

– Se paradoksi onkin veikeä tapaus. Oletetaan vaikkapa, että tavoitteena on selvittää kumpi lääkkeistä A tai B on parempi. Mukaan on valittu otokset miehiä ja naisia.

– Kun lääkkeitä on annettu miehille, huomataan lääkkeen A toimivan heille paremmin. Samoin lääke A osoittautuu paremmaksi myös naisille.

Kun sitten aineistot yhdistetään, käy ilmi, että lääke B toimii koko aineistossa paremmin.

– Lääke A on siis parempi miehille ja naisille, mutta lääke B on parempi ihmisille. Tällainen on Simpsonin paradoksi, joka aina joskus aineistoissa ilmenee. Melkoisen hämmentävä ilmiö tilastotieteeseen perehtymättömälle.

Sanastosepät

Tilastotiede ei ole paikallaan pysyvä tiede. Päinvastoin se harppoo koko ajan kovaa vauhtia eteenpäin, Pere kertoo.

– Alalla syntyy kansainvälisesti koko ajan uusia teorioita ja käsitteitä, joilla aineistoja voidaan tutkia entistä paremmin.

Kansainvälisellä tilastotieteen alalla uusia käsitteitä syntyy tiheään. Niille tarvitaan myös suomenkieliset vastineet ja vanhakin sanasto kaipaa yhdenmukaistamista. Siksi Pekka Pere ja tilastotieteen professorit Juha Alho, Elja Arjas ja Esa Läärä tekivät Tilastotieteen sanasto -kirjan. Se julkaistiin joulukuussa 2021.Kuva: Jonne Renvall, Tampereen yliopisto

Näille uusille käsitteille tarvitaan tietenkin uudet suomenkieliset terminsä. Tämä on yksi syy, miksi Pere ja tilastotieteen professorit Juha Alho, Elja Arjas ja Esa Läärä tekivät vastikään Tilastotieteen sanasto -kirjan. Sen tavoitteena on paitsi lanseerata uusia suomenkielisiä termejä myös yhdenmukaistaa alan vanhaa sanastoa.

– Tilastotieteen menetelmiä käytetään niin laajasti eri tieteenaloilla, että samoille käsitteille on päässyt syntymään useita eri termejä. Se aiheuttaa sekaannuksia ja toivommekin, että tämä sanasto vähentäisi tilastotieteen kielen pirstoutuneisuutta.

Vaikka englanti on ehdoton ykköskieli akateemisessa maailmassa, on ehdottoman tärkeää pitää myös tieteellinen suomen kieli elinvoimaisena.

– Tutkimuksesta pitää voida keskustella ja tutkimustuloksista kertoa suomeksi, Pere linjaa.

– Tieteen hyödyntäminen laajasti yhteiskunnassa edellyttää sitä, mutta se on tärkeää myös kansallisen identiteetin ja demokratian kannalta.

”Statistics is the drug!”

Pere mainitsee harvojen tietämän yksityiskohdan: toinen kahdesta ensimmäisestä suomenkielisestä tieteellisestä artikkelista oli tilastotieteellinen.

– Vuonna 1850 Johan Eklöf päätti julkaista suomeksi artikkelinsa Kokemäenjoen jäidenlähtöajoista 1800–1849. Sehän oli siis oikeastaan varhaista ilmastotutkimusta.

Eklöfiä parjattiin tiedeyhteisössä muun muassa suomen kielellä kirjoittamisesta eikä ansiokasta tutkimusta hyväksytty aikansa tiedejulkaisuun.

– Eklöfiin törmäsin itse tähtitieteen historiikin kautta. Siinä viitattiin Katja Huumon väitöskirjaan Perkeleen kieli, jossa tutkitaan suomen kielen kehittymistä tieteen kieleksi 1800-luvulla ja jossa Huumo kuvasi Eklöfin vaikeudet julkaista suomeksi. Epäilen, ettei moni tilastotieteilijäkään tunne Eklöfiä, tuota nuorena juoppouteen kuollutta alamme ja tieteellisen suomen kielen uranuurtajaa.

Tutkimuksesta pitää voida keskustella ja tutkimustuloksista kertoa suomeksi.

Mitä juoppouteen tulee, Pere esitti vastikään luennollaan empiirisen esimerkin aineiston päihteiden ja huumeiden käytöstä.

Samalla hän antoi opiskelijoilleen moraalisen ohjeen, jottei Eklöfin päihteinen kohtalo kenenkään kohdalla toistuisi.

– Mieleeni tuli klassikkokappale ”Love is the drug” ja totesin opiskelijoille, miten rakkaus on ilman muuta paras huume. Sitten äkkäsin jatkaa: ”Statistics is the drug”!

– Onhan tämäkin ihan parasta huumetta. Hauskaa touhua, ja samalla rohto, drug, vaikka mihin maailman ongelmiin.

Pekka Pere

  • Tilastotieteen yliopisto-opettaja Tampereen yliopistossa.
  • Syntynyt 1964 Helsingissä.
  • Väitteli tohtoriksi Oxfordin yliopistosta vuonna 1997.
  • Perheeseen kuuluu vaimo ja 3+2 aikuista lasta molempien edellisistä liitoista.
  • Harrastaa lukemista, kuntoilua, puutarhanhoitoa, mökkeilyä ja amerikkalaisia autoja. ”Tallista löytyy Plymouthin 1965 Valiant ja 1964 Fury. Isäni osti Valiantin uutena ja sain sen käyttööni, kun täytin 18 vuotta. Valiant on ollut elämässäni kaikessa mukana.”

Kirjoittaja: Tapio Ollikainen