Hyppää pääsisältöön
Tutkimus

Mittareita pidemmälle: Muhammad Waseem tekoälyn todellisista vaikutuksista ohjelmistotuotantoon

Julkaistu 21.4.2026
Tampereen yliopisto
Muhammad Waseem at Hervanta Campus
Kuva: Jonne Renvall
Kun tekoälystä ja ohjelmistokehityksestä puhutaan, keskustelu kapenee helposti työkaluihin ja vertailutesteihin. Tampereen yliopiston GPT-Labin varajohtaja ja tutkijatohtori Muhammad Waseem näkee tilanteen toisin: muuttumassa ei ole vain se, kuinka nopeasti koodia voidaan kirjoittaa, vaan myös se, miten ohjelmistojärjestelmiä suunnitellaan, validoidaan ja sovitetaan tosielämän ympäristöihin.

– Uskon, että olemme jo ohittaneet vaiheen, jossa kiinnostavin kysymys olisi se, mikä malli suoriutuu vertailutestissä hieman paremmin tai mikä työkalu generoi koodia nopeammin.

Kuva näyttää erilaiselta riippuen siitä, tarkastellaanko asiaa teollisuuden vai akateemisen tutkimuksen näkökulmasta, vaikka nämä kaksi lähestyvätkin toisiaan. Yritykset ovat jo havainneet, että generatiivinen tekoäly kykenee kirjoittamaan koodia ja tukemaan kehitystehtäviä. Kysymys on nyt siitä, voidaanko näihin järjestelmiin luottaa, kuinka pitkälle niiden autonomia voi ulottua ja miten ne sopivat tosielämän kehitysprosesseihin tuomatta mukanaan uusia riskejä. Tutkimuksen näkökulmasta juuri nämä ovat kaikkein keskeisimmät kysymykset. 

– Todellinen uusi kyky ei ole pelkästään nopeampi koodin generointi, vaan mahdollisuus tavoiteohjattuun, monivaiheiseen ohjelmistotuotannon tukeen. Siinä mielessä generatiivinen tekoäly alkaa vaikuttaa paitsi ohjelmistotuotteisiin myös ohjelmistoprosesseihin ja kehitysmenetelmiin.

Käsitteet kuten "Vibe Coding", jossa kehittäjät ohjaavat tekoälyä kohti haluttua lopputulosta kehotteistamisen kautta sen sijaan, että kirjoittaisivat itse jokaisen koodirivin, kertovat siitä, että ohjelmistokehitys ei vain ota uusia työkaluja käyttöön, vaan miettii uudelleen, miten ihminen ja tekoäly tekevät yhteistyötä. Vaikeat kysymykset seuraavat luontevasti perässä. 

– Kun järjestelmistä tulee yhä autonomisempia, luotettavuuteen, läpinäkyvyyteen, vastuuseen ja validointiin liittyvät kysymykset muuttuvat huomattavasti monimutkaisemmiksi. Nämä eivät ole pieniä toteutuksellisia huolenaiheita, vaan ohjelmistotuotannon perustavanlaatuisia kysymyksiä.

Demosta tuotantoon 

Waseem katsoo, että tärkein tutkimus tapahtuu vaikuttavan demon ja tuotantovalmiin, todellisessa organisaatiossa päivittäin toimivan työkalun välisessä kuilussa. 

– Nopeasti rakennettu generatiivisen tekoälyn demo voi osoittaa, että malli kykenee tekemään jotain vaikuttavaa hallitussa ympäristössä. Demon muuntaminen tosielämän tuotantojärjestelmäksi on kuitenkin aivan eri haaste. Käytännössä tuotantojärjestelmän on oltava luotettava, kestävä, turvallinen, ylläpidettävä ja aidosti hyödyllinen todellisessa projektiympäristössä.

Tämän kuilun ylittäminen on GPT-Labin päätavoite. Professori Pekka Abrahamsson perusti laboratorion vuonna 2023, ja se rakentaa järjestelmiä todellisten organisaatioiden rinnalla ja testaa niitä oikeiden käyttäjien kanssa. 

– Hyvin usein ratkaisevinta ei ole pelkästään mallin kyky, vaan se, sopiiko ratkaisu siihen todelliseen kontekstiin, jossa sitä käytetään. 

Esimerkkinä toimii tarjousanalyysijärjestelmä, joka auttaa julkisen sektorin hankintatiimejä analysoimaan tarjousasiakirjoja, tunnistamaan vaatimustenmukaisuuskriteerit, arvioimaan tarjouksia ja tuottamaan jäsenneltyjä päätösraportteja. Työ, joka aiemmin vei päiviä, voidaan nyt tehdä huomattavasti tehokkaammin. 

Laboratorio tukee myös yrityksiä, jotka käyttävät tekoälyä nopeaan prototyypittämiseen. Näin ne voivat testata ideoita ja osoittaa niiden arvon ennen sitoutumista täysimittaiseen kehitystyöhön.  

– Kun työ jää demon tasolle, integraatioon, hallintaan, käytettävyyteen ja pitkän aikavälin arvoon liittyvät kysymykset jäävät edelleen avoimiksi.

Waseem is at the Hervanta campus.Kuva: Jonne Renvall

Rakenteen voima 

Laboratorion keskeinen tutkimuskohde ovat moniagenttijärjestelmät, joissa useat itsenäiset tekoäly-"agentit" tekevät yhteistyötä tehtävissä kuten vaatimusten analysoinnissa tai koodin generoinnissa. Kukin agentti käsittelee osan ongelmasta, hakee tietoja ulkoisilla työkaluilla ja välittää tulokset seuraavalle.  

– Yksinkertaisen moniagenttijärjestelmän rakentaminen ei ole nykyään välttämättä vaikeaa. Meillä on jo melko kypsiä viitekehyksiä, kuten LangGraph, Crew AI ja muut. Todellinen haaste alkaa siinä vaiheessa, kun näitä järjestelmiä yritetään saada toimimaan luotettavasti käytännössä.

Laboratorio on tunnistanut kolme keskeistä estettä. Ensimmäinen on koordinaatio: yhden agentin pieni virhe voi levitä koko järjestelmään. Toinen on muisti, sillä nämä järjestelmät voivat kamppailla kontekstin säilyttämisen kanssa pitkissä työnkuluissa. Kolmas on validointi: kun työ jakautuu useille agenteille, jotka ovat vuorovaikutuksessa reaaliaikaisen datan kanssa, on vaikea varmistaa, että oikea toimenpide on tehty. 

Waseem huomauttaa kuitenkin, että nämä ovat nykyteknologian rajoituksia eivätkä pysyviä esteitä. Konteksti-ikkunat laajenevat, muistimekanismit kehittyvät ja työkaluintegraatio vahvistuu, joten edistystä tapahtuu tasaisesti kaikilla kolmella osa-alueella. Syvempi havainto on, että rakenne merkitsee enemmän kuin raaka malliteho. 

– Se, miten tehtävät hajotetaan osiin, miten agentit kommunikoivat, missä kohtaa inhimillinen valvonta otetaan mukaan ja miten tulokset validoidaan: nämä suunnittelupäätökset merkitsevät usein enemmän kuin yksittäinen käytetty malli.

Tutkimus kentällä 

GPT-Lab tekee yhteistyötä julkisten organisaatioiden, pienten ja keskisuurten yritysten sekä suurempien yhtiöiden kanssa ympäri Suomea niin suoran yhteistyön kuin vastuullista tekoälyn käyttöönottoa tukevan julkisen rahoituksen kautta. Toimiminen näissä eri konteksteissa paljastaa, kuinka vahvasti tulokset riippuvat siitä erityisestä ympäristöstä, jossa järjestelmiä käytetään. 

– Yhteistä kaikille on se, että työ on ankkuroitu todellisiin ongelmiin. Emme lähde liikkeelle teknologiasta ja kysy, mihin se voisi sopia.

Laboratorion rooli, kuten Waseem sen kuvaa, on toimia sillanrakentajana tutkimisen ja validoinnin välillä. Käytännössä ideoita prototyypitetään nopeasti samalla kun seurataan, miten ne kestävät käytännössä ajan myötä, mikä yhdistää käytännön vaikuttavuuden tiukkaan, näyttöön perustuvaan tutkimukseen. 

Mitä seuraavat viisi vuotta vaativat 

Tulevaisuutta silmällä pitäen Waseem odottaa merkittävimpien muutosten ohjelmistotuotannossa tulevan siitä, miten työ jäsennetään, eikä yksittäisistä teknologisista läpimurroista. Insinöörin rooli siirtyy kohti sellaisten järjestelmien suunnittelua, joissa tekoäly on osana, ja sen varmistamista, että nämä järjestelmät toimivat tarkoitetulla tavalla. 

– Ohjelmistotuotannossa on yhä vähemmän kyse siitä, että kirjoitat kaiken itse, ja yhä enemmän siitä, että suunnittelet, ohjaat ja validoit järjestelmiä, joissa tekoäly on aktiivinen osallistuja. 

Tämä viittaa kasvavaan tarpeeseen sille, mitä hän kutsuu tekoälyosaamiseksi, eli kykyyn muotoilla ongelmat selkeästi, delegoida tehtäviä tekoälyjärjestelmille tehokkaasti ja arvioida tuloksia kriittisesti. Nämä eivät ole yksinomaan teknisiä taitoja, mutta ne tulevat olemaan tärkeitä kaikille, jotka työskentelevät ohjelmistoalalla. 

 

“Keskity ymmärtämään, miten järjestelmiä suunnitellaan ja validoidaan, ei pelkästään sitä, miten koodia kirjoitetaan. Työkalut kehittyvät edelleen nopeasti, mutta kyky työskennellä niiden kanssa tehokkaasti ja rakentaa järjestelmiä, joihin voidaan käytännössä luottaa, on kestävämpi taito.” 

Muhammad Waseem

 

Muhammad Waseem, Postdoctoral Research Fellow Kuva: Jonne Renvall

Kirjoittaja: Sujatro Majumdar