Hyppää pääsisältöön

Fatemeh Shokrollahi Yancheshmeh: Kuvauskohteiden visuaalinen samankaltaisuus voidaan tunnistaa uuden laskennallisen menetelmän avulla

Tampereen yliopisto
SijaintiKorkeakoulunkatu 1, Tampere
Tietotalo, luentosali TB109, Hervannan kampus sekä etäyhteys.
Ajankohta2.2.2024 12.00–16.00
Kielienglanti
PääsymaksuMaksuton tapahtuma
Kuva: Fatemeh Shokrollahi Yancheshmeh
Väitöstutkimuksessaan diplomi-insinööri Fatemeh Shokrollahi Yancheshmeh kehitti kuvaketjuihin perustuvan laskennallisen menetelmän. Sen avulla voidaan tunnistaa eri kuvakulmista kuvattujen kohteiden visuaalisia yhteneväisyyksiä. Kahden eri kuvan välille syntyvä visuaalinen polku auttaa sekä yhdistämään että erottamaan kuvauskohteita toisistaan. Se mahdollistaa kuvassa esiintyvien asioiden tai esineiden tarkemman luokittelun. Menetelmästä on hyötyä muun muassa tietokonenäköön perustuvien sovellusten kehittämisessä ja laajojen kuva-aineistojen analysoinnissa.

Arkisia esimerkkejä tietokonenäköön perustuvista sovelluksista ovat kasvojentunnistus, auton rekisterikilven automaattinen tunnistus valvontakamerasta tai ruokia kuljettava robotti, joka pysyttelee jalkakäytävällä kamerakuvan avulla.

–Ruokia kuljettava robotti suunnistaa kamerakuvan avulla paikasta toiseen tunnistamalla reitiltä tuttuja maamerkkejä. Tämän mahdollistaa robotin sisuksissa olevan tietokoneohjelman sisältämä menetelmä, joka kertoo robotille, mitä asioita kamerakuvasta löytyy ja missä ne sijaitsevat, sanoo Fatemeh Shokrollahi Yancheshmeh. Hän on tutkinut ja kehittänyt näitä menetelmiä väitöskirjassaan.

Tietokonenäössä visuaalisen kohteen havaitsemiseen ja luokitteluun liittyy useita haasteita. Ensinnäkin tietokoneohjelman pitää oppia erottamaan toisistaan samaan kategoriaan kuuluvat kohteet ja mallintamaan kohteiden visuaalisen ilmeen vaihtelua. Kohdekategoria voi olla vaikkapa ”huonekalu”, ”auto” tai ”eläin”. Toiseksi kohteiden tunnistusta ja luokittelua samankin kategorian sisällä hankaloittaa se, että kohdetta kuvattaessa kuvakulmat sekä kuvausympäristöt ja -olosuhteet, kuten valaistus, voivat vaihdella hyvinkin paljon. Visuaalisen vaihtelun lisäksi myös kohteiden visuaalinen samankaltaisuus tuottaa tietokonenäölle haastetta.

– Ajatellaanpa vaikka kahta eri automallia. Sama auto kuvattuna edestä ja sivusta näyttää hyvin erilaiselta. Kaksi eri autoa kuvattuna samasta suunnasta taas voivat näyttää hyvin samanlaisilta, Fatemeh Shokrollahi Yancheshmeh sanoo.

Väitöstutkimuksessaan hän kehitti menetelmän, jonka avulla voidaan tunnistaa eri kuvakulmista kuvattu kohde käymällä eri kuvakulmat läpi askel askeleelta. Kuvien ketju voi esimerkiksi johtaa päätelmään, että kuvissa esiintyy yksi tietty automalli.

–Kuvaketjut ovat eräänlaisia ”visuaalisia polkuja” kahden eri kuvan välillä. Visuaalisia polkuja voidaan hakea myös kahden hyvin erilaisen kuvan välillä. Voidaan esimerkiksi etsiä kuvat, jotka muuttavat polkupyörän pikkuhiljaa moottoripyöräksi.

Menetelmän avulla voidaan nähdä esineiden tai asioiden väliset visuaaliset samankaltaisuudet. Menetelmää voisi soveltaa vaikkapa verkkokaupassa: asiakkaan etsimälle tuotteelle voidaan automaattisesti tarjota vastaavan näköisiä vaihtoehtoja. Lisäksi olisi mahdollista mitata, miten paljon esimerkiksi jokin tuote on lainannut visuaalisia ominaisuuksia joltain toiselta tuotteelta. Tämä voisi auttaa joissain tapauksissa esimerkiksi tuote- tai taideväärennösten tunnistamisessa.

– Väitöstutkimuksessa kehitetyillä visuaalista samankaltaisuutta mittaavilla menetelmillä on potentiaalisia sovelluksia erityisesti lääketieteellisessä kuvantamisessa. Lääkäri voi merkitä kuvaan esimerkiksi syöpäsolukon, jolloin menetelmä pystyy automaattisesti hakemaan kaikki vastaavat löydökset miljoonista muista kuvista, ja lääkäri saa kollegoidensa arvioista tukea omalle diagnoosilleen, Fatemeh Shokrollahi Yancheshmeh sanoo.

Väitöstilaisuus perjantaina 2. helmikuuta

Diplomi-insinööri Fatemeh Shokrollahi Yancheshmehin Tietotekniikan alaan kuuluva väitöskirja Visual Similarity for Object Detection and Alignment tarkastetaan julkisesti Tampereen yliopiston Informaatioteknologian ja viestinnän tiedekunnassa perjantaina 2. helmikuuta 2024 kello 12:00 Tietotalon salissa TB109 (Korkeakoulunkatu 1, Tampere). Vastaväittäjinä toimivat professori Heikki Kälviäinen LUT-yliopistosta ja vanhempi yliopistonlehtori Jorma Laaksonen Aalto-yliopistosta. Kustoksena toimii professori Joni Kämäräinen Tampereen yliopiston Signaalinkäsittelyn tutkimuskeskuksesta.

Tutustu väitöskirjaan

Seuraa väitöstilaisuutta etäyhteydellä


Kuva: F. Shokrollahi Yancheshmeh