Tutkimusryhmä tekee suomen kielen alalla tutkimusta opiskelukielen taidon merkityksestä ja riittävyydestä korkeakouluopinnoissa. Sivustoa päivitetään sitä mukaa, kun tutkimus etenee.
Keskeiset tehtävät ja tavoite
Korkeakoulujen suomenkielisissä tutkinto-ohjelmissa opiskelee kasvava joukko opiskelijoita, joille opiskelukielenä käytettävä suomi ei ole vahvin kieli. Opiskelukielen taito määrittää osallisuutta korkeakouluopinnoissa ja voi vaikuttaa opinnoissa pärjäämiseen. Tutkimuksemme tarkoituksena on kerätä tietoa korkeakoulujen suomenkielisten tutkinto-ohjelmien opiskelijoilta heidän kokemuksistaan opinnoissa pärjäämisestä ja kielellisistä haasteista. Keräämme tietoa kaikilta opiskelijoilta kielitaustaan katsomatta. Tutkimuksen tulosten perusteella tehdään johtopäätöksiä opiskelijoiden tuen tarpeista ja mahdollisesti annetaan suosituksia korkeakoulujen tukikäytänteiden uudistamiseksi. Tutkimuksessa tarkastellaan myös pärjäämisen kokemuksen ja kielitaidon ajallista kehittymistä seurantatutkimuksen avulla. Tutkimus yhdistää kielentutkimuksen sosiaalista ja psykologista tutkimuskehystä.
Toiminnan vaikuttavuus
Tutkimus tuottaa tietoa erityisesti maahanmuuttotaustaisten nuorten menestymisestä ja haasteista korkeakouluopinnoissa. Tieto auttaa korkeakouluja suunnittelemaan palveluita eri taustoista tuleville opiskelijoille sekä tarvittaessa purkamaan rakenteellisia esteitä, jotta korkeakouluopetus olisi saavutettavampaa kielellisesti.
Ryhmän johtaja
Maija Tervola
yliopistonlehtori, suomi toisena kielenäRyhmän muut jäsenet
Tutkijatohtori (FT, dos.) Mari Honko (JyU)
Itsearviointi pärjäämisen kokemuksen ja oman kielitaidon mittarina
Tutkimuksessa käytetään pärjäämisen kokemuksen mittaamisessa itsearviointia. Myös kielitaidon mittarina käytetään itsearviointia ulkoisen kielitestin lisäksi.
Pärjäämisen kokemusta mitataan tilannekohtaisesti, siten että tutkimukseen osallistuvilta kysytään, kuinka hyvin he kokevat selviytyvänsä suomen kielellä esitellyistä opiskelutilanteista ja -tehtävistä. Tilanteet on kuvailtu seuraavasti:
- Opettajan puheen ymmärtäminen opetustilanteessa
- Opiskeluun liittyvien tekstien lukeminen ja ymmärtäminen
- Opiskelutekstien kirjoittaminen (esim. luentopäiväkirja, essee, tenttivastaus)
- Puhuminen ja keskusteleminen opiskelutilanteessa (esim. esitelmä, ryhmätyö, kysyminen ja kommentoiminen)
- Keskustelu tauoilla ja vapaa-ajalla muiden opiskelijoiden kanssa
- Sähköpostien ja muiden viestien kirjoittaminen opiskeluun liittyvissä asioissa
Vastaajia pyydetään arvioimaan omaa pärjäämisen kokemustaan näissä tilanteissa viisiportaisella asteikolla (1= erittäin huonosti, 2= melko huonosti, 3= kohtalaisesti, 4= melko hyvin, 5= erittäin hyvin). Lisäksi annettiin vaihtoehto "vaihtelevasti".
Kielitaidon itsearviointi laadittiin koskemaan kaikkia vastaajan osaamia kieliä siten, että taulukkoon merkittiin kaikki Eurooppalaisen viitekehyksen taitotasot A1--C2 ja jokaisen taitotason kohdalle lisättiin lyhyt toiminnallinen kuvaus taitotasosta. Vastaajaa pyydettiin kirjoittamaan sen kielen tai niiden kielten nimi, jotka hän kokee hallitsevansa kyseisellä tasolla. Näin ollen jokaiselle taitotasolle saattoi kirjoittaa yhden tai useamman (enimmillään kolme) kielen nimen tai jättää taitotason tyhjäksi.
Sanaston laajuutta mittaava testi kielitaidon arvioinnin työkaluna
Tutkimuksessa käytetään kielitaidon arviointiin ulkoista kielitestiä, joka on verkkopohjainen sanojen tunnistustesti. Testi sijaitsee osoitteessa https://webpages.tuni.fi/simhe-kielitesti. Sitä voi vapaasti käyttää myös muihin tarkoituksiin.
Kielitaidon arviointi testillä perustuu tietoon sanojen yleisyydestä ja sen vaikutuksesta sanojen oppimiseen: Mitä yleisempi sana on, sitä useammin kielenoppija todennäköisesti kohtaa sanan ja sitä paremmin hän todennäköisesti oppii kyseisen sanan. Tähän perustuen voidaan henkilön sanaston laajuutta arvioida karkeasti sen mukaan, kuinka paljon ja kuinka harvinaista sanastoa hän tuntee (Nation 2001; Milton 2009). Sanaston laajuus puolestaan on yksi keskeinen toiminnallista kielitaitoa selittävä tekijä, sillä sanastoa tarvitaan sekä puheen ja tekstin ymmärtämiseen että puhumiseen ja kirjoittamiseen kaikissa vuorovaikutustilanteissa.
Suurin osa sanojen yleisyystietoa hyödyntävästä aiemmasta tutkimuksesta on tehty englannin ja muutamien muiden suurten kielten aineistosta, mutta myös suomen kielellä tehdyt tutkimukset osoittavat, että sanaston yleisyyspohjainen arviointi toimii (Honko 2013; Tervola 2019; Pajunen & Honko 2021). Sanaston laajuuden onkin useissa tutkimuksissa osoitettu olevan vahvin yksittäinen yleisen kielenkäyttötaidon indikaattori. Etenkin lukemisessa sanaston laajuudella on suuri merkitys. Siksi sanaston laajuutta mittaavia testejä on käytetty paljon juuri korkeakouluohjelmien pääsykokeissa (ks. esim. Lam 2006; Harrington & Carey 2009).
Testi on koostettu viidestä sanapatterista, joista jokaisessa on 600 sanaa: 400 suomenkielistä sanaa tietyltä yleisyystasolta sekä 200 epäsanaa, jotka muistuttavat äännerakenteeltaan suomen kielen sanoja mutta eivät ole käytössä olevia sanoja. Testi arpoo jokaiselle testikerralle näkyviin halutun määrän (20–100) sanoja, joista testintekijän pitää merkitä ne sanat, jotka hän tuntee. Jokainen merkitsemättä jätetty oikea sana tai merktty epäsana vähentävät pistetulosta. Epäsanojen käytöllä pyritään kontrolloimaan vastausstrategiaa, eli jos testin tekijällä on taipumus merkitä sanoja tutuiksi silloinkin kun hän ei ole asiasta ihan varma, hän todennäköisesti valitsee myös epäsanoja, jolloin testitulos ei nouse kovin suureksi ja säilyy jokseenkin vertailukelpoisena toisenlaisen strategian kanssa, jossa merkitään huolellisemmin vain ne sanat, joiden tuttuudesta testin tekijä on varma (Pellicer-Sánchez & Schmitt 2012). Testin tulokset täytyy kuitenkin suhteuttaa aina sattumanvaraisuuteen ja arvaamisen mahdollisuuteen, ja siitä syystä kovin alhaisten pistemäärien perusteella ei voi tehdä johtopäätöksiä testin tekijän sanaston laajuudesta.
Tämän testin sanat on poimittu suomenkielisen Internetin korpuksesta Finnish Internet Parsebank (FIP), josta on saatu myös sanojen yleisyystiedot. Korpukseen kerätään kaikki Internetin suomenkieliset tekstit, joten korpus ei rajoitu minkään tietyn aihepiiriin, tekstilajin tai rekisterin teksteihin. Tätä testiä varten korpuksen sanalistasta on poimittu kaikki yleiskieliset sanat; toisin sanoen puhekieliset, murteelliset sekä vanhahtavat sanat on jätetty pois. Myös pronominit ja konjunktiot on jätetty pois. Testiin on otettu mukaan siis lähinnä substantiiveja, verbejä, adjektiiveja sekä joitakin partikkeleita. Testin kaikilla tasoilla on sekä konkreettista sanastoa (avata, hius, saari, terävä ja vaaka) että abstraktimpaa yleisakateemista sanastoa (tarkoittaa, muodostaa, hallinta, oikeuttaa ja edustus). Testin tasoilla sanat eroavat toisistaan yleisyystason mukaan siten, että ensimmäisen tason sanat on poimittu 600 suomen yleisimmän sanan joukosta, toisella tasolla sanat on poimittu yleisyysväliltä 600.–1200., kolmannella tasolla yleisyysväliltä 1200.–2000., neljännellä tasolla yleisyysväliltä 2000.–4000. ja viidennellä testitasolla yleisyysväliltä 4000.–6600 (ks. taulukko 1). Käytännössä alempien tasojen sanat ovat keskimäärin lyhyempiä ja useammin johtamattomia, ylemmillä testitasoilla puolestaan johdosten määrä kasvaa ja sanat ovat keskimäärin pitempiä.
Testin sisältämän sanaston merkitystä esimerkiksi asiatekstin lukemiselle voi arvioida karkeasti testitasoittain sanojen laskennallisen tekstipeiton avulla. Koska yleisemmät sanat esiintyvät kaikenlaisissa teksteissä useimmin, ne muodostavat suurimman tekstipeiton. Testin tason 1 muodostava 600 yleisimmän sanan joukko taivutusmuotoineen kattaa noin 50 % korpuksen tekstien sanaesiintymistä. Kun sanojen määrää kasvatetaan yhä harvinaisemmilla sanoilla, tekstipeitto kasvaa hitaasti. Testin kaikkien tasojen yhteisesti sisältämän sanaston tekstipeitto on kokonaisuudessaan 75 %, eli keskimäärin joka neljäs korpuksen teksteissä vastaantuleva sana jää kokonaan tämän testin sanaston ulkopuolelle. (Ks. taulukko 1).
Taulukko 1. Kielitestin tasot, sanojen yleisyys ja laskennallinen tekstipeitto.
Testin taso | Yleisyysväli, jolta sanat on poimittu | Tekstipeitto |
---|---|---|
1 | 1.‒600. | noin 50 % |
2 | 601.‒1200. | noin 60 % |
3 | 1201.‒2000. | noin 65 % |
4 | 2001.‒4000. | noin 70 % |
5 | 4001.‒6600. | noin 75 % |
Tutkimuksessa käytettyä sanafrekvenssiin perustuvaa testimuotoa on aiemmin sovellettu etenkin englannin kieleen, jossa vastaavan sanatestin tuloksen on havaittu peilaavan varsin hyvin esimerkiksi Eurooppalaisen viitekehyksen mukaan arvioitua yleistä kielitaidon tasoa (ks. esim. Alderson & Huhta, 2005; Harrington & Roche, 2014). Tässä tutkimuksessa käytetty testiversio (yleiset, keskiyleiset ja melko harvinaiset sanat) pilotoitiin ennen tutkimuksen käynnistämistä aikuisryhmässä, joka koostui sekä suomea äidinkielenä että toisena kielenä puhuvista korkeakoulutetuista henkilöistä. Pilotointiin osallistuneet suomea äidinkielenä puhuvat henkilöt saavuttivat testin kaikilla tasoilla 96–100 % testin enimmäispisteistä, eikä testi käytännössä siksi erotellut näitä osallistujia. Tutkimuksen ensitulosten perusteella testi sen sijaan on erottelevampi muissa kielenkäyttäjäryhmissä.
Yleisesti sanaston koon perustasona pidetään englannin kielessä 2000 yleisimmän sanan tuntemusta, jota pidetään jonkinlaisena vähimmäisvaatimuksena akateemisen opiskelun sujumiselle (Nation 2001: 15). Miltonin (2009: 190) samansuuntaisen arvion mukaan Eurooppalaisen viitekehyksen keskitasolla sanaston tulisi kattaa noin 3000 sanaa. Aiempaan tutkimukseen ja pilottivaiheen esitestaukseen perustuen voidaan arvioida, että testin tasoa 3, joka mittaa 2000 yleisimmän sanan tuntemusta, voidaan pitää hyvänä lähtökohtana, kun ryhdytään pohtimaan sanaston laajuuden riittävyyttä suomenkielisiin korkeakouluopintoihin. Jos tason 3 sanasto ei ole tuttua, kielitaidon yleistaso ei todennäköisesti vielä tue korkeakouluopiskelua riittävästi. Alempien tasojen 1 ja 2 avulla voidaan arvioida, kuinka kaukana perustason saavuttaminen on. Ylemmät tasot 4 ja 5 kertovat laajemman sanaston osaamisesta ja siten myös korkeammasta yleisestä kielitaidon tasosta. Tarvitaan kuitenkin vielä tarkempaa tutkimusta siitä, miten testin tasot suhteutuvat toiminnallisen kielitaidon tasoihin eri kielenkäyttäjillä.
Kielitestiä voi käyttää esimerkiksi kielitaidon itsearviointia tukemassa tai oman kielitaidon edistymisen seurannan yhtenä konkreettisena apuvälineenä. Testikertojen väliin tulee tällöin kuitenkin jättää riittävän pitkä aika.
Testin on tuotettu KORKO-hankkeessa ja sen on laatinut Tampereen yliopiston suomen kielen yliopistonlehtori Maija Tervola. Kiitämme testin teknisestä toteutuksesta TAMKin tietojenkäsittelyn opiskelijoita ja opettajia sekä AJR Solutions'ta. Palautetta testistä voi lähettää osoitteeseen maija.tervola [at] tuni.fi (maija[dot]tervola[at]tuni[dot]fi).
Lähteet:
Alderson, Charles J. & Huhta, Ari 2005: The development of a suite of computer-based diagnostic tests based on the Common European Framework. Language Testing 22 (3), s. 301–320.
FIP = Finnish Internet Parsebank, suomenkielisen Internetin korpus. Leksikaalinen haku: https://turkunlp.org/finnish_nlp.html. Sanojen yleisyystiedot tarkistettu joulukuussa 2020.
Harrington, Michael & Carey, Michael 2009: The on-line Yes/No test as a placement tool. System 37, s. 614–626.
Harrington, Michael & Roche, Thomas 2014: Word recognition skill and academic success in an ELF university setting. Papers in Language Testing and Assessment 3 (2), s. 76–99.
Honko, Mari 2013: Alakouluikäisten leksikaalinen tieto ja taito. Toisen sukupolven suomi ja S1-verrokit. Acta Universitatis Tamperensis 1865. Tampereen yliopisto.
Lam, Yvonne 2006: Yes/no tests for foreign language placement at the post-secondary level. – Canadian Journal of Applied Linguistics / Revue canadienne de linguistique appliquée 13(2), s. 54–72.
Milton, James 2009: Measuring Second Language Vocabulary Acquisition. Multilingual Matters.
Nation, I. S. P. 2001: Learning Vocabulary in Another Language. Cambridge University Press.
Pajunen, Anneli & Honko, Mari 2021: Unelmieni päivä -sanasto kehityksellisestä näkökulmasta. Teoksessa A. Pajunen, & M. Honko (toim.), Suomen kielen hallinta ja sen kehitys : peruskoululaiset ja nuoret aikuiset (s. 61–107). Suomalaisen Kirjallisuuden Seura. Suomalaisen Kirjallisuuden Seuran toimituksia, 1472. https://oa.finlit.fi/site/books/e/10.21435/skst.1472
Pellicer-Sánchez, Ana & Schmitt, Norbert 2012: Scoring Yes–No vocabulary tests: Reaction time vs. nonword approaches. Language Testing, 29(4), s. 489–509. https://doi.org/10.1177/0265532212438053
Tervola, Maija 2019: Maahanmuuttajalääkärien suomen kielen taito ja kielitaitotarpeet. Erityisalan kielitaidon näkökulma lääkärin työhön. Tampereen yliopiston väitöskirjat 92. Tampereen yliopisto.
Julkaisut
Sivua päivitetään sitä mukaa, kun uusia julkaisuja julkaistaan.
Honko, M. & Tervola, M. (2023). ”Opiskelen joka päivä, vaikka on raskasta.” Monikielisten korkeakouluopiskelijoiden kuvauksia suomenkielisissä tutkinto-ohjelmissa opiskelusta. Teoksessa N. Hynninen, I. Herneaho, J. Isosävi, E. Sippola & M. Yang (toim.), Kieli ja osallisuus. AFinLAn vuosikirja 2023 (Suomen soveltavan kielitieteen yhdistyksen julkaisuja 80). (s. 107–137). Jyväskylä: Suomen soveltavan kielitieteen yhdistys AFinLA. https://journal.fi/afinlavk/article/view/127096
Tervola, M. & Honko, M. (2023). Monikielisten korkeakouluopiskelijoiden kokemuksia pärjäämisestä suomenkielisessä tutkintokoulutuksessa. Yliopistopedagogiikka 2/2023. https://lehti.yliopistopedagogiikka.fi/2023/12/22/monikielisten-korkeakouluopiskelijoiden-kokemuksia-parjaamisesta-suomenkielisessa-tutkintokoulutuksessa