Hyppää pääsisältöön
Opintojakso, lukuvuosi 2024–2025
DATA.STAT.840

Statistical Methods for Text Data Analysis, 5 op

Tampereen yliopisto
Opetusperiodit
Aktiivinen periodissa 1 (1.8.2024–20.10.2024)
Aktiivinen periodissa 2 (21.10.2024–31.12.2024)
Koodi
DATA.STAT.840
Opetuskieli
englanti
Lukuvuodet
2024–2025, 2025–2026, 2026–2027
Opintojakson taso
Syventävät opinnot
Arvosteluasteikko
Yleinen asteikko, 0-5
Vastuuhenkilö
Vastuuopettaja:
Jaakko Peltonen
Vastuuorganisaatio
Informaatioteknologian ja viestinnän tiedekunta 100 %
Järjestävä organisaatio
Tietotekniikan opetus 100 %

This course teaches various statistical methods for modeling and analysing text data. Contents are planned to include models for representing text including vector space models and neural embedding models; document content processing stages such as lemmatization and keyphrase extraction; probabilistic models of content variation including n-grams and topic models; neural models of text; and methods for various text analysis tasks.

Osaamistavoitteet
Esitietovaatimukset
Oppimateriaalit
Studies that include this course
Suoritustapa 1
Exercise sets and exam must both be completed to pass the course
Kaikkien osuuksien suorittaminen on pakollista.

Tentti

01.12.2024 31.12.2024
Aktiivinen periodissa 2 (21.10.2024–31.12.2024)

Osallistuminen opetukseen

26.08.2024 08.12.2024
Aktiivinen periodissa 1 (1.8.2024–20.10.2024)
Aktiivinen periodissa 2 (21.10.2024–31.12.2024)