KKLT0040 Korpuksia ja kieliteknologiaa (5 op)
Arviointiasteikko:
0-5
Kuvaus
Kurssilla tutustutaan valmiisiin kielentutkimuksen tarpeisiin koottuihin korpusaineistoihin sekä aineistojen koostamisen perusperiaatteisiin. Lisäksi opitaan menetelmiä, joilla laajoja digitaalisia aineistoja voidaan analysoida. Tarkastelussa on sekä perinteisiä korpuslingvistiikan menetelmiä että uusia mahdollisuuksia, joita kieliteknologian kehitys on laajojen kieliaineistojen analyysille tuonut. Esimerkiksi perehdytään kieliteknologian perussovelluksiin, kuten automaattiseen syntaktiseen analyysiin ja sanojen merkityksen mallintamiseen, sekä koneoppimismenetelmiin, joilla eri tekstien ominaispiirteitä voidaan tarkastella. Näitä ovat esimerkiksi automaattinen tekstinluokittelu ja mielipiteiden louhinta. Aineistoina käytetään eri kielisiä ja eri konteksteissa tuotettuja tekstejä, kuten verkkokeskusteluja, oppijoiden tekstejä ja tekstejä eri aikakausilta.
Osaamistavoitteet
Kurssin suoritettuaan opiskelijat tuntevat valmiita korpusaineistoja eri aloilta, ymmärtävät aineiston koostamisen merkityksen kielentutkimuksessa ja osaavat välttää yleisimmät digitaalisen aineiston kokoamisen sudenkuopat. Lisäksi opiskelijat osaavat käyttää valmiita korpusohjelmia, kuten Antconc ja Wordsmith, tuntevat kieliteknologian perussovellukset ja niiden toimintaperiaatteet sekä ymmärtävät koneoppimismenetelmien mahdollisuudet kielentutkimukselle.
Lisätietoja
Kurssi sopii kieliasiantuntijuuden, kääntämisen sekä kielen oppimisen ja opettamisen tutkinto-ohjelmien opiskelijoille, jotka ovat kiinnostuneita korpusaineistojen käytöstä ja kvantitatiivisista menetelmistä. Lisäksi kurssi toimii kieliteknologian kokonaisuuden ensimmäisenä kurssina. Kurssin voi sisällyttää myös monien kieliaineiden aineopintoihin.
Esitietojen kuvaus
Etukäteistietoja ohjelmoinnista ei vaadita.