Turku NLP-tutkimusryhmässä on haettavana 1–2 tutkimusavustajan määräaikaista tehtävää.
Tehtävät sijoittuvat ajalle 1.12.2024–30.4.2025, ja ne voivat olla joko osa-aikaisia tai kokoaikaisia.
Turku NLP on monitieteinen tutkimusryhmä, joka yhdistää digitaalista kielentutkimusta, kieliteknologiaa ja koneoppimista. Kehitämme erityisesti suomenkielistä kieliteknologiaa hyödyntäen viimeisimpiä neuroverkkomenetelmiä. Osa hankkeista keskittyy näiden menetelmien kehittämiseen, osa taas soveltaa näitä teknologioita kielentutkimuksessa tai muissa ihmistieteissä, keskittyen erityisesti suuriin digitaalisiin kieliaineistoihin.
Tehtävät sijoittuvat kahteen Suomen Akatemian rahoittamaan hankkeeseen.
"Mechanisms of register variation in massively multilingual web-scale corpora” (Mecha) tarkastelee kielenkäyttöä digitaalisessa maailmassa massiivisen monikielisessä mittakaavassa neuroverkkomenetelmiä hyödyntäen. Päätavoitteena on ymmärtää, miten ja miksi rekisterit ja niiden ominaispiirteet vaihtelevat paitsi kielten myös maiden ja kulttuurien välillä. Mitkä mekanismit selittävät tätä vaihtelua? Hankkeen keskiössä ovat viimeisimmät koneoppimismenetelmät ja kielimallit sekä laajat, koneellisesti kootut ja monikieliset web-aineistot. Lopulta tavoitteenamme on, että hankkeessa kehitettyjä menetelmiä ja sen tuottamaa tietoa sovelletaan tuottamaan metadataa laajoihin internet-pohjaisiin kieliaineistoihin parantamaan näiden käytettävyyttä.
”Fin-Clariah” on kansallinen ihmistieteiden tutkimusinfrastruktuurikonsortio, jolla on jäseniä lähes kaikista Suomen yliopistoista. Meidän osuutemme Turku NLP:ssä kehittää tutkimusinfrastruktuuria hälyisen verkkoaineiston käytettävyyden parantamiseksi. Erityisesti keskitymme laajoista internet-aineistoista eristettyihin sosiaalisen median aineistoihin. Sovelletut aineistot ja menetelmät ovat suurilta osin samankaltaisia kuin Mecha-hankkeessa – tavoitteemme on hyödyntää Mechan ja aikaisempien tutkimushankkeidemme tuloksia paremman tutkimusinfrastruktuurin kehittämiseen ja internet-aineistojen käytettävyyden parantamiseen.
Tehtävänkuvaus
Profiilista ja hankkeesta riippuen tutkimusavustajan tehtävät keskittyvät suurien digitaalisten kieliaineistojen prosessointiin ja tarkasteluun eri näkökulmista.
Verkkorekisterihankkeessa tutkimusavustaja osallistuu rekistereiden mallinnukseen uusimpia kielimalleja ja monikielisiä aineistoja käyttäen. Tavoitteena on yhtäältä ymmärtää rekistereiden eroja ja samankaltaisuuksia eri kielillä, ja toisaalta saavuttaa mahdollisimman hyvät tulokset automaattisessa rekisterintunnistuksessa.
Fin-Clariah-hankkeessa tutkimusavustaja osallistuu suurten internet-pohjaisten aineistojen mallintamiseen ja sosiaalisen median kielenkäytön eristämiseen ja analysointiin.
Tehtävät tarjoavat erinomaisen mahdollisuuden päästä mukaan kehittämään menetelmiä suurten kieliaineistojen louhintaan ja hyödyntämään näitä menetelmiä ihmistieteissä. Hankkeemme ovat innovatiivisia ja tarjoavat uusia näkökulmia sekä kielentutkimukseen, kieliteknologiaan että muihin ihmistieteisiin.