IHMJ2113 Sequence Analysis (3 cr)
Description
Nimensä mukaisesti sekvenssianalyysissa kiinnostuksen kohteena ovat sekvenssit, järjestetyt merkkijonot. Alun perin menetelmä on lähtöisin bioinformatiikasta, jossa sitä on käytetty mm. DNA-sekvenssien tutkimiseen. Nykyään menetelmää käytetään laajasti myös pitkittäisaineistojen tarkasteluun. Perinteisempään tapahtumahistoria- eli elinaika-analyysiin verrattuna sekvenssianalyysissa tarkastellaan kerralla tutkittavan koko tunnettua historiaa yksittäisten tapahtumien tai siirtymien sijaan. Sekvenssianalyysia voidaan käyttää tiedonlouhintaan ja aineiston rakenteen hahmottamiseen ja pelkistämiseen sekä tyypillisten ja epätyypillisten historioiden ryhmittelyyn.
Kurssilla käydään läpi sekvenssiaineistojen muodostamista, sekvenssien välisten etäisyyksien laskemista ja aineiston ryhmittelyä (klusterointia) sekä sekvenssiaineiston kuvaamisen monipuolisia tekniikoita. Kurssilla käytetään R-ohjelmiston TraMineR-pakettia, joten R:n alkeiden osaaminen on suositeltavaa.
Työskentely tapahtuu 2-3 hengen sekaryhmissä. Omat aineistot ovat toivottuja, mutta eivät välttämättömiä. Aineisto soveltuu sekvenssianalyysiin, jos sen voi esittää kategorisena (aika)sarjana. Tällainen on esimerkiksi sekvenssi, jossa peräkkäiset vuosittaiset tilat kertovat, onko henkilö kyseisellä ajanhetkellä ollut opiskelija, töissä, työtön tai työelämän ulkopuolella.
Learning outcomes
Opintojakson suoritettuaan opiskelijalla on kehittynyt näkemys kyseisen tutkimusmenetelmän mahdollisuuksista ja rajoituksista.
Additional information
Suoritustavat: Kurssi suoritetaan osallistumalla luennoille (12 h) ja palauttamalla ryhmätyö.