FL Henry Joutsijoen tietojenkäsittelyopin alaan kuuluva väitöskirja

Variations on a Theme: The Classification of Benthic Macroinvertebrates (Muunnelmia pohjaeläinten luokitteluun tietokoneella)

tarkastetaan 9.11.2012 klo 12 Tampereen yliopiston Pinni B-rakennuksen luentosalissa 1100, Kanslerinrinne 1, Tampere.

Vastaväittäjänä on professori Tommi Kärkkäinen (Jyväskylän yliopisto). Kustoksena toimii professori Martti Juhola.

                                                ***

Henry Joutsijoki on suorittanut filosofian lisensiaatin tutkinnon Tampereen yliopistossa.

Joutsijoen väitöskirja ilmestyy sarjassa Acta Universitatis Tamperensis; 1777, Tampere University Press, Tampere 2012. ISBN 978-951-44-8952-5, ISSN 1455-1616. Väitöskirja ilmestyy myös sähköisenä sarjassa Acta Electronica Universitatis Tamperensis; 1251, Tampere University Press 2012. ISBN 978-951-44-8953-2, ISSN 1456-954X.
http://acta.uta.fi.

Väitöskirjan tilausosoite: Verkkokirjakauppa Granum, http://granum.uta.fi, tai Tiedekirjakauppa TAJU, PL 617, 33014 Tampereen yliopisto, puh. 040 190 9800, e-mail: taju@uta.fi.

Lisätietoja: Henry Joutsijoki, Henry.Joutsijoki@uta.fi

LEHDISTÖTIEDOTE


Vain murto-osa maailman vesivarannoista on makeaa vettä. Jokapäiväisessä ympäristössämme olevat vesistöt, kuten joet, purot, lammet ja järvet ovat vain osajoukko makean veden kokonaismäärästä. Vesistöt kohtaavat nykyään enenevässä määrin erilaisia ympäristöpaineita muun muassa kemikaalipäästöjen muodossa. Tästä syystä vesistöjen tilojen tarkkailuun on viime vuosikymmenten aikana panostettu yhä enemmän. Vesistöjen tilojen seuranta voidaan suorittaa lyhyt- tai pitkäaikaisena. Lyhytaikaisessa seurannassa hyödynnetään usein kerättyjen vesinäytteiden kemiallista analyysia, kun taas pitkäaikaisten seurantojen yhteydessä käytetään apuna pohjaeläimiä, sillä ne reagoivat veden laadun muutoksiin hyvin ja niitä löytyy kaikista vesistöistä.   

Pohjaeläimet ovat pieniä selkärangattomia eläimiä, jotka ovat riippuvaisia vedenalaisesta alustastaan jossain vaiheessa niiden elinkaarta. Pohjaeläinten hyödyntäminen vesistön tilan seurannassa on monivaiheinen prosessi. Ensimmäiseksi vesistöstä kerätään lukuisia näytteitä, joista pohjaeläimet erotellaan ja säilötään yksitellen. Toiseksi biologi tai lajintunnistukseen erikoistunut taksonomisti määrittää näytteistä saatujen pohjaeläinten lajit tai yleisesti ottaen niiden taksonomiset ryhmät yksitellen. Näytteistä saatujen lajitietojen ja muun analysoinnin perusteella pystytään selvittämään vesistön tilan muuttuminen pitkältä aikaväliltä. Prosessin työläimpiä vaiheita on pohjaeläinten tunnistaminen, jonka automatisointi säästäisi huomattavasti resursseja.   

Väitöskirjassa keskitytään pohjaeläinten tunnistamiseen laskennallisin menetelmin, mikä on erittäin vähän tutkittu alue hahmontunnistuksen saralla. Pohjaeläinten laskennallinen tunnistaminen palautuu kuvien luokittelemiseen. Tutkimusaineistoina väitöskirjassa on käytetty kahta pohjaeläinkuva-aineistoa, joista ensimmäinen käsittää 1350 kuvaa yhteensä kahdeksasta taksonomisesta ryhmästä ja toinen kuvakokoelma pitää sisällään yli 4800 kuvaa yhteensä 50 pohjaeläinlajista. Väitöskirja koostuu viidestä artikkelista, joissa on sovellettu yhteensä 16:ta eri menetelmää pohjaeläinten tunnistamiseen. Käytetyistä menetelmistä 15 on kirjallisuudesta tuttuja ja väitöskirjassa esitetään yksi uusi luokittelumenetelmä. Erityinen painoarvo väitöskirjassa annetaan 1990-luvulla kehitetylle luokittelumenetelmälle nimeltään tukivektorikone.

Tukivektorikone on suunniteltu alun perin ainoastaan kahden luokan luokittelutehtäviin. Väitöskirjassa sovelletaan neljää tukivektorikoneelle kehitettyä moniluokkalaajennosta pohjaeläinluokitteluun ja kolmea näistä menetelmistä käytetään ensimmäistä kertaa pohjaeläinten luokittelussa. Lisäksi väitöskirjassa keskitytään tukivektorikoneen laajennuksissa esiintyviin teoreettisiin ongelmiin (tasapelitilanteet joissa uuden näytteen luokka ei ole yksikäsitteisesti määritetty ja luokkien jakamiseen optimaalisesti kahteen ryhmään) ja annetaan niihin uusia ratkaisumalleja. Käytettäessä tukivektorikonetta luokittelutehtävissä sen tehokkuus riippuu suuresti ns. kernel-funktion ja siihen liittyvien parametriarvojen valinnasta. Väitöskirjassa käytettiin seitsemää kirjallisuudesta entuudestaan tuttua kernel-funktiota ja suoritettiin laajat empiiriset tutkimukset sopivien parametriarvojen löytämiseksi. Näiden lisäksi useita erilaisia kuvista laskettuja piirrejoukkoja testattiin luokittelussa.

Väitöskirjassa saavutettujen tulosten perusteella tukivektorikone osoittautui erittäin hyväksi vaihtoehdoksi pohjaeläinten automaattiseen luokitteluun. Pienemmän aineiston kohdalla saavutettiin yli 97% luokittelutarkkuus ja suuremman aineiston kohdalla luokittelutarkkuus oli yli 80%.  Saatujen tutkimustulosten perusteella voidaan sanoa, että pohjaeläinten automaattinen tunnistaminen on mahdollista toteuttaa vähintään yleisimpien taksonomisten ryhmien tapauksessa. Lisäksi ratkaisumallit tukivektorikonetta koskeviin teoreettisiin ongelmiin osoittautuivat menestyksekkäiksi ja niitä voidaan hyödyntää käytettäessä tukivektorikonetta luokittelutehtävissä, joissa on enemmän kuin kaksi luokkaa.