Yliopistologo FL Jorma Laurikkalan tietojenkäsittelytieteiden alaan kuuluva väitöskirja

Knowledge Discovery for Female Urinary Incontinence Expert System(Tiedonlouhinta, asiantuntijajärjestelmät ja inkontinenssin diagnoosi)

tarkastetaan 26.10.2001 klo 12 Tampereen yliopiston Paavo Koli -salissa, Kanslerinrinne 1, Tampere.

Vastaväittäjänä on professori Heikki Mannila (Teknillinen korkeakoulu). Kustoksena toimii professori Martti Juhola.

***

Jorma Laurikkala on syntynyt 27.3.1971 Kuopiossa. Hän on suorittanut ylioppilastutkinnon Pielaveden lukiossa vuonna 1990. Hän on valmistunut filosofian lisensiaatiksi Kuopion yliopistosta vuonna 1997.

Laurikkalan väitöskirja ilmestyy sarjassa Tietojenkäsittelytieteiden laitos, Raportti A-2001-6 Tampereen yliopisto, Tampere 2001. ISBN 951-44-5156-2 , ISSN 1457-2060. Ilmestyy myös sähköisenä sarjassa Acta Electronica Universitatis Tamperensis; 137, Tampereen yliopisto 2001. ISBN 951-44-5193-7 , ISSN 1456-954X, http://acta.uta.fi.

Väitöskirjan tilausosoite: Verkkokirjakauppa Granum, http://granum.uta.fi, tai Tampereen yliopiston julkaisujen myynti, PL 617, 33101 Tampere, puh. (03) 215 6055, e-mail: taju@uta.fi.

Lisätietoja: Jorma Laurikkala, 050-345 0333 (koti), (03) 215 7564 (työ), jpl@cs.uta.fi

TIIVISTELMÄ

Asiantuntijajärjestelmät ovat tarkasti ongelma-alueelle rajattuja tietokoneohjelmia, joiden "älykäs" ihmisasiantuntijan päättelyä jäljittelevä toiminta perustuu ongelmaa koskevaan tietämykseen. Tietämyksen voidaan ajatella olevan informaatiota, jonka asiantuntija on oppinut koulutuksen ja kokemuksen kautta. Parhaimmillaan asiantuntijajärjestelmä suoriutuu annetusta ongelmasta yhtä hyvin kuin alan asiantuntija. Tällaiset ohjelmat eivät korvaa ihmisasiantuntijan päättelyä, kuten lääkärin diagnoosin tekoa, mutta hyvin toteutettuna ne tukevat ja tehostavat päätöksentekoa.

Asiantuntijajärjestelmät ovat osoittautuneet tehokkaiksi ongelmanratkaisijoiksi, mutta niiden toteutustekniikkaan liittyy ongelmia. Erityisen vaikeaa on asiantuntijan tietämyksen siirto asiantuntijajärjestelmään, joka perinteisesti toteutetaan siten, että tietämysinsinööri haastattelee asiantuntijaa selvittääkseen ongelmanratkaisussa tarvittavan tietämyksen. Haastattelu on usein hidasta ja kallista, koska asiantuntijat ovat kiireisiä eivätkä he aina osaa kuvata päättelyään sanallisesti. Useaa asiantuntijaa haastateltaessa ongelmia tuottavat henkilökohtaiset erot päättelyssä ja kyvyssä kuvata päättelyä.

Artikkelimuotoisessa väitöskirjassani tarkastellaan tietämyksen hankintaa tiedonlouhinnan avulla. Tiedonlouhinnalla tarkoitetaan vaiheittaista prosessia, jossa käytetään koneoppimis- tai tilastollisia menetelmiä tietämyksen automaattiseen hankkimiseen tietokannoista. Työni tietojenkäsittelytieteellisessä osuudessa kehitettiin tiedonlouhintamenetelmiä koneoppimiseen ja tiedon esikäsittelyyn. Käytännöllinen tavoite oli toteuttaa tiedonlouhinnan avulla asiantuntijajärjestelmä naisten virtsainkontinenssin (virtsan pidätysongelmat) diagnoosin tueksi.

Työni tuotti geneettisiä algoritmeja hyödyntävän koneoppimismenetelmän sekä menetelmän vinon luokkajakauman tasaamiseen. Geneettiset algoritmit ovat saaneet nimensä siitä, että niissä hyödynnetään evoluution ja genetiikan periaatteita. Laskenta etenee luonnon valintaa mallintavan valintaprosessin sekä eräänlaisten muunnosten ja risteymien kautta kohti tavoitetta. Geneettisissä algoritmeissa tietoa käsitellään hieman samankaltaisesti kuin todellisissa geeneissä, joissa informaatio säilyy ja periytyy jälkeläiselle. Geneettiset algoritmit osoittautuivat potilasaineiston automaattisessa luokittelussa yhtä hyviksi kuin tilastolliset monimuuttujamenetelmät ja päätöspuut.

Vino luokkajakauma vaikeuttaa tiedonlouhintamenetelmien soveltamista. Pieniä luokkia, esimerkiksi harvinaisia diagnooseja, on usein vaikeaa erottaa suurista luokista. Pyrin ratkaisemaan tämän ongelman menetelmällä, joka poistaa suurista luokista epätavallisia havaintoja ja toisaalta "siivoaa" pienten ja suurien luokkien rajoja, jotta pienten luokkien tunnistaminen helpottuisi. Menetelmäni luokkajakauman tasaamiseen oli parempi kuin vertailumenetelmät.

Tiedonlouhintamenetelmiä käytettiin diagnoosisääntöjen automaattiseen hankintaan potilasaineistosta. Tämän tietämyksen avulla toteutettiin virtsainkontinenssin diagnoosia tukeva asiantuntijajärjestelmä, jonka diagnoositarkkuus kahdessa testiaineistossa oli 94% ja 91%. Automaattisten diagnoosien sensitiivisyys oli 97% ja 96% ja spesifisyys 94% ja 90%. Suurien luokkien epätavallisista potilastapauksista muodostettiin poikkeussääntöjä, joiden tavoitteena on tunnistaa epätavallisia tai mahdollisesti väärin diagnosoituja potilaita.

Työni osoitti, että tiedonlouhinta on lupaava lähestymistapa asiantuntijajärjestelmien kehitykseen. Kehitys helpottuu huomattavasti, kun pitkälliset ihmisasiantuntijoiden haastattelut voidaan korvata automaattisella tietämyksen hankinnalla. Lisäksi tämä lähestymistapa on erinomainen, kun asiantuntijoita ei ole tai ongelma on liian vaikea perinteisesti mallinnettavaksi. Tiedonlouhinnalla löydetään joskus myös tietämystä, joka on täysin uutta sovellusalueen asiantuntijoille. Mikäli asiantuntija on saatavilla, on järkevää hyödyntää hänen asiantuntemustaan erityisesti tietämyksen laadun arvioinnissa. Asiantuntijaa ei siis pyritä sulkemaan pois tiedonlouhinnan avulla vaan hänen roolinsa muuttuu Tietämys hankitaan automaattisesti, mutta asiantuntijat arvioivat tietämyksen laatua ja käyttökelpoisuutta. Haittapuolina perinteiseen kehitystapaan verrattuna ovat syvällisen tietämyksen puute ja rajoittuneet selitykset päätelmille.

Tulevaisuuden tutkimuskohteita ovat muun muassa asiantuntijajärjestelmän jatkokehitys, geneettisten algoritmien sovellukset koneoppimisessa ja tiedonlouhintamenetelmien integrointi asiantuntijajärjestelmäkehittimiin.


Väitökset    Tampereen yliopiston kirjasto   Tampereen yliopisto