Yliopistologo

Ekon.mag Turid Hedlundin informaatiotutkimuksen alaan kuuluva väitöskirja

Dictionary-Based Cross-Language Information Retrieval: Principles, System Design and Evaluation (Sanakirjaperusteinen kieltenvälinen tiedonhaku: periatteet, systeemin suunnittelu ja evaluointi)

tarkastetaan 8.11.2003 klo 12 Tampereen yliopiston Pinnin auditoriossa B1096, Kanslerinrinne 1, Tampere.

Vastaväittäjänä on Fil.dr Jussi Karlgren (Swedish Institute of Computer Science, Tukholma). Kustoksena toimii professori Kalervo Järvelin.

***

Turid Hedlund on suorittanut kauppatieteiden maisterin tutkinnon Svenska handelshögskolanissa.

Hedlundin väitöskirja ilmestyy sarjassa Acta Universitatis Tamperensis; 962, Tampereen yliopisto, Tampere 2003. ISBN 951-44-5789-7, ISSN 1455-1616. Ilmestyy myös sähköisenä sarjassa Acta Electronica Universitatis Tamperensis; 288, Tampereen yliopisto 2003.
ISBN 951-44-5790-0, ISSN 1456-954X, http://acta.uta.fi.

Väitöskirjan tilausosoite: Verkkokirjakauppa Granum, http://granum.uta.fi, tai Tampereen yliopiston julkaisujen myynti, PL 617, 33101 Tampere, puh. (03) 215 6055, e-mail: taju@uta.fi.

Lisätietoja: Turid Hedlund, turid.hedlund@shh.fi

LEHDISTÖTIEDOTE

Tänä päivänä Internet on tuonut ulottuvillemme hyvin laajan ja nopeasti kasvavan joukon erikielistä informaatiota. Useat meistä hallitsevat jotakin vierasta kieltä siinä laajuudessa että pystymme lukemaan ja omaksumaan vieraskielistä tekstiä, sen sijaan tiedohaku joka vaatii oikeiden käsitteiden hallitsemista vieraalla kielellä on selvästi vaikeampaa. Tämä väitöskirja käsittelee kieltenvälistä tekstitiedonhakua missä kysely suoritetaan eri kielellä kuin kohteena olevat dokumentit, eli haun lähtökieli on eri kuin kohdekielenä oleva dokumenttitietokanta.

Tiedonhaussa käytettävät ohjelmat on perinteisesti kehitetty vastaamaan englannin kielen tarpeita kun taas pienten kielten tarpeet esim. ruotsi ja muut skandinaaviset kielet ovat jääneet vähemmälle huomiolle. Eri kielet ovat kuitenkin ominaisuuksiltaan hyvin erilaiset ja väitöskirjan tutkimustuloksena todetaan että kielelliset aspektit on syytä huomioida erityisesti kun luodaan ja tutkitaan kieltenvälisen tiedonhaun periaatteita ja kehitetään kieltenvälisen tiedonhaun ohjelmia. Tutkimuksessa perehdytään erityisesti yhdyssanaongelmaan yhdyssanarikkaissa kielissä kuten ruotsi, suomi ja saksa sekä kehitellään menetelmiä niiden hallintaan kieltenvälisessä tiedonhaussa.

Tutkimuksen empiirisessä osassa kehitettiin kieltenvälisen tiedonhaun tarpeisiin automaattista sanakirjaperusteista kyselyn käännössysteemiä UTACLIR. Systeemin evaluoinnissa käytettiin hyvin laajaa, 80 kyselyä käsittävä setti kolmella kielellä (ruotsi, suomi ja saksa) ja systeemin koko toimintaa kuten myös sen osakomponenttien toimintaa testattiin englanninkieliseen dokumenttitietokantaan. Systeemiä on evaluoitu myös kansainvälisellä evaluointifoorumillä peräkkäisinä vuosina hyvin tuloksin.


[laskuri] käyntiä 24.10.2003 alkaen

Väitökset    Tampereen yliopiston kirjasto   Tampereen yliopisto