Sisältöön
Informaatiotutkimuksen ja interaktiivisen median laitos INFIM Informaatiotutkimuksen ja interaktiivisen median laitos Tampereen yliopisto

Yksinkertainen resoluutioesimerkki tiedonhakua varten

Anaforien ja ellipsien resoluutio tiedonhakusovelluksessa voisi tapahtua seuraavasti. Kun dokumentissa esiintyy nimi Martti Ahtisaari, korvataan indeksissä kaikki merkkijonolla Aht alkavat sanat lausekkeella Martti Ahtisaari. Siis vain indeksin tietoja muutetaan, itse dokumentit säilyvät entisellään. 

Hän-pronomini viittaa useimmiten viimeksi mainittuun henkilönnimeen (merkkijonoon, joka alkaa isolla kirjaimella). Indeksissä korvataan siis sana hän tuolla henkilönnimellä. Tätä prosessia voisi vielä parantaa syntaktisella analyysillä: hän-pronomini viittaa useimmiten lauseen subjektiin.

Pirkola ja Järvelin (1996) ovat todenneet, että 10-prosenttinen ellipsien ja anaforien resoluutio on vaikeaa ellei mahdotonta. Edellämainitun kaltaiset yksinkertaiset menetelmät näyttävät kuitenkin toimivan esimerkiksi tiedonhakua ajatellen riittävän hyvin (Pirkola & Järvelin 1996).


Postiosoite: 33014 Tampereen yliopisto, Käyntiosoite: Kanslerinrinne 1, Pinni A, 4.-5. krs, puh. (03) 3551 6970 tai 3551 6034
Ylläpito: infim@uta.fi
Muutettu: 2.9.2009 16.34 Muokkaa