Sisältöön
Informaatiotutkimuksen ja interaktiivisen median laitos INFIM Informaatiotutkimuksen ja interaktiivisen median laitos Tampereen yliopisto

Manuaalisiin sääntöihin perustuva disabiguointi

Manuaalisesti tehdyissä säännöissä käytetään hyväksi sanojen kontekstia sekä mahdollista kieliopillista tietoa, esimerkiksi sanaluokkatietoa.

Jos meillä on esimerkiksi englanninkielinen sana file, manuaalisesti tehty disambiguointisääntö etsisi sen kontekstissa esiintyviä sanoja vaikkapa seuraavasti:

file (merkitys 1): jos kontekstissa esiintyy sanat computer, program, e-mail, document, web jne.
file (merkitys 2): jos kontekstissa esiintyy sanat cut, sharpen, knife, hammer jne.

Sanojen merkitysten manuaalinen disambiguointi oli käytössä noin 1980-luvun puoliväliin. Menetelmä toimi lähinnä pienissä koeympäristöissä, eikä sitä enää juuri käytetä. Syynä tähän on mahdottomuus rakentaa laajoissa tietokannoissa toimivia sääntöjä manuaalisesti. Esimerkiksi Small & Riegel (1982) kehittivät manuaalisia sääntöjä ja totesivat tutkimuksessaan, että throw-sanan disambiguointisäännöt olivat kuusi sivua pitkät, mutta niiden tulisi kunnolla toimiakseen olla kymmenen kertaa pidemmät.


Postiosoite: 33014 Tampereen yliopisto, Käyntiosoite: Kanslerinrinne 1, Pinni A, 4.-5. krs, puh. (03) 3551 6970 tai 3551 6034
Ylläpito: infim@uta.fi
Muutettu: 2.9.2009 13.39 Muokkaa