Sisältöön
Informaatiotutkimuksen ja interaktiivisen median laitos INFIM Informaatiotutkimuksen ja interaktiivisen median laitos Tampereen yliopisto

Anaforan automaattinen resoluutio

Anaforan automaattisessa resoluutiossa anaforan korrelaatti tunnistetaan automaattsiesti. Erilaisia menetelmiä tähän on useita:

  • syntaktiseen analyysin perustuvat menetelmät
  • semanttiseen analyysiin perustuvat menetelmät
  • diskurssin analysiin perustuvat menetelmät

Eri menetelmissä voidaan hyödyntää muun muassa sitä, että henkilöön viitataan eri pronominilla kuin muihin olioihin (hän/se, he,she/it). Samoin korrelaatin suku, sukupuoli ja luku määräävät, mitä pronominia käytetään.

Automaattisen korrelaatin etsimisen voi kaavamaisesti sanoa muodostuvan kahdesta vaiheesta: ensin haetaan kaikki mahdolliset korrelaattivaihtoehdot ja sen jälkeen valitaan oikea tai todennäköisin korrelaatti.

Oikean korrelaatin valinnassa vaaditaan usein päättelyä, johon vaadittu tietämys voi olla runsasta ja tulla usealta kielen tasolta. Anafora on morfologisen, syntaktisen, semanttisen ja pragmaattisen tason käsite. Sataprosenttiseen anaforan tulkintaan vaaditaan kaikkia tasoja, mutta yhden tasonkin menetelmillä voidaan päästä kohtalaisiin tuloksiin.


Postiosoite: 33014 Tampereen yliopisto, Käyntiosoite: Kanslerinrinne 1, Pinni A, 4.-5. krs, puh. (03) 3551 6970 tai 3551 6034
Ylläpito: infim@uta.fi
Muutettu: 2.9.2009 16.02 Muokkaa