Sisältöön
Informaatiotutkimuksen ja interaktiivisen median laitos INFIM Informaatiotutkimuksen ja interaktiivisen median laitos Tampereen yliopisto

Muita anaforien resoluutiomenetelmiä

Tilastollinen  korpusanalyysi

Dagan ja Itai (Dagan & Itai 1990) ovat kehittäneet korpukseen perustuvan resoluutiomenetelmän.Menetelmä perustuu korpuksessa havaittuihin yhteisesiintymämalleihin. Anaforat korvataan korrelaattiehdokkailla, jotka valitaan yhteisesiintymämallien perusteella.

Esimerkki:

They knew full well that the companies held tax money aside for collection later on the basis that the government said it was going to collect it.

Lauseessa esiintyy sana it kaksi kertaa: ensimmäinen viittaa verbin collect subjektiin ja toinen sen objektiin. Kolmesta korrelaattiehdokkaasta kerätään tilastotietoa: money, collection ja government. Seuraavassa taulukossa esitetään tilastolliset mallit, jotka saatiin korvaamalla anaforat korrelaattiehdokkailla:

subject-verb collection collect 0
subject-verb money collect 5
subject-verb        government      collect 198
verb-object collect collection 0
verb-object collect money 149
verb-object collect government       0

Siis government on yleisin korrelaatti ensimmäiselle anaforalle ja money jälkimmäiselle.

Koneoppimiseen perustuva analyysi

Connolly, Burger ja Day sovelsivat koneoppimista anaforien resoluutioon. He muunsivat resoluutio-ongelman erilliseksi luokitteluongelmaksi. (Connolly, Burger & Day 1994.)

Aone ja Bennet ovat kehittäneet automaattisesti harjoitettavan anafora-analyysisysteemin. He merkitsivät manuaalisesti anaforaviitteet sanomalehtiartikkeleista ja käyttivät niitä harjoitusesimerkkeinä. (Aone & Bennet 1996.)



Postiosoite: 33014 Tampereen yliopisto, Käyntiosoite: Kanslerinrinne 1, Pinni A, 4.-5. krs, puh. (03) 3551 6970 tai 3551 6034
Ylläpito: infim@uta.fi
Muutettu: 2.9.2009 16.24 Muokkaa