Suomenkielinen uutisdokumenttien suodatus - vaatimukset ja menetelmät (profiiliperustainen vs. treenausperustainen) (KJ)
Relevanssipalaute - negatiivisen relevanssipalautteen vaikutus tuloksellisuuteen(KJ)
Sessioiden simulointi ja tuloksellisuus - tarkastellaan simuloitujen sessioiden (ja niiden sis. hakujen) tuloksellisuutta ja sen vaihtelua eri tilanteissa (KJ)
Tekstin tiivistäminen - dokumenttiperusteinen ja kyselyperusteinen tiivistys (KJ)
Ontologiapohjainen tiedonhaku lääketieteessä - testikokoelmaan ja ontologiahakukoneeseen perustuva tutkimus (KJ)
Ranskankielen morfologia ja dokumenttien indeksointi – ongelmat, vaatimukset, tietokannan pystyttäminen ja testikyselyjen suunnittelu (CLEF-aineistot) (vastaavasti italian-, espanjan-, hollannin-, venäjän- tai kreikankielien morfologiasta). (JK)
Verbien merkitys hakuavaimina. Testaus suomen-, ruotsin- ja /tai englanninkielisellä kokoelmalla (muutkin kielet mahdollisia – voi tehdä myös vertailun kielten välillä). (JK)
Kyselyn pituuden ja hakuavainten toiston vaikutus hakutuloksiin. Toteutetaan TREC-kokoelmaa ja esim. kahta eri hakujärjestelmää käyttäen. (JK)
Kyselyn rakenteisuuden vaikutus hakutuloksiin kielimalleja käyttävässä hakujärjestelmässä. (JK)
Klassisen probabilistisen ja kielimalleihin perustuvan hakujärjestelmän vertailu. Toteutetaan LEMUR-ympäristössä suomen- ja/tai englanninkielisellä testikokoelmalla. (JK)
Kyselyjen laajentamisen vaikutus eri hakujärjestelmissä, kuten kielimallit ja klassinen probabilistinen malli. Toteutetaan LEMUR-ympäristössä suomen- ja/tai englanninkielisellä testikokoelmalla. (JK)
Lakitekstien haku suomeksi ja ruotsiksi (Finlex). Vastintekstien indeksointi ja haku. Joko käytäjä- tai järjestelmäsuuntautunut tutkimus. (JK)