Tekstitiedonhaku tietokannoista

Kalervo Järvelin

Department of Information Studies
University of Tampere
P.O.Box 607
FIN-33101 TAMPERE, Finland

Järvelin, Kalervo (1995). Tekstitiedonhaku tietokannoista [Text retrieval in databases]. Espoo, Finland: Suomen ATK-kustannus. (Asiantuntija-sarja: Tiedonhaku) 273 s.


Sisällysluettelo

Osa I Tiedonhaun ongelmia ja lähtökohtia

1 TIEDON HANKINTA, HAKU JA TIETOKANNAT
1.1 Kommunikaatio ja informaatio
Kommunikaatio -- Informaatio
1.2 Tiedon hankinta
1.3 Elektroniset dokumentit ja tietokannat
Elektroniset dokumentit -- Elektronisten dokumenttien esittäminen
Tietue -- tiedosto -- tietokanta -- Tiedonhallintajärjestelmät -- Kyselyt
1.4 Tietokantatyyppejä
Tietokantojen sisältötyypit -- Tietomallit
1.5 Tiedon tallennus- ja hakuprosessi
Tietokantojen tuotannon ja käytön osapuolet -- Tallennus- ja hakuprosessi -- Tiedonhakujärjestelmän rakenne ja toiminta

2 NÄKÖKULMIA TIEDONHAKUUN
2.1 Päämäärät ja perusongelmat
Tiedonhaun tutkimuksen päämäärät -- Perusongelmat -- Sopivan sisällön löytäminen
2.2 Tiedonhaun lähestymistapoja
Merkittäviä lähestymistapoja -- Tiedonhaun tutkimuksen koulukunnat
2.3 Tutkimus- ja kehitystyön keskeiset alueet
2.4 Tiedonhaun lähialat
Joukko-oppi -- Tietojenkäsittelytiede -- Kielitiede -- Tiedon käytön, tarpeiden ja hankinnan tutkimus -- Kognitiotiede -- Psykologia

3 RELEVANSSI JA EVALUOINTI
3.1 Relevanssin käsitteestä
Aihe- vs. käyttäjärelevanssi -- Relevanssin dynaamisuus ja tilannesidonnaisuus -- Relevanssin käsitteen soveltaminen evaluoinnissa
3.2 Tiedonhaun evaluointi
Evaluointitilanteen analysointi -- Evaluointiperusteiden ja -mittojen selvittäminen -- Analyysin suoritus ja päätöksenteko -- Tietokantojen evaluointikriteereistä -- Hakujärjestelmien evaluointikriteereistä -- Hakujen evaluointikriteereistä -- Saanti ja tarkkuus -- Saannin ja tarkkuuden suhde -- Hakutuloksen saanti-tarkkuus -käyrä -- Yksittäisen haun saanti-tarkkuus -käyrä -- Muut hakutuloksen evaluointikriteerit
3.3 Hakujen ja tietokantojen evaluoinnin menetelmistä
Haun vuorovaikutuksen kriteerien mittaaminen -- Tarkkuuden evaluointi -- Saannin evaluointi -- Viiveen evaluointi -- Katteen evaluointi
3.4 Hakujen epäonnistumisen syitä

4 TALLENNUKSEN JA HAUN TASOPERIAATE
4.1 Käsitetaso
4.2 Ilmaisutaso
4.3 Esiintymätaso

Osa II Tiedonhaun välineet

5 TIEDONHAUN LAITE- JA OHJELMISTOTEKNIIKKAA

6 TIETOKANTOJEN RAKENNE
6.1 Tiedonhaun tietokantatyyppejä
Faktakannat -- Tekstikannat -- Ohjelmistokannat -- Kuvakannat -- Hypermediakannat -- Viitekannat -- Hakemistokannat
6.2 Tietueet
Tietueen rakenne -- Tietueen sisällön ja rakenteen suunnitelu -- Rakenteinen viitetietue -- Tekstitietue -- Dokumenttien rakenteen esittäminen: SGML -- Esimerkki SGML-määrittelystä -- Rakennetiedon käyttö tiedonhaussa ja -hallinnassa
6.3 Kaksi tiedostorakennetta
Peräkkäisrakenne -- Käänteisrakenne -- Sanakirjatiedosto käänteistiedoston hakemistona
6.4 Hakemistojen muodostaminen tiedonhakujärjestelmissä
Perus- ja lisähakemistot -- Kenttätunnisteet -- Sana- ja fraasi-indeksointi -- Hakuavainten esiintymiä koskevat tiedot
6.5 Käänteistiedoston toimintaperiaate haussa
6.6 Käänteistiedoston ja sanakirjan päivitys

7 TÄSMÄYTYSMENETELMÄT
7.1 Joukko-oppi
Joukko ja alkio -- Lauselogiikka -- Predikaattilogiikka -- Joukkoon sisältyminen -- Yhdiste, leikkaus ja erotus -- Joukko-opin ja lauselogiikan lausekkeiden muunnelmat -- Joukko-opin ja lauselogiikan yhteys tiedonhakuun -- Joukko-opin yhteys käänteistiedoston käyttöön
7.2 Vektorimalli dokumenttien kuvailussa ja haussa
Dokumenttivektori -- Dokumentti-sana -matriisi -- Kyselyn esitys -- Dokumentin ja kyselyn samanlaisuus vektoriesityksessä -- Kahden dokumentin samanlaisuus vektorimallissa -- Dokumenttiryhmän keskusalkio -- Dokumentti-dokumentti-samankaltaisuus -matriisi -- Hierarkkinen ryvästetty tietokanta ja haku -- Relevanssipalaute
7.3 Quorum-haku
7.4 Nimikirjoitustiedostot

Osa III Tiedonhaku käsitetasolla

8 HAKUHAASTATTELUSTA TIETOKANNAN VALINTAAN
8.1 Hakuhaastattelu - tiedontarpeen kartoittaminen
8.2 Suorahakupäätös
8.3 Tietokannan ja hakupalvelun valinta

9 HAKUAIHEEN KÄSITEANALYYSI
9.1 Hakuaiheen käsitteiden suhdetyypit ja aspektit
9.2 Hakusuunnitelman tyhjentävyys, tarkkuus ja kattavuus
9.3 Käsitteiden tunnistaminen
9.4 Käsitteiden ideointi
Aiheen osittaminen -- Assosiaatioiden ideointi -- Hierarkkisten suhteiden ideointi
9.5 Käsitteiden lisääminen ja poistaminen hakusuunnitelmassa
Rajaavan käsitteen lisääminen -- Rajaavan käsitteen poistaminen -- Rinnakkaisen käsitteen lisääminen
9.6 Käsitteiden implisiittiset suhteet
9.7 Hakuaiheen analyysin ja dokumenttien talletuksen yhteydet
9.8 Havaintoja hakuaiheen analyysin riittävyydestä

10 HAKUSTRATEGIAT
10.1 Pikahaku
10.2 Lohkohaku
10.3 Helmenkasvatushaku
10.4 Lohkojen peräkkäishaku
10.5 Selailuhaku

Osa IV Tiedonhaku ilmaisutasolla

11 LUONNOLLISEN KIELEN ONGELMISTA JA KÄSITTELYSTÄ TIEDONHAUSSA
11.1 Luonnollisen kielen yleisistä ongelmista
11.2 Suomen kielen erityisongelmia
11.3 Luonnollisen kielen käsittelystä

12 HAKUAVAINTEN VALINTA
12.1 Hakuavainten lähteet
12.2 Hakuavainten valinnan muistilista
12.3 Indeksitermien käyttö
12.4 Luonnollisten hakusanojen käyttö
12.5 Haku henkilöiden nimillä
12.6 Haku taajaan esiintyvillä hakuavaimilla

Osa V Tiedonhaku esiintymätasolla

13 KÄYTTÖLIITTYMÄ
13.1 Kyselykieli
Hakukomennot -- Tulostuskomennot ja -kaaviot -- Käyttäjän opastus ja muita komentoja -- Komentojen yhdistely ja lyhennys -- Kyselykielten eroja
13.2 Merkkijonokaaviot
Merkin korvaus -- Merkkijonon korvaus -- Merkkijonokaavioiden käyttö
13.3 Läheisyysoperaatiot ja sanaliittojen hakeminen
Läheisyysoperaatioiden käyttö ja vaikutus
13.4 Sanaliittojen käsittely tallennuksessa ja haussa
Fraasi-indeksointi -- Fraasien käyttö haussa
13.5 Sanakirjatiedoston ja suorakäyttötesauruksen selailu
Sanakirjatiedoston selailu -- Tesauruksen suorakäyttö
13.6 Painojen käyttö
13.7 Merkkijonohaku perustiedoston dokumenteissa
13.8 Hakualueen rajoitus
13.9 ZOOM- ja RANK-funktiot : tiedon jalostaminen

14 KYSELYN TOTEUTUS
14.1 Kyselyn muotoilu
14.2 Kyselyn suoritus
Yhteyden luonti -- Kyselyn syöttäminen ja suoritus -- Tietokannan valinta -- Hakujoukkojen muodostaminen -- Hakujoukon tutkiminen ja kyselyn muokkaus -- Välitulostukset ja lopputulostus -- Haun talletus ja toisto muissa tiedostoissa
14.3 Hakutaktiikka
Kyselyn kaventaminen -- Kyselyn laajentaminen
14.4 Yksilölliset tyylit kyselyjen kehittelyssä

Osa VI Tiedonhakijat ja hakutekniikan kehitys

15 HAKUTEKNIIKAN KEHITYS JA TIEDONHAKIJAT
15.1 Hypermedia ja rakenteiset dokumentit
Haku, silmäily ja navigointi -- Hypermedia tiedonhaun välineenä -- Sopeutuvat rakenteiset hyperdokumentit
15.2 Tiedonhaku tietoverkoissa
15.3 Välittäjäjärjestelmät ja agentit
Välittäjäjärjestelmät -- Agentit: elektronisten dokumenttien suodatus
15.4 Tiedonhakijat huomionkohteena

TIEDONHAUN KIRJALLISUUTTA
HAKEMISTO


Return to Kal's home page.
Return to Kal's publication list.
Paluu Kallen kotisivulle.
Paluu Kallen julkaisuluetteloon.