Tiedonhaun kielelliset ongelmat johtuvat pääasiassa morfologisista ja /
tai leksikologisista ilmiöistä. Allaolevassa taulukossa on esitetty
eräitä yleisiä ongelmia.
|
Osajärjestelmä |
Ilmiö |
Esimerkki |
|
morfologia |
sanojen taipuminen |
käsi : käden : kättä |
|
morfologia / leksikologia |
johdokset |
opiskelija : opiskella |
|
morfologia / leksikologia |
yhdyssanat |
suklaakakku : suklaakermakakk |
|
leksikologia |
sanaliitot |
suomen kieli |
|
leksikologia |
sanojen rakenteelliset variantit |
puiden : puitten |
Morfologinen ja leksikologinen muuntelu tuo ongelmia tiedonhaulle, ja hakuavainten muuntelu on otettava jotenkin huomioon sekä hakemistoa (indeksiä) rakennettaessa että hakuavaimia annettaessa. Hakuavaimia annettaessa on tiedettävä, millainen indeksityyppi on kyseessä. Indeksiä rakennettaessa on voitu noudattaa jotain seuraavista periaatteista:
Stemmaus ja lemmatointi ovat molemmat normalisointimenetelmiä. Koska normalisoinnin tarkoituksena on vähentää taivutusmuotoja, niitä voidaan kutsua myös reduktiivisiksi menetelmiksi.