Sanoja on mahdollista yhdistää lukemattomilla tavoilla yhdyssanoiksi. Uusia yhdyssanoja syntyy kielenkäyttäjien keskuudessa jatkuvasti (suklaakakku, suklaapähkinäkakku, suklaabanaanikakku, pähkinäbanaanikakku...) On siis selvää, ettei mikään sanakirja voi sisältää kaikkia kielen potentiaalisia yhdyssanavariantteja.
Jollei yhdyssanoja pilkota indeksointivaiheessa osiinsa, yhdyssanojen loppuosat jäävät tiedonhaussa piiloon. Yhdyssanojen loppuosat ovat arvokkaita hakusanoja, usein koko yhdyssanan hyperonyymeja. Huom. yhdyssanojen pilkkominen on yleensä mahdollista vain silloin, kun indeksoinnissa sovelletaan lemmausta.
Esimerkki: halutaan tietoa sokereista -> sokeri, hedelmäsokeri, ruokosokeri,rypälesokeri... Kun yhdyssanat pilkotaan, indeksissä on
Tällöin haettaessa sanalla sokeri saadaan myös esim. dokumentti, jossa esiintyy sana hedelmäsokeri.
Yhdyssanat saattavat aiheuttaa ongelmia kieltenvälisessä tiedonhaussa. Asiaa käsitellään CLIR-jaksossa.
–
n