Monikielisyyden lisääntyessä (esim. Internet, digitaalisen tekstimateriaalin määrän yleinen kasvu) on käynyt tarpeelliseksi kehittää tiedonhakua, jossa kysely ja dokumentit ovat erikielisiä. Kieltenvälisestä tiedonhausta on kyse silloin, kun tiedonhakija esittää kyselyn eri kielellä kuin millä hakujärjestelmässä olevat dokumentit on kirjoitettu. Esimerkiksi suomi-englanti -CLIR-järjestelmässä järjestelmä antaa palautteena suomenkieliseen kyselyyn englanninkielisiä dokumentteja.
Kyselyn kieltä nimitetään lähtökieleksi (source language) ja dokumenttien kieltä/kieliä kohdekieleksi/kohdekieliksi (target language).
CLIR:ssä yhdistyvät erilaiset kielelliset menetelmät, kuten
sanakirjat, morfologinen käsittely, WSD jne., yksikieliseen
tiedonhakuun.
Kieltenvälinen tiedonhaku on melko tuore tutkimusala. CLIR-track on
ollut TRECissä (Text Retrieval Conference) mukana vuodesta 1997.
Kieltenvälisen tiedonhaun Workshop CLEF (Cross Language Evaluation
Forum) on kokoontunut vuosittain v. 2000 lähtien.
Kaksikielinen tiedonhaku tarkoittaa tilannetta, jossa kaikki dokumentit on kirjoitettu samalla kielellä, joka siis eroaa lähtökielestä. Kaksikielinen tiedonhaku auttaa henkilöä, jolla on passiivinen kielitaito: hän ei ehkä osaa muotoilla kyselyä vieraalla kielellä, mutta kykenee kyllä ymmärtämään saamansa vastausdokumentit. Tiedonhakua helpottaa, kun kyselyn saa tehdä äidinkielellään.
Monikielisessä tiedonhaussa on useita kohdekieliä. Monikielisestä tiedonhausta on hyötyä henkilölle, joka osaa lukea useita kieliä ja hakee tietoa useilla kohdekielillä: hänen ei tarvitse muotoilla kyselyä kaikilla kielillä erikseen.
Monikielinen tiedonhaku soveltuu myös kuvatietokantoihin, joissa kuvatekstit voivat olla peräisin erikielisistä lähteistä.
Erikielisen kyselyn ja dokumentin täsmäyttämisessä on erilaisia vaihtoehtoja (Oard, D. W. & Diekema A. R. 1998).