Alkula (2000) tutki yhtenä vaihtoehtona perusmuotoistamista suomenkielisessä tiedonhaussa Boolen hakuympäristössä. Vertauskohtana Alkulalla olivat muun muassa informaatikon antamat hakuvartalot (käytännössä siis merkkijonokatkaisu) sekä Lingsoftin ja Kielikoneen vartalo-ohjelmien antamat hakuvartalot. Alkulan testeissä parhaat tulokset saavutettiin perusmuotoisesta hakemistosta tehdyillä hauilla. Erityisen hyödylliseksi hakuympäristössä osoittautui yhdyssanojen osittaminen indeksiin (Alkulan tulokset tiiviisti.)
Kettunen, Kunttu ja Järvelin (2004) ovat tutkineet perusmuotoistamista, vartalohakua ja stemmausta suomenkielisessä tekstihaussa osittaistäsmäytysjärjestelmässä (InQuery). Tuloksien mukaan vartalohaut ja perusmuotohaut toimivat jokseenkin yhtä hyvin käytetyssä ympäristössä. Suomen kieleen huonommin soveltuva stemmaus toimi selvästi heikommin, mutta toisaalta käytetty stemmeri ei ollut optimaalinen.
Kettunen on tutkinut FCG-menetelmän toimivuutta useissa kielissä: suomessa, ruotsissa, englannissa, saksassa ja venäjässä (Kettunen & muut 2007; Kettunen 2008). Menetelmän on todettu parantavan huomattavasti tulosta verrattuna hakuun taivutusmuotoisilla hakusanoilla.
Popovic and Willet (1992) testastivat stemmauksen vaikutusta slovenian kielen tiedonhakuun. Tulokset ovat tilastollisesti merkittävästi parempia stemmatussa indeksissä kuin taivutusmuotoindeksissä.
Braschler ja Ripplinger (2004) tutkivat normalisoinnin ja yhdyssanojen pilkkomisen vaikutusta saksan indeksointiin ja hakuun. He vertasivat erilaisia stemmausmenetelmiä tosiinsa, mm. NISTin stemmeriä, Spider -stemmeriä ja lemmatointia. Verrokkina oli haku taivutusmuotoindeksistä taivutusmuotoisilla hakusanoilla. Kaikki normalisointimenetelmät antoivat taivutusmuotoindeksiä paremman tuloksen.
Hollink ja kumppanit (2004) vertasivat stemmattua hakua taivutusmuotoiseen hakuun monilla Euroopan kielillä. He havaitsivat tulosten olevan kieliriippuvaisia: stemmaus paransi tulosta eniten suomessa (30 %), muissa kielissä vähemmän.
Airio (2006) vertaili hakua kolmenlaisista indekseistä: taivutusmuotoindeksistä, stemmatusta indeksistä, perusmuotoindeksistä jossa yhdyssanoja ei ollut pilkottu ja perusmuotoindeksistä, jossa yhdyssanat oli pilkottu. Testattavat kielet olivat suomi, ruotsi ja saksa. Kaikki normalisoidut indeksit antoivat tilastollisesti merkittävästi paremman tuloksen kuin taivutusmuotoindeksi. Lemmatoitu indeksi, jossa yhdyssanat oli pilkottu, antoi parhaimman tuloksen kaikissa kielissä. Toisena oli stemmattu indeksi ja kolmantena lemmattu indeksi, jossa oli vain kokonaiset yhdyssanat.