Sisältöön
Informaatiotutkimuksen ja interaktiivisen median laitos INFIM Informaatiotutkimuksen ja interaktiivisen median laitos Tampereen yliopisto

Kielten morfologinen typologia

Kielten morfologinen typologia kehitettiin alunperin 1800-luvun Saksassa. Kielet jaettiin kolmeen ryhmään: isoloiviin, agglutinoiviin ja fuusioiviin. Myöhemmin tähän lisättiin neljäs ryhmä: polysynteettiset kielet, joihin kuuluvat lähinnä Pohjois-Amerikan intiaanikielet.

Isoloivan kielen sanat eivät taivu. Kielessä on siis vain vapaita morfeemeja, ei ollenkaan sidonnaisia. Sanojen väliset suhteet ilmenevät muilla keinoin (esim. sanajärjestyksen, sanapainon, äänen voimakkuuden tai rytmin avulla).

Agglunoivan kielen sanat taipuvat johdonmukaisesti. Kielessä on paljon sidonnaisia morfeemeja , jotka liitetään sanavartaloon kiinni. Morfofonologista vaihtelua ei ole (siis vartalo pysyy samana riippumatta mitä morfeemeja siihen liittyy). Samaa merkitystä vastaa johdonmukaisesti samanlainen pääte (siis esim. monikkoa aina sama tunnus). Suomikin mainitaan usein agglutinoivana kielenä, mutta suomessa on paljon vartalovaihtelua (käsi, kätenä, kättä, käden).

Fuusioivassa kielessä morfeemien rajat eivät ole selviä. Kielessä on vartalon sisäistä, merkitykseen vaikuttavaa äännevaihtelua, kuten germaanisten kielten vahvat verbit. Morfeemien segmentointi on vaikeaa tai mahdotonta. Samalla kieliopillisella merkityksellä voi olla useita ilmenemismuotoja.

Polysynteettisessä kielessä on hyvin runsaasti sidonnaisia morfeemeja ja niiden merkitys on runsaampi kuin tavanomaisen taivutuspäätteen. Sanan ja lauseen ero ei ole selvä: yhden sanan (välilyönnillä erotetun merkkijonon) merkitys voi vastata kokonaista lausetta.

Suurimmalla osalla maailman kielistä on piirteitä useammasta kuin yhdestä typologian ryhmästä. Esimerkiksi englannissa käytetään prepositioita kieliopillisten suhteiden osoittamiseen. Tämä muistuttaa isoloivien kielten toimintatapaa. Toisaalta englannin sanojen johtamis- ja taivutusperiaatteet ovat osaltaan agglunoivia, osaltaan fuusioivia.

Nykyinen morfologinen typologia perustuu perinteiseen typologiaan, mutta sen sijaan että yritettäisiin jakaa kielet eri tyyppeihin käytetään kahta riippumatonta muuttujaa: synteesin aste (index of synthesis, IS) ja fuusion aste (index of fusion, IF). Synteesin aste viittaa kielen affiksien määrään, siis morfeemien lukumäärään sanaa kohden. Tämä voidaan osoittaa asteikon avulla, jonka toisessa päässä on isoloiva kieli ja toisessa (poly)synteettinen kieli:

isoloiva <-----------------------------------------> synteettinen

Kaikille kielille voidaan osoittaa paikka tällä asteikolla. Kielet, joilla on heikko morfologia, sijoittuvat vasemmalle puolelle asteikkoa.

Fuusion aste ilmaisee morfien segmentoitavuutta. Agglunoivilla kielillä on matala fuusion aste ja fuusioivalla kielellä korkea. Fuusion aste voidaan osoittaa asteikon avulla:

agglunoiva <-----------------------------------------> fuusioiva

Kaikki kielet lukuunottamatta isoloivia kieliä sijoittuvat näiden kahden ääripään välille. Isoloivissa kielissä ei ole agglunoivia tai fuusioivia prosesseja.

Pirkola (2001) on kehittänyt kielitypologiaa tiedonhakua varten. Tarkoituksena on löytää kielistä eroja ja samanlaisuuksia. Kun jollekin kielelle löydetään tehokkaat käsittelykeinot, ne ovat todennäköisesti sovellettavissa toiselle samantapaiselle kielelle. Synteesin aste voidaan Pirkolan mukaan jakaa seuraavasti:

  • synteesin taivutusaste (inflectional index of synthesis, IIS): taivutusmorfeemien määrä jaettuna kaikkien sanojen määrällä (tekstinäytteessä)
  • synteesin johtamisaste (derivational index of synthesis, DIS): johdinmorfeemien (johtimien) määrä jaettuna kaikkien sanojen määrällä
  • synteesin yhdistämisaste (compound index of synthesis, CIS): yhdyssanojen osien määrä jaettuna kaikkien sanojen määrällä

Asteet tulee laskea paralleelien tekstikorpusten perusteella eli samoista tai verrannollisista erikielisistä teksteistä.

Esimerkki synteesin taivutusasteen (IIS) laskemisesta englannin- ja suomenkielisistä lauseista:

He was driving his car.
Hän ajoi autoansa.

Englanninkielinen lause sisältää viisi sanaa ja yhden taivutusmorfeemin (ing), joten IIS on 1/5. Suomenkielinen lause sisältää kolme sanaa ja kolme taivutusmorfeemia (imperfektin suffiksi i sanassa ajoi sekä suffiksit a ja nsa sanassa autoansa. IIS on siis 3/3.

Fuusion aste voidaan jakaa seuraavasti:

  • Fuusion taivutusaste (inflectional index of fusion, MorphIIF): taivutettujen fuusiosanojen määrä / kaikkien sanojen määrä
  • Fuusion johtamisaste (derivational index of fusion, MorphDIF): johdettujen fuusiosanojen määrä / kaikkien sanojen määrä
  • Fuusion yhdistämisaste (compound index of fusion, MorphCIF): fuusioyhdyssanojen määrä / kaikkien sanojen määrä

Postiosoite: 33014 Tampereen yliopisto, Käyntiosoite: Kanslerinrinne 1, Pinni A, 4.-5. krs, puh. (03) 3551 6970 tai 3551 6034
Ylläpito: infim@uta.fi
Muutettu: 1.9.2009 14.56 Muokkaa