Kieliteknologian opiskelijana pääsee usein selittämään muille, mitä oppiaineen mystinen nimi oikeastaan pitääkään sisällään.
Katsotaanpa sanakirjamääritelmää. "Kieliteknologiaa ovat ne tekniset välineet ja menetelmät, joilla ihmisen tuottamaa kieltä — puhetta tai kirjoitusta — voidaan jäsentää tietokoneella käsiteltävään muotoon." Kompaktia ja akateemista.
"Ai teillä opiskellaan eri ohjelmointikieliä?"
Noh, miksei niitäkin. Keskeisempää on silti tavoite saada tietokone ymmärtämään ja tuottamaan luonnollista kieltä. Siis ei vain tulostamaan ruudulle lauseita tai toistamaan äänitiedostoja, vaan rakentamaan niitä itse.
Jos siis puhuvat autot ovat pian arkipäivää, on se kieliteknologian ansiota. Puhuvat selaimet taas ovat jo täällä: tuleva Opera 8.0 tottelee suullisia komentoja ja osaa lukea sivuja ääneen. Opera 8.0:n beeta-testaajien mukaan selaimen puheentunnistus toimii mainiosti, mutta ei vielä mahdollista kuin yksinkertaisimmat toiminnot.
Puhekäyttöliittymät eroavat radikaalisti vallitsevista käyttöliittymistä. Voi mennä aikaa, ennen kuin niihin totutaan ja ne lyövät itsensä läpi. Nykyään joku saattaa jo käyttää kännykkänsä äänikomentoja luontevasti ja tosissaan — teknologian oltua markkinoilla sellaiset seitsemän vuotta. Niin, ja ääniselaimia on kyllä ollut jo vuodesta 2001.
Edes hakujätti Google — kieliteknologinen sovellus sekin — ei vielä ole aivan täydellinen: esimerkiksi hakusanalla kieliteknologia löytyvät ainoastaan sivut, joissa kyseinen merkkijono esiintyy täsmälleen. Sanan taivutetut muodot jäävät haun ulkopuolelle ja hakutulos joissain tapauksissa torsoksi. Tämä on ongelma lähinnä suomen kaltaisilla kielillä, joissa sanat taipuvat paljon. Hakukoneen tulisi osata taivuttaa kieltä pystyäkseen antamaan halutun, kattavan tuloksen.
Kieli onkin loputtomassa monimutkaisuudessaan valtava haaste. Kieli on niin sidoksissa ajatteluun, että tietokoneista olisi ensin saatava älykkäitä, jotta ne voisivat todella ymmärtää ja tuottaa luonnollista kieltä. Toisaalta kielellinen ajattelu on tuntemamme kaltaisen älykkyyden edellytys. Tästä umpikujasta pääsee ulos vain rakentamalla tietokoneelle kapasiteetti kielen oppimiseen. Erilaisilla neuroverkkomalleilla on saatu varsin lupaavia tuloksia, mutta lopullinen tavoite siintää yhä varsin kaukana.
Kotimaisista kieliteknologiayrityksistä nimekkäimmät lienevät 24 miljoonaa hakua rikkoneesta MOT-sanakirjasta tunnettu Kielikone ja mm. kielen jäsennykseen erikoistunut Connexor. Henkilökohtainen suosikkini on kuitenkin puheteknologiayritys Bitlipsin puhuva panda.
Kieliteknologiasta voi lukea lisää vaikkapa Wikipediasta tai kieliteknologian dokumentaatiokeskus FiLT:sta.
Linkkejä:
Julkaisujärjestelmä: Drupal | Tietoa Assemblix.netistä
Toi banda on ihana mussukka
Anonyymi | 21.4.2008
Toi banda on ihana mussukka
Panda
petri hietala (ei varmistettu) | 9.10.2008
Panda nielaisee loput niin, ettei viimeinen kirjain kuulu.