Tervetuloa

Tiivistelmä

MOLTO-projektin tavoitteena on kehittää työkaluja erikielisten tekstien korkeatasoiseen kääntämiseen tosiaikaisesti. Eri kieliä käsitellään erillisinä moduuleina työkalun sisällä, ja näitä moduuleja voidan vaihdella. Projektin tavoitteena on luoda prototyypit suurimmalle osalle EU:n 23 virallisesta kielestä.

MOLTO on toteutettu aihealueen mukaisten semanttisten kielioppien ja ontologioihin perustuvien interlingua-välikielten avulla. Nämä osat on yhdistetty GF (Grammatical Framework) -kielioppiformalismilla, jossa eri kieliä yhdistää yhteinen abstrakti kielioppi. GF-kielioppeja on käytetty usean keskikokoisen aihealueen toteuttamiseen korkeintaan kymmenellä eri kielellä, mutta MOLTO-järjestelmää ollaan laajentamassa tuottavammaksi.

Osa tätä laajentamista on uusien aihealueiden ja kielten lisääminen. Tärkeämpi osa on tehdä saada työkalut aihealueen asiantuntijoiden ulottuville siten, että niiden käyttö ei edellytä GF-osaamista ja niin, että kielenkääntimen luominen on mahdollisimman vaivatonta. Parhaimmillaan kielenkääntimen luomisen onnistuu laajentamalla käytettävää sanastoa ja kirjoittamalla joukko esimerkkilauseita.

MOLTO-projektin eniten tutkimusta edellyttävät osat ovat ontologiastandardien (esimerkiksi OWL)ja GF-kielioppien välinen yhteinen toiminnallisuus sekä sääntöpohjaisen konekäännöksen yhdistäminen tilastollisiin menetelmiin. OWL- ja GF-toiminnallisuuksien yhdistäminen mahdollistaa monikielisen, luonnolliseen kielen ja koneluettavan tiedon kaksisuuntaisen yhteiskäytön. Tilastollisten menetelmien avulla järjestelmään voidaan haluttaessa lisätä robustiutta. GF-kielioppien ja tilastollisen kääntämisen yhdistämiseen kehitetään uusia menetelmiä, jolloin molempien parhaat puolet saadaan hyödynnettyä.

MOLTO-työkalut julkaistaan avoimen lähdekoodin kirjastoina, jotka voidaan liittää yleisiin käännöstyökaluihin ja web-sivuihin. MOLTO-työkaluja esitellään web-demoissa ja kolmessa eri käyttötapauksessa: matemaattisten tehtävien, patenttitekstien ja museoesineiden kuvausten käännöksissä.

MOLTO-kielet

MOLTO-käännös perustuu GF-formalismiin ja sen resurssikielioppien kirjastoon, joka tällä hetkellä kattaa alla olevan kuvan esittämät kielet. MOLTO-työkalujen avulla voidaan muokata sekä abstraktia kielioppia että sovellusalueen erikoissanontoja vastaamaan uusia käyttötapauksia.

Yhteistyökumppanit

Seuraa projektia

Voit tilata MOLTO RSS-syötteen tai lukea Twitter-tiliämme. Lähetämme ajoittain suoratoistovideota MOLTO-tapahtumista. Voit seurata tapahtumia Ustream-palvelussa ja YouTubessa.

Yhteydenotto

Kerro mielipiteesi MOLTO-yhteyslomakkeen avulla.