Benvinguts

Resum

L'objectiu de MOLTO és desenvolupar un conjunt d'eines per a la traducció de textos entre diversos idiomes en temps real i alta qualitat. Les llengües són mòduls separats dintre de l'eina i es poden variar. Es construiran prototips per a cobrir la major part de les 23 llengües oficials de la UE.

Com a tècnica principal, MOLTO utilitza gramàtiques semàntiques de domini específic i interlingues basades en ontologies. Aquests components s'implementen en GF (Grammatical Framework), un formalisme de gramàtiques on es relacionen diversos idiomes a través d'una sintaxi abstracta comú. El GF s'ha aplicat en diversos dominis de mida petita i mitjana, típicament per tractar fins a un total de deu idiomes, però MOLTO ampliarà això en termes de productivitat i aplicabilitat.

Part de l'ampliació es dedicarà a augmentar la mida dels dominis i el nombre d'idiomes. Una part important és fer la tecnologia accessible per als experts del domini sense experiència amb GFs i reduir al mínim l'esforç necessari per a la construcció d'un traductor. Idealment, això es pot fer només estenent un lexicó i escrivint un conjunt de frases d'exemple.

Les parts amb investigació més intensiva de MOLTO són la interoperabilitat en els dos sentits entre estàndards d'ontologies (OWL) i les gramàtiques GF, i l'extensió de les traduccions basades en regles amb mètodes estadístics. L'interoperabilitat OWL-GF permetrà la interacció multilingüe basada en llenguatge natural amb coneixement vàlid per a les màquines. Els mètodes estadístics afegiran robustesa al sistema. Es desenvoluparan nous mètodes per a combinar les gramàtiques GF amb la traducció estadística en benefici de tots dos.

La tecnologia de MOLTO serà lliurada com a llibreries de codi obert que podran ser connectades a les eines de traducció estàndard i pàgines web i, per tant, podran ser integrades en els fluxos de treball estàndard. Es crearan demos web i s'aplicarà a tres estudis de cas: exercicis de matemàtiques en 15 idiomes, dades de patents en almenys 3 idiomes, i descripcions d'objectes de museus en 15 idiomes.

Els idiomes de MOLTO

La traducció a MOLTO es basa en GF i la seva gramàtica, que actualment cobreix els idiomes mostrats en el diagrama de baix. Les eines de MOLTO permetran l'especialització, tant de la sintaxi abstracta com de fragments amb usos idiomàtics en els nous dominis d'aplicació.

Llocs

Segueix-nos

Per a seguir-nos, subscriu-te a MOLTO RSS Feed o llegeix el nostre Twitter feed. Ocasionalment es retransmet vídeo en directe dels esdeveniments de MOLTO. Ens podeu veure a Ustream i també a YouTube.

Contacta'ns

Fes-nos saber què penses a través del formulari de contacte de MOLTO.