Gå till innehållet. Gå till navigation

Språkteknologi.se

Personliga verktyg
Du är här: Förstasidan Mer om olika teknik- och tillämpningsområden Maskinöversättning Automatisk översättning

Maskinöversättning

Dokumentåtgärder
Maskinöversättning omfattar översättning av texter från ett språk till ett annat, antingen i form av verktyg som hjälper mänskliga översättare, eller program som syftar till att åstadkomma av automatisk översättning. Vanligen ger ett sådant program en första grovöversättning som sedan kan förfinas.

Automatisk översättning

Med ett automatiskt översättningssystem menar vi ett datorsystem som från en originaltext levererar en översättning utan mänsklig inblandning. Det finns i dag ett stort antal tekniker som prövas för automatisk översättning. De vanligaste teknikerna är baserade på lexikon och regler, i olika omfattning.

Översättningen går till så att en mening som matas in till systemet analyseras i lexikala enheter och konstruktionsenheter. Den analysen tas till utgångspunkt för att skapa en översättning via systemets lexikon och regelbaser. Varje enhet i analysen kommer att bidra på något sätt till översättningen, i regel så att enheter i originalmening och översättning motsvarar varandra, dvs en enhet i originalet ger upphov till en enhet i översättningen. Undantag från detta förhållande inträffar endast när de lexikala enheterna introducerar konvergenser (flera ord blir ett) eller divergenser (ett ord blir flera), t.ex. trust ~ lita på ; remember ~ komma ihåg ; eller när regler introducerar eller eliminerar funktionsord (ex: do you like him? ~ tycker du om honom? ).

Man kan skilja mellan två användningsområden för automatiska översättningssystem. Det första är att producera översättningar som ska tryckas och distribueras på ungefär samma sätt som material som översätts manuellt idag. Då ställs också höga krav på språklig kvalitet vilket medför att översättningarna måste granskas och revideras. Det andra användningsområdet är att snabbt ta fram ”råöversättningar” som ger läsaren eller beställaren en ungefärlig uppfattning om innehållet i ett originaldokument. Här ställs inte alls samma krav på att den översatta texten ska hålla en viss språklig standard.

Den lexikon- och regelbaserade automatiska översättningen har betydande problem med flertydighet. Kontext kan användas för att komma över en del av flertydighetsproblemen, men systemen kan producera god text endast för texttyper av begränsad komplexitet. Ett praktexempel är väderleksrapporten; redan 1976 levererade forskningsgruppen TAUM systemet METEO till den kanadensiska väderlekstjänsten och detta program har sedan 1978 översatt väderleksrapporter mellan franska och engelska.

Att utveckla de lexikon och regelbaser som behövs för ett automatiskt system tar mycket tid och resurser. Därför har forskningen intresserat sig för metoder som tillåter utvecklarna att skapa lexikon utifrån befintliga översättningar. Därvid utnyttjas stora översättningsarkiv där meningar i originalet paras ihop med motsvarande meningar i översättningarna. Genom att jämföra fördelningen av ord på meningar i original respektive översättning med statistiska metoder kan man i betydande utsträckning identifiera ordöversättningar automatiskt. Man kan också beräkna sannolikheterna för att ett ord översätts med ett visst annat ord, eller för att översättningarna av två ord som står intill varandra också står intill varandra. Den typen av data kan även utnyttjas för själva översättningen. Detta brukar kallas statistisk maskinöversättning och är i dag ett mycket livaktigt forskningsområde.

av Lars Ahrenberg och Magnus MerkelSenast ändrad 2005-11-03 16:17

Driven av Plone, Open Source Content Management System

Denna webbplats följer följande standarder: