Gå till innehållet. Gå till navigation

Språkteknologi.se

Personliga verktyg

Informationshantering

Dokumentåtgärder
Informationshantering omfattar informationssökning med hjälp av mänskligt språk, både lokalt i t.ex. ett register och på Internet. Hit räknas både problem som har att göra med hur frågor ställs, hur informationen lagras, hur sökning sker och hur svaren presenteras.

Flerspråkighet

De tekniker för informationssökning som tagits upp här är förment språkoberoende: de tar inte uttalat fasta på några speciella språkliga egenskaper hos texterna. I själva verket ligger det några ganska starka språkliga antaganden under: det förutsätts att ord är ganska oföränderliga och att enstaka ord går att finna ensamma i texterna. Detta stämmer i ganska stor utsträckning för många språk, främst bland dem engelska, men sämre för andra språk. Trots att svenska och engelska på många sätt är väldigt lika varandra märks redan här stora skillnader språken emellan: svenska böjer gärna ord i många former och sätter samman ord i sammansättningar där engelska har en fattig formlära och inte bygger sammansättningar i första taget.

Att skriva "veckomatsedel för skolor i Stockholm" i ett sökfönster ger en inte texten "Matsedel för Katarina norra skola vecka 48" om inte systemet vet någonting om formlära.

Så för att söksystem ska kunna fungera för svenska måste de ha kunskap svensk formlära för att kunna stycka sammansättningar vid behov och återföra böjda ord till sina grundformer.

Att söka på flera språk samtidigt

Ofta nog kan en läsare tänka sig läsa texter på något av flera språk. De flesta internetanvändare i Sverige läser lika gärna texter på svenska som på engelska, och många av dem kan tänka sig något ytterligare språk. Dagens system för informationsåtkomst stödjer inte flerspråkig eller korsspråklig sökning, men skulle väl kunna göra det. Det behövs ingen särskilt avancerad teknik för att klara av att översätta en sökfråga till flera språk: problemet är snarare att lista ut vilka det skulle vara i sådana fall!

av Jussi KarlgrenSenast ändrad 2005-11-16 02:50

Driven av Plone, Open Source Content Management System

Denna webbplats följer följande standarder: