Gå till innehållet. Gå till navigation

Språkteknologi.se

Personliga verktyg

Språkinlärning

Dokumentåtgärder
Språkinlärning omfattar program för språkinlärning, dels de som hjälper svenskspråkiga att förbättra sin svenska, dels de som syftar till att lära ut främmande språk.

Var står vi?

Att förse CALL-system med intelligens innebär ett mycket omfattande arbete - vi talar här om arbetsinsatser som kräver personår och rentav persondecennier - som man kanske som programutvecklare känner att man har varken resurser eller kompetens att utföra. Av den anledningen är utvecklingen mot återanvändbara resurser inom t.ex. datalingvistiken av största praktiska betydelse för CALL-programutvecklingen, liksom den livliga forskningen inom området maskininlärning (alltså automatisk inlärning) av språklig kunskap av olika slag.

Detta är ju utvecklingar som pågår inom datalingvistiken utan minsta hänsyn till CALL-området, men som är gynnsamma även för detta område. Samtidigt kan man troligen inte rakt av använda datalingvistiska formalismer, grammatiker, etc., bland annat på grund av att man måste förvänta sig en annan sorts språk från språkinlärare än från modersmålstalare. Man måste nog räkna med att man kommer att möta större mängder icke-välformat språk än i vanliga datalingvistiska tillämpningar, och dessutom språk som är felaktigt på andra sätt än där, vilket rimligen får konsekvenser för hur programmen byggs upp. Vidare måste programmen integreras i det pedagogiska sammanhanget, vilket inte är en trivial uppgift; t.ex. behöver grammatiska analysprogram förmodligen förses med en annan sorts feedback.

Alla bedömare är överens om att man har lång väg kvar till den idealiska ICALL-tillämpningen. När det gäller språkanalys, så klarar man mer av skrift än av tal, men även när det gäller skrivet språk har man starka begränsningar på vad som kan hanteras med dagens system. Metoderna för språkgenerering är sedan i allmänhet ofullgångnare än de för analys, vilket förstås har betydelse för hur man kan hantera dialoger.

Ändå använder man dessa ofullständiga system med viss framgång, vilket beror på att man tar till diverse knep för att kringgå deras brister. Man kan t.ex. låta en interaktion handla om en s.k. mikrovärld, en konstruerad, begränsad scen som visas på bildskärmen, eller låta den röra sig inom en viss domän, som polisförhöret i Herr Kommissar . Man kan begränsa sig till att låta datorn 'förstå' användarens språk, men ge icke-språklig respons på det, t.ex. ändra en scen i enlighet med användarens instruktioner.

Vi kommer troligen att se mer av ”webben som korpus” i (I)CALL, dels för att dynamiskt tillhandahålla autentiskt språkmaterial för datadriven inlärning, dels förmodligen också i kombination med maskininlärning för att skapa lingvistiskt annoterade resurser som kan användas i ICALL-system. En användning av sådana material som vi säkert kommer att få se mer av är den där annoterade korpusar används som råmaterial för språkliga övningar, som tack vare korpusens storlek och variation kan täcka många olika övningstyper och nivåer utan att enskilda övningar behöver upprepas.

I kombinationen stora autentiska korpusmaterial och maskininlärning kan man se ett möjligt alternativ till grammatik- och parserbaserad ICALL. Kanske det är möjligt att använda en teknik liknande den som används i avancerad exempelbaserad maskinöversättning för att finna relevanta källspråksuttryck. Där använder man approximativ matchning, baserad på statistik och lingvistisk struktur för att i en länkad parallellkorpus (ett s.k. översättningsminne ) finna det källspråksuttryck som mest liknar det som man nu vill översätta (och har markerat på något sätt i den nuvarande källtexten), för att sedan returnera motsvarande målspråksuttryck.

En mer avancerad variant är att sätta ihop en bästa matchning av ett antal källspråksuttryck och ett översättningslexikon. Liknande tekniker kunde användas för att i en korpus finna det språkliga uttryck eller den kombination av språkliga uttryck som mest liknar det som en inlärare just har skrivit; låt oss kalla den tänkta applikationen skrivminne , i analogi med översättningsminne, som ju är basvarianten av exempelbaserad maskinöversättning. Semantisk matchning mot uttryck i autentisk text borde också vara möjlig med informationssökningstekniker som LSA (Latent Semantic Analysis), speciellt om dessa kombineras med lemmatisering och sammansättningsanalys.

av Lars BorinSenast ändrad 2006-01-18 14:36
Nyheter
Skype pratar franska och tyska 2015-06-25
VR söker forskningssekreterare med erfarenhet av datadriven forskning 2015-06-25
Flera svenska centrum i Swe-Clarin 2015-06-02
Doktorand- och postdoktjänster i Göteborg 2015-06-02
Lektor i språkteknologi sökes till Helsingfors universitet 2015-06-02
Fler nyheter
« December 2017 »
Ti On To Fr
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
 

Driven av Plone, Open Source Content Management System

Denna webbplats följer följande standarder: