Gå till innehållet. Gå till navigation

Språkteknologi.se

Personliga verktyg

Talteknologi

Dokumentåtgärder
Talteknologi handlar om att datorn läser upp en text eller förstår talat språk vid t.ex. diktering eller mänskliga kommandon.

Forskning


Forskning om talsyntes

Forskningen om talsyntes är relativt väl utvecklad och har lång tradition på bl.a. Kungliga tekniska högskolan i Stockholm, där professor Gunnar Fant etablerade sig som en världsklassforskare inom området. Ett spinoffresultat av KTH:s forskning har varit företaget Infovox med en talsyntesprodukt som för närvarande levereras av Telia Promotor till världsmarknaden. Däremot är forskning på andra talteknologiområden, till exempel taligenkänning, relativt ung i Sverige. Det finns dock ett märkbart ökande intresse på alla områden.

Bland forskningsfrågorna inom talteknologi har automatisk taligenkänning alltid varit en stor utmaning. Uttalet av ett och samma ord varierar nämligen beroende på var och i vilken mening ordet kommer. Om man betänker att en och samma talare dessutom kan uttala ett ord på olika sätt beroende på situation och sammanhang, förstår man vilka enorma svårigheter som föreligger för personoberoende taligenkänning. Det är därför nödvändigt för de flesta taligenkänningsprogram att gå igenom en träningsperiod, antingen under utvecklingstiden i form av statistisk träning med enorma talkorpusar, eller för individuella användare i början av användningen.

Taligenkänningssvårigheten beror i viss mån på språkets fonologiska struktur. Taligenkänning för japanska är till exempel något lättare därför att konsonanter, med ett undantag, "n", alltid följs av vokaler. Eftersom vokaler har mycket stabilare ljudegenskaper, har de alltid mycket högre igenkänningprecision. Kinesiska och liknande språk, å andra sidan, är svårare för taligenkänning eftersom även variation av tonen måste beaktas.


Forskning om talförståelse

Ett annat forskningsområde som dragit till sig mycket intresse är talförståelse. Det innefattar integration av talteknik och teknologi för förståelse av naturligt språk och innebär förenklat att man kan prata med datorer. Jämfört med taligenkänning är det viktigare för talförståelsen att datorn förstår vad man menar med uttalandet än att den kan känna igen alla ord som uttalas. Semantiska grammatiker är därför mycket användbara för talförståelse.

Man kan säga att naven för svensk taltekniksforskning är Centrum för Talteknologi (CTT), en relativ ny institution vid KTH, samt Telia Research, som bl.a. arbetar med talöversättning. Det pågår också forskning om svensk taligenkänning på Telia Promotor och om talinformationssökning på SICS.

Uundervisning och någon form av forskning relaterad till talteknik finns i dag på flera universitet och högskolor i Sverige.

av Mohammad SanamradSenast ändrad 2006-03-07 15:35

Driven av Plone, Open Source Content Management System

Denna webbplats följer följande standarder: