Gå till innehållet. Gå till navigation

Språkteknologi.se

Personliga verktyg
Du är här: Förstasidan Mer om olika teknik- och tillämpningsområden Skrivhjälpmedel Teckenbaserad språkkontroll

Skrivhjälpmedel

Dokumentåtgärder
Skrivhjälpmedel omfattar program, som kan erbjuda olika former av språklig hjälp, t.ex. ordbehandlingsprogram som kontrollerar stavning, avstavning, grammatik och stil.

Teckenbaserad språkkontroll


Det finns enkla språkkontrollprogram utan eller med ringa språklig kunskap vars granskning endast består av en analys av texten betraktad som en rad gra­fiska tecken. En sådan teckenbaserad språkkontroll är i stort sett begränsad till att granska text med avseende på användningen av skrivtecken, ord och fasta fraser. Eftersom mycket av det som kontrolleras berör stilis­tiska egenskaper brukar man hänvisa till dessa program som stilkontrollprogram (eng. style checker ). Det svenska programmet Skribent textkontroll från Nor­stedts ordbok är av denna typ.

Granskningen går till så att en uppsättning granskningsregler genomsöker texten efter problematiska teckenföljder. Varje granskningsregel består av ett sökuttryck, en beskrivning av problemet och eventuellt också ett eller flera kor­rektionsförslag. Om sökuttrycket matchar ett problem – en given teckenföljd i texten – presenteras det för användaren tillsammans med problembeskrivningen och korrektionsförslaget. Mönstermatchningstekniken fungerar ungefär som sökfunktionen i ett vanligt ordbehandlingsprogram.

Sökuttrycket kan innehålla stilistiskt markerade ordformer som det arkaiska hava eller fraseologiska problem som till skillnad mot . Det kan också innehålla beskrivningar av felaktigt använda skrivtecken, t.ex. genitiv­apostrof i svenskan ( Eva's ), vilket kan definieras formellt som ett apostroftecken före­gånget av ett godtyckligt tecken och följt av tecknet s samt mellanslag eller inter­punktions­tecken.

Olika operatorer och generiska symboler för godtyckliga tecken ger sök­ut­trycken en uttrycks­kraft som gör att de kan beskriva mer generella fenomen. T.ex. kan vissa generella fraseologiskt-grammatiska mönster beskrivas, dock på ett starkt begränsat och samtidigt svårkontrollerbart sätt vilket riskerar att ge upphov till många falska alarm. Ett program med enbart tecken­baserad gransk­ning skulle t.ex. kunna gissa sig till förekomsten av ett kongruensfel med hjälp av ordmönstret det -a -arna som matchar ogrammatiska fraser som det svarta korparna. Dessvärre skulle det också resultera i falska alarm som det ska varna .

För­utom att granska användningen av tecken, ord och fraser gör många program av denna typ även kvantitativa analyser av olika textegenskaper och presenterar resultatet för användaren, t.ex. medelvärden för ord- och meningslängd, andelen passivformer m.m. Likaså kan en texts läsbarhet beräknas på olika sätt huvudsakligen på basis av längden på ord och meningar.

Även om teckenbaserad mönstermatchning är en effektiv och bra metod för att detektera olika teckenföljder, krävs lingvistiskt baserade metoder för att göra en tillräckligt generell och säker grammatikkontroll. Ett system kan visserligen göras mer lingvistiskt genom att det utrustas med ett lexikon där ordens ordklas­ser kan slås upp. Detta räcker dock inte. Systemet kommer ändå att generera oacceptabelt många falska alarm p.g.a. morfologisk flerty­dig­het, dvs. att ett ord kan ta flera möjliga ordklasser. För att få en uppfattning om problemets vidd kan man fundera över hur många ord­klasser det vanliga ordet för kan ta. Först när ett system baseras på effektiva metoder för att avgöra vilken av flera möjliga ordklasser ett ord tar i den aktuella meningskontexten kan man tala om lingvis­tiskt baserad språkkontroll i verklig bemärkelse.

av Rickard DomeijSenast ändrad 2006-02-23 16:02

Driven av Plone, Open Source Content Management System

Denna webbplats följer följande standarder: