Skrivhjälpmedel
Teckenbaserad språkkontroll
Det finns enkla språkkontrollprogram utan eller med ringa språklig kunskap vars granskning endast består av en analys av texten betraktad som en rad grafiska tecken. En sådan teckenbaserad språkkontroll är i stort sett begränsad till att granska text med avseende på användningen av skrivtecken, ord och fasta fraser. Eftersom mycket av det som kontrolleras berör stilistiska egenskaper brukar man hänvisa till dessa program som stilkontrollprogram (eng. style checker ). Det svenska programmet Skribent textkontroll från Norstedts ordbok är av denna typ.
Granskningen går till så att en uppsättning granskningsregler genomsöker texten efter problematiska teckenföljder. Varje granskningsregel består av ett sökuttryck, en beskrivning av problemet och eventuellt också ett eller flera korrektionsförslag. Om sökuttrycket matchar ett problem – en given teckenföljd i texten – presenteras det för användaren tillsammans med problembeskrivningen och korrektionsförslaget. Mönstermatchningstekniken fungerar ungefär som sökfunktionen i ett vanligt ordbehandlingsprogram.
Sökuttrycket kan innehålla stilistiskt markerade ordformer som det arkaiska hava eller fraseologiska problem som till skillnad mot . Det kan också innehålla beskrivningar av felaktigt använda skrivtecken, t.ex. genitivapostrof i svenskan ( Eva's ), vilket kan definieras formellt som ett apostroftecken föregånget av ett godtyckligt tecken och följt av tecknet s samt mellanslag eller interpunktionstecken.
Olika operatorer och generiska symboler för godtyckliga tecken ger sökuttrycken en uttryckskraft som gör att de kan beskriva mer generella fenomen. T.ex. kan vissa generella fraseologiskt-grammatiska mönster beskrivas, dock på ett starkt begränsat och samtidigt svårkontrollerbart sätt vilket riskerar att ge upphov till många falska alarm. Ett program med enbart teckenbaserad granskning skulle t.ex. kunna gissa sig till förekomsten av ett kongruensfel med hjälp av ordmönstret det -a -arna som matchar ogrammatiska fraser som det svarta korparna. Dessvärre skulle det också resultera i falska alarm som det ska varna .
Förutom att granska användningen av tecken, ord och fraser gör många program av denna typ även kvantitativa analyser av olika textegenskaper och presenterar resultatet för användaren, t.ex. medelvärden för ord- och meningslängd, andelen passivformer m.m. Likaså kan en texts läsbarhet beräknas på olika sätt huvudsakligen på basis av längden på ord och meningar.
Även om teckenbaserad mönstermatchning är en effektiv och bra metod för att detektera olika teckenföljder, krävs lingvistiskt baserade metoder för att göra en tillräckligt generell och säker grammatikkontroll. Ett system kan visserligen göras mer lingvistiskt genom att det utrustas med ett lexikon där ordens ordklasser kan slås upp. Detta räcker dock inte. Systemet kommer ändå att generera oacceptabelt många falska alarm p.g.a. morfologisk flertydighet, dvs. att ett ord kan ta flera möjliga ordklasser. För att få en uppfattning om problemets vidd kan man fundera över hur många ordklasser det vanliga ordet för kan ta. Först när ett system baseras på effektiva metoder för att avgöra vilken av flera möjliga ordklasser ett ord tar i den aktuella meningskontexten kan man tala om lingvistiskt baserad språkkontroll i verklig bemärkelse.