Historiens dolda texter

February 6, 2026

AI är inte så konstigt eller obekant. Ungefär i den ändan började Beáta Megyesi, professor i datorlingvistik i Stockholm, sitt föredragom hur hon och hennes forskargrupper nu gör stora framsteg med att dekryptera chifferskriften i de historiska böcker, brev och andra dokument som finns i bibliotek och arkivi Sverige och Europa.

Vi utnyttjar nästan alla AI, till exempel när vi googlar, använder språkkontrollen i Word eller översätter några rader med Googletranslate. Egentligen är AI en produkt av det kalla kriget. På 1950-talet ville amerikanerna kunna automatöversätta dokument på ryska. Forskning och utvecklingo m automatisk språkförståelse och översättning tog fart. Till en början byggde den på modeller som skulle kunna regler och mönster för grammatiska strukturer och slå upp ordbetydelser i digitaliserade lexikon. Men det gick långsamt. Först när man i stället grundade sig på rent statistiska modeller – vilka ord och fraser matchar varandra statistiskt sett i två språk? – tog utvecklingen riktig fart. Genombrotten skedde på 1990-talet då Internet gjorde det möjligt att samla jättemycket språkexempel. Och på 2010-talet kom dom väldiga nätverken med otroligt stora datamängder.

Till en början utvecklades språkprogrammen utifrån standardiserade texter som tryckta böcker och tidningar. Nästa utmaning blev att kunna behandla texter där variationen är mycket större – samma ord kan stavas och böjas lika från gång till gång. Det ledde Beáta till historiska texter. Men dom är ju hur många som helst, så Beáta har koncentrerat sig på krypterade texter. Dom erbjuder också stora intellektuella utmaningar.

Dechiffrering innebär i princip att man försöker frilägga mönster i de krypterade skrifterna. Sedan matchar man dessa mönster mot mönster i det eller dom språk som man tror har krypterats. Tack vare AI är det numera möjligt att köra sådana här matchningar i stor skala och ganska snabbt få goda resultat.

De enklaste chiffren är substitutionschiffer. Man låter helt enkelt ett tecken (en bokstav) stå för ett annat: alla a ersätts av d,alla b av e och så vidare. Sådana chiffer är ganska lätta att knäcka. Araberna utvecklade metoder för det redan på 800-talet. Mer komplicerade substitutionschiffer utvecklades i Europa på 1300-talet och framåt. Vatikanen hade en viktig roll. Påvens matematiker hittade till exempel på att dom vanligaste tecknen kunde ersättas med flera tecken. I stället för a skriver man b, n, 2 och 9, i stället för b e och z.

Vatikanen hör alltså till de organisationer som skrivit mycket på chiffer genom historien. Många Vatikanendokument som dekrypterats är dock rätt ointressanta, sa Beáta: ”vanligt Facebookskvaller om vem som dejtat vem”.

Varför skrev man med chiffer? Det kunde finnas mycket olika motiv. Beáta exemplifierade med en bok från 1730-talet, som hon varit med om att dechiffrera. Den hade ett komplicerat chiffer med omkring 100 olika symboler. Alla latinska bokstäver stod för ordmellanrum skulle det så småningom visa sig. Språket var tyska och boken var en slags handledning för en grupp bland frimurarna, ockulisterna, som stod för långtgående demokratiska ideal. Bokenvänder sig mot kyrkan och talar om rättigheten att avsätta kungar och diktatorer – den förebådar alltså franska revolutionens idéer. Därmed fanns  goda skäl att hålla innehållet hemligt.

Ett annat exempel var en fyrahundrasidig bok, troligen från 1630-talet och norra Tyskland, om sjukdomar och hur man botar dom. Varförskulle det hållas hemligt? Jo, var man läkedomskunnig på 1600-talet var risken stor att anklagas för häxeri, sa Beáta.

Men hon framhöll att själva innehållet i skrifterna inte var hennes forskningsområde. Hon är språkteknolog och knäcker koderna. Ska man sedan förstå innehållet ordentligt krävs ett samarbete med experter just på frimurare eller medicinhistoria, med historiker, arkeologer, idéhistoriker och andra. AI-experterna kan inte ensamma tolka texterna. Humanistisk forskning av olika slag har väldigt mycket att ge och är nödvändig för förståelse och sammanhang för alla slags texter. Det gäller både historiskt och i dag, slutade Beáta.

Sen blev det många frågor från dom lite mer än 25 mötesdeltagarna, om chiffernycklar, framtidens hemliga skrift, chiffer för språk som inte har alfabetisk skrift (kilskrift, kinesiska) eller hur man gör när det underliggande språket är odefinierbart och obeskrivet, t.ex. inskrifterna frånPåskön. Men det blir inga svar på dom frågorna här – det får räcka med enhänvisning till hemsidan för det stora projektet DESCRYPT som Beata nu leder <descrypt.org>.

 

Olle Josephson