Om Projekt FredrikaVÅRA MÅLGODA SEDERWIKIPEDIAMÖTENTILLBAKABLICKFINLANDUKRAINAHELSINGFORSRASEBORGÅLANDNAGUINGÅIDROTTFÖRFATTAREBIRGER CARLSTEDTÖVRIGT

»Finlandssvenska tekniker» är en samling böcker utgivna av TFiF och TFiF närstående personer. I denna blogginlaga frågar vi oss hur de bäst bevaras för eftervärlden (genom någon form av digitalisering), hur de lämpligen avbildas på Wikipedia och annan öppen data, på svenska och andra språk. Och konkret hur det här kunde se ut som ett sommarjobbsprojekt 2022, så att TFiF:s styrelse kan besluta om det.

Jag har blivit ombedd av TFiFs verksamhetsledare Annika Nylander att kort berätta om vad det här innebär, för TFiF:s styrelsemöte i början av februari 2022. Jag är själv TFiF-medlem, diplomingenjör från Otnäs 1988. Började som fysiker, utexaminerades från produktionsekonomi och studerade mest informationsteknik. Jag var med i TFiF:s styrelse just efter att jag utexaminerats, men fick inte mycket till stånd då. Nu hoppas jag kunna bidra mera.

Projekt Fredrika och Affärstidningen Forum

Orsaken att Annika frågat just mig är dels Projekt Fredrika, dels Affärstidningen Forum. För några år sedan sparkade jag igång Projekt Fredrika, med missionen att förbättra hur det svenska Finland avspeglas på Wikipedia. I Forum hann jag skriva 130 månatliga spalter från 2008 till 2021, och nu håller vi på att balsamera de här tidningarna och publicera dem på forummag.fi. “Vi” betyder gamla chefredaktörerna, gamla redaktionerna och gamla ägarna, men framför allt jobbar jag i det sammanhanget ihop med Robert Silén, också TFiF-medlem och anställd inom Projekt Fredrika.

Definition av “Finlandssvenska tekniker”

Men det är Finlandssvenska tekniker det ska handla om. Finlandssvenska tekniker, vad är det? Det finns flera svar på den frågan. 

För det första är det åtta böcker, de tre första utgivna av Jonatan Reuter 1923-25, de fem senaste av TFiF:en på 2000-talet. 

Finlandssvenska tekniker - det sjätte bandet

För det andra är det 89 personer, 89 män och 0 kvinnor, beskrivna i dessa åtta böcker. Det rör sig förresten om ganska så historiska personer, de 32 personerna i de tre första böckerna är födda 1823-76, de 57 personerna i de fem följande böckerna är födda 1840-1928. 

Artikel på Wikipedia med lista på Finlandssvenska tekniker

För det tredje är det en kategori på Wikipedia, med 54 artiklar. Hela 35 artiklar saknas alltså tillsvidare. Kategorin är skapt av Robert Silén 2020.

För det fjärde är det en lista på Wikipedia, en samlingsartikel som beskriver de åtta böckerna och de 89 personerna. Den är skriven av Robert Silén 2020. 

Alltså kort: Finlandsvenska tekniker är tillsvidare 89 personer i åtta böcker, tre gamla och fem från detta årtusende, av vilka 54 har artiklar på Wikipedia på svenska, 46 på finska, 13 på engelska, 3 på tyska, 6 på franska och 6 på ryska.

Vad är problemet?

Då blir frågan: Vad är problemet? Det är definitivt inte i första hand att 35 saknar artiklar på svenska. Det är att artiklarna är ofullständiga, att de saknar källhänvisningar till böckerna och ofta saknas helt på andra språk. Och flyger man ännu högre upp i helikoptern, är det att det har gjorts en massa fint arbete, som inte får den synlighet det förtjänar. Heffe kläckte idén, och arbetet utfördes av honom, Henry Clay Ericsson, Johan Stén, Bengt Juselius, Svante Ernsten, John Holmström, Carl-Fredrik Geust, Harry Lindeberg och andra.

Hur få mer synlighet

Min uppfattning är att värdet i böckerna inte är ekonomiskt utan kulturellt. Alltså att värdet för TFiF och eftervärlden ligger i att dessa 89 män koms ihåg för vad de gjort, inte i att TFiF förtjänar pengar på böckerna. 

Nu är jag inte Heffe eller nån annan av skribenterna, men om jag hade varit det, tror jag också att jag hade tänkt så.

Frågan är då vad slutsatsen i så fall blir. Och det har jag ett svar på: Gör informationen tillgänglig på öppen data! Se till att Google vet allt om John Wickströms båtmotorer, om Gottfrid Strömberg, Tor Stubb, Eric Tigerstedt, Kurre Wikstedt, Wille Wahlforss, Totti Carlander-Reuterfelt. Se till att det finns pekare till dessa personers artiklar, då det handlar om båtmotorer och segelbåtsdesign, om ABB, om Nokia, om Wärtsilä, om turbiner och andra uppfinningar, om Finlands krigsskadestånd till Sovjetunionen, om arkitektonisk värdefulla byggnader. Personerna ska synas i de sammanhang de gjort sig kända.

Att göra det här kostar arbete

Det här sker inte av sig själv. Ingen lyfter på kattens svans, om inte katten gör det själv. Och katten är i det här fallet TFiF. Projekt Fredrika kan hjälpa TFiF.

Konkret arbete

Först borde Fredrika få materialet i böckerna inte bara i största allmänhet i digital form, utan i textform. Det bara måste gå att fixa ganska enkelt för de böcker som gjorts på det här årtusendet. 

För de tre första böckerna är det knepigare. De måste digitaliseras. Men digitalisering är ett lurvigt begrepp. För att tekniskt sett nå till samma läge som med de fem följande böckerna krävs det två arbetsfaser, inskanning och maskinläsning

Bokvagga

Inskanningen sker bäst med en bokvagga för att inte söndra böckerna, och det finns företag i Finland och utomlands som utför denna tjänst, som förvandlar bokens sidor till bilder med hög upplösning, 300-400 dpi alltså 12-15 punkter per millimeter. 

Maskinläsningen förvandlar bilderna till text och kallas också OCR, Optical Character Recognition. Transkribus heter det bästa programmet, men textkonversionen sker ändå enligt principen »så gott det går» och böckerna måste alltså korrekturläsas även om korrekturläsningen delvis kan automatiseras.

Transcription

Transkribu klarar även av handskriven text

Slutsatsen för Finlandssvenska tekniker blir därför att man måste anpassa processen så att de 32 första personerna behandlas manuellt medan vi kan automatisera mer bland de 57 följande personerna.

Prioritering av arbetet

Nu har TFiF förstås begränsade resurser och vill förmodligen ha största möjliga utdelning för det arbete som ska göras, av sommarjobbare, av Projekt Fredrika och av utomstående tjänsteleverantörer. De 89 teknikerna är inte alla lika viktiga, lika intressanta, lika populära. Så vi måste ha någon logik enligt vilken vi fördelar resurserna bland de 89.

Med risk att låta som Christoffer Strandbergs imitation av Alexander Stubb vill jag säga att det finns tre startpunkter för hur man allokerar resurserna mellan de 89 personerna. För det första, ett, den nuvarande Wikipedia-artikelns kvalitet. För det andra, två, artikelns popularitet. För det tredje, tre, personens relevans

Vad kvaliteten beträffar är många artiklar erbarmligt korta. Lite kött på benen, kort text, inga bilder. Och så saknas de på många relevanta språk.

Arean beskriver relativa antalet läsningar på olika språk av Finlandssvenska tekniker under en fem års period.

Vad populariteten beträffar varierar den enormt. För populariteten finns det exakt statistik, i form av antal läsningar. Vi har tittat på de senaste fem åren. Gustaf Estlander är överlägsen etta på svenska, Eric Tigerstedt tvåa, Wille Wahlforss femma, Theodor Höijer sexa.

Men vi kom till en mycket oväntad insikt då vi kollade på lässtatistiken för finlandssvenska tekniker: svenska artiklar utgör under 12 % av alla läsningar under de senaste fem åren! Finska är 44 %, engelska är 29 %, ryska är 8 %, tyska och franska båda var sin 4 %. Andra språk kollade vi inte.

Rankingen är också väldigt språkberoende. På finska har vi Tigerstedt, Höijer, Nyström, Wahlforss och Strömberg. På engelska har Tigerstedt nästan lika många läsningar som alla tillsammans på svenska. Sedan kommer Savonius, Höijer, Nyström och Wahlforss. På ryska rankar Knut Stjernvall högt, via sin karriär i Ryssland. På tyska har Sigurd Savonius en fantastiskt bra artikel och står för nästan 90% av alla läsningar. På franska är ordningsföljden Tigerstedt-Savonius-Höijer-Nyström-Estlander, verkar förnuftig.

Vad relevansen beträffar talar vi om kloka människors omdöme. Vem tycker Heffe vi borde satsa på? Vem vill TFiFs styrelse lyfta upp?    

Förstås blir det också fråga om en avvägningsfråga mellan språken. Fredrikas omdöme säger att det är viktigast att först städa rent framför egen dörr. Fast det är under 12%, måste de svenska artiklarna bli bra först. Men att avdela noll uppmärksamhet till de andra språken är säkert heller inte klokt. Klokt är inte heller att se på olika språk som översättningar av varandra; det är fråga om anpassning av samma text för olika publik, där det svenska Finland är okänt för de flesta läsare på andra språk än svenska och finska, och kräver mer grundläggande förklaringar. 

Hur man städar rent framför egen dörr

Följande fråga blir då exakt hur man städar rent framför egen dörr. Här har Robert och jag en massa åsikter och idéer, som baserar sig på mångåriga erfarenheter från andra liknande initiativ inom Projekt Fredrika (till exempel om Helsingfors svenska skolor).

Här och nu kan vi inte komma med ett exakt förslag. Det skulle bero av hur mycket resurser det finns, och exakt i vilken form källorna finns just nu. Ingendera vet vi. 

Men vi ska ändå göra ett förslag. Förslaget baserar sig på att gemene Wikipedia-läsare klickar tre gånger vidare per Wikipedia-besök, varför länkningen mellan artiklarna är central, för att folk ska hitta – stövla över – »Finlandssvenska tekniker».

Finlandssvenska tekniker, femte bandet

För en sommarjobbares del tänker vi oss följande fyra steg.

1. Alla 54 svenska personartiklar ska få artikeln Finlandssvenska tekniker till referens. (Projekt Fredrika har bäddat för att göra detta lätt via kattåpejst). 

2. Per vecka bör minst två personartiklar på svenska förbättras. Detta enligt lässtatistik. Topp tre ur de tre första bckerna är Theodor Höijer, Gustaf Nyström och Gottfrid Strömberg. De måste få manuell uppmärksamhet. Läsa igenom deras texter, göra sammanfattningar. Börja här. På så sätt får vi idéer hur man kan automatisera processen för de fem följande, enklare volymerna.

3. För de förbättrade personartiklarna, lägg in minst tre länkar till och tre länkar från andra artiklar. Projekt Fredrika utvecklar som bäst verktyg för att föreslå nyckelord. Lågt hängande frukter är pekare från deras hemorter och gamla skolor. 

4. Beroende på språkkunskap, läggning och iver bör artiklarna på andra språk få uppmärksamhet. Bäst vore att förbättra direkt, men man kan också ta kontakt med tidigare artikelförfattare och berätta att det finns nytt basmaterial på svenska. Redan bara att utreda bristerna är bra. 

För Projekt Fredrikas del tänker vi oss följande hjälpbehov:

1. Koordinera inskanning och maskinläsning. Samordna med externa tjänsteproducenter.

2. Programutveckling för att stöda sommarjobbarens redaktörsarbete, delvis automatisera det, förklara det för Wikipedia-gemenskapen.

3. Rapportera resultatet för TFiF via en eller flera spalter i TFiF:s tidning.

4. Stöda TFiF:s verksamhetsledare och styrelse i frågor som gäller upphovsrätt och licenser tilll text och bilder. Till det här hör ju att Heffe och de andra ursprungliga författarna och redaktörerna måste höras. 

En paradoxal följd kan bli att intresset för de tryckta böckerna bara växer av att texten finns lätt tillgänglig, och av att projektet och personerna nämns i TFiFs tidning, i sociala medier och annanstans. Många vill ha badkarskompatibel litteratur, eller sängkompatibel, och vägrar läsa på skärmen. Det tycker jag är sympatiskt. Sån är jag själv.

Och jag unnar de finlandssvenska teknikerna att gå en strålande framtid till mötes.

Projekt Fredrika förbättrar täckningen av det svenska i Finland på Wikipedia, främst på svenska men också på andra språk. Läs om oss på Wikipedia (Projektsidan, Project page, Projektisivut, Projektseite, Page du projet, страница проекта, eller följ oss på Twitter, Facebook, Instagram, eller Youtube.