Projekt Fredrikan vuosi 2025 – ja katse vuoteen 2026
Käännös alkuperäisestä ruotsinkielisestä julkaisusta
Projekt Fredrikan ydinjoukko kokoontui joulupäivälliselle 8. joulukuuta 2025 Töölössä, Helsingissä. Hallituksen puheenjohtaja Kaj Arnö piti illan puheen siitä, mitä saavutimme vuonna 2025, mitä opimme ja mihin tähtäämme vuonna 2026.
Ennen kuin jaamme yhteenvedon Kajn puheesta, kerromme mitä Projekt Fredrika on:
Mikä on Projekt Fredrika?
Projekt Fredrikan tavoitteena on parantaa Wikipedian kattavuutta koskien Suomen ruotsalaisuutta, ruotsiksi, suomeksi ja muilla kielillä. Projekti toimii Wikipedia-projektisivujen kautta useilla kielillä sekä rekisteröidyn yhdistyksen Projekt Fredrika rf:n kautta. Lisätietoja suomeksi: fi:Wikipedia:Projekt_Fredrika, ja vielä tarkemmin ruotsiksi: sv:Wikipedia:Projekt_Fredrika.
Ja nyt Kajn puheeseen:
Mitä teimme vuonna 2025
Tämän vuoden työ voidaan jakaa rahoittajiemme mukaan: Svenska kulturfonden, Svenska litteratursällskapet i Finland ja Harry Schaumans stiftelse Pohjanmaalla.
1. Ruoki AI-lohikäärmettä
Saimme kaksi apurahaa Svenska kulturfondenilta. Ensimmäisen tehtävän nimi oli “Ruoki tekoälylohikäärmettä” (“Mata AI-draken”) – varmistaa, että ChatGPT, Claude, Gemini ja muut LLM:t tuntevat ruotsinkielisen Suomen mahdollisimman hyvin. LLM:t käyttävät Wikipediaa ja Wikidataa luotettavina “totuuden” lähteinä, tietona jonka yhteisö on tarkistanut.
“Ruoki AI-lohikäärmettä” oli yksinkertaisesti Wikipedian parantamista metodologialla, jossa käytämme tekoälyä ruokkimaan tekoälyä. Rakensimme työkaluja, jotka ehdottavat Wikipedia-muokkauksia valittujen lähteiden perusteella. Tämä seurasi Kajn esitystä syksyllä 2024.
Olemme olleet tarkkoja vastuun kantamisessa: emme päästä botteja Wikipediaan päivittämään itsenäisesti. Kyse on puoliautomatisoiduista työvaiheista, joissa lisäämme omaa tehokkuuttamme inhimillisinä wikipedisteinä.
Lisätietoja projektisivuilla Wikipedia:Projekt_Fredrika/Mata_AI-draken ja Wikipedia:Projekt_Fredrika/Yle.
2. Huumoriryhmä KAJ
Kun kiinnostus suomenruotsalaiseen huumoriryhmään KAJ räjähti helmikuussa 2025 (KAJn voitettua Melodifestivalenin ja tultua Ruotsin edustajaksi Euroviisuihin), näimme kultaisen tilaisuuden jakaa tietoa ruotsinkielisestä Suomesta kansainväliselle yleisölle. Melodifestivalenin aikana KAJn Wikipedia-artikkelien lukukerrat ruotsiksi ja suomeksi kolmisatakertaistuivat, ja Vöyrin artikkeli sai yhdeksänkymmentä kertaa enemmän katselukertoja.
Vuoden 2025 alussa KAJlla oli kaksi vaatimatonta Wikipedia-artikkelia, joissa oli paljon parantamisen varaa. Koordinoimme Vöyrin kunnan kanssa ja saimme rahoitusta Harry Schaumans stiftelseltä työhön.
Parannimme KAJn artikkelia, loimme ala-artikkeleita heidän teoksistaan (katso navigaatiolaatikko), lisäsimme kuvia ja ääntämisäänteitä (katso commons) ja parannimme liittyviä artikkeleita kuten Vöyri ja suomenruotsalainen musiikki (katso navigaatiolaatikko). Wikipedia-yhteisö loi yhteensä 30 kieliversiota KAJ-artikkelista ennen Eurovisioita – toivomme, että niistä tuli parempia merkittävästi parannetun sisällön ansiosta, jonka teimme saataville ruotsin-, suomen- ja englanninkielisissä versioissa.
Lisätietoja KAJ-blogissamme ja projektisivulla Wikipedia:Projekt_Fredrika/KAJ.
Kuvia KAJsta ennen Bara Bada Bastua on nyt saatavilla myös Wikimedia Commonsissa – käytettävissä kaikilla Wikipedia-kielillä.
Tilastot KAJ-artikkelien katselukerroista: ruotsi (sininen) ja suomi (punainen) nousivat pilviin Melodifestivalenin aikana, kun taas muut luotiin ja kasvoivat ennen Eurovisioita. Myös saksan (vihreä) katselukerrat kasvoivat Euroviisujen jälkeen.
Kaikki ruotsiksi luomamme KAJ-artikkelit navigaatiolaatikossa, jonka loimme niiden välillä navigointiin.
3. Suomen kirjailijat
Svenska litteratursällskapetin kanssa työskentelemme “paketeissa”, neljä vuodessa. Tänä vuonna kaikki koskivat kirjasarjaa Finlands författare (Suomen kirjailijat) – kolme nidettä yhteensä yli 6 600 kirjailijasta, jotka olivat aktiivisia 1809–1916, 1917–1944 ja 1945–1980 – julkaistu 1981, 1985 ja 1993.
Työssä oli kaksi vaihetta. Ensin valmistelimme skannatun materiaalin ja loimme Wikidata-rungon perinteisellä IT:llä (Python-skripteillä). Yli 4 200 kirjailijaa linkitettiin Wikidata-objekteihin – relevanteimmat kirjailijat riippumatta suomen tai ruotsin kielestä, syntymäpäivät ja useita rivejä sisältöä kirjassa.
Toinen vaihe koski kirjailijoiden Wikipedia-artikkelien päivittämistä tekstisisällöllä, ensisijaisesti ruotsiksi mutta myös suomeksi ja englanniksi. Priorisoimme Wikipedian lukutilastojen, kirjan pituuden ja suomenruotsalaisen relevanssin mukaan.
Lovable-työkalulla rakensimme työkalun, joka tekoälygeneroi parannusehdotuksia. Se hakee Wikipedia-artikkelin ja kirjan sisällön, ehdottaa lisäyksiä ja generoi parannetun artikkelin, jonka tarkistat ennen julkaisua.
Sivuhuomautuksena: Ruotsalainen startup Lovable on nopeimmin kasvava yritys koskaan – se on saavuttanut 100 miljoonan euron ARR:n lyhyimmässä ajassa koskaan.
Lisätietoja projektisivuilla Wikipedia:Projekt_Fredrika/SLS-Författare-1809, SLS-Författare-1917 ja SLS-Författare-1945, sekä koodi osoitteessa github.com/projekt-fredrika/sls-forfattare.
Esikäsittely Cursorissa tekoälygeneroidulla “perinteisellä IT:llä” Python-koodilla: muuntaa skannatun PDF:n etualalla strukturoiduksi dataksi taustalla.
Lovable-työkalu parannusehdotusten generointiin: nykyinen Wikipedia-artikkeli vasemmalla, lähde keskellä ja tekoälygeneroitu parannusehdotus oikealla.
4. SuRu ja Wikidata
Toinen apuraha Svenska kulturfondenilta oli erilainen: Wikidata-lekseemien parantaminen Stora finsk-svenska ordbookenilla (SuRu, Suuri suomi-ruotsi-sanakirja). Saimme idean siitä, että olimme aiemmin syöttäneet murresanoja Ordbok över Finlands svenska folkmålista (Suomen ruotsalaisten murteiden sanakirja) yhteistyössä Kotimaisten kielten keskuksen kanssa.
Koko sanakirjan heijastaminen Wikidatan lekseemirakenteeseen on valtava urakka – kirjassa on yli 100 000 hakusanaa. Valitsimme kaksi aluetta: yleisimmät hakusanat Google Analyticsin mukaan ja Suomi-spesifiset sanat, jotka on merkitty “Suom” sanakirjassa (esim. bergsråd/vuorineuvos). Vaikea ja mielenkiintoinen tehtävä monimutkaisine Wikidata-rakenteineen.
Lisätietoja projektisivulla Wikipedia:Projekt_Fredrika/Suru ja koodi osoitteessa github.com/projekt-fredrika/kotus-suru.
Sana jääkäri on merkitty SuRussa “hist Suom” sanan Suomi-spesifisen merkityksen vuoksi. Kuvakaappauksessa näkyy myös kehittämämme työkalu, joka näyttää SuRu-sanan vastaavan lekseemin Wikidatassa – mikä helpottaa käännösten linkittämistä Wikidatassa.
Suomenkielisen “jääkäri”-lekseemin koodi Wikidatassa on L1449014. Käännös on ruotsinkielisen “jägare”-lekseemin toinen merkitys, katso L51565#S2.
Python-skriptit, jotka loimme Cursorilla mukauttamaan SuRun XML-tiedostoja Wikidata-lekseemeiksi.
Mitä opimme vuonna 2025
1) Tekoäly tekee meistä tuottavia
Lovablen ja Cursorin kaltaisilla työkaluilla työprosessi on muuttunut täysin manuaalisesta osittain automatisoiduksi. Kun työkalut käyvät aina läpi samat vaiheet, tuloksesta tulee johdonmukaisempi ja luotettavampi. Oli aika, jolloin Robert tuli Kajn luo vaikeiden ohjelmointikysymysten kanssa – nyt hän selviytyy tekoälyn avulla.
2) Syvempi Wikidata-osaaminen
Käytimme Wikidataa runkona kirjailijapaketteissa, syötimme KAJn musikaalit ja kappaleet niin että ne ovat saatavilla useammilla kielillä, ja sovelsimme monimutkaisia rakenteita SuRun lekseemeille.
3) Opit MariaDB:ltä
Sekä Kaj että Robert työskentelevät MariaDB:lle, jossa opimme 1) tekoälyupotuksista, jotka mahdollistavat semanttisen haun ilman LLM:iä, ja 2) hackathoneista, joita voisi soveltaa suurten muokkausmaratonien tapaan Wikipediassa.
Asiat, joita emme täysin saavuttaneet
4) Lukiolaisista yliopistoyhteistyöhön
Työskentelemme menestyksekkäästi osa-aikaisten lukiolaisten kanssa, mutta haluamme laajentaa yliopisto-opiskelijoihin ja tutkijoihin. On potentiaalia verrata Wikipediaa akateemiseen tutkimukseen tai kieliversioiden välillä – esimerkiksi Kagaalia kuvataan eri tavoin ruotsiksi ja suomeksi. SLS:n 140-vuotisjuhlien aikana olimme yhteydessä Henrika Tandefeltiin, historian professoriin Helsingin yliopistossa.
Etualalla Projekt Fredrikan osa-aikaiset ja kesätyöntekijät (plus tilintarkastaja) joulupäivällisellä 2025.
5) KAJ ja paikalliset voimat
Projekti olisi voinut hyötyä enemmän paikallisesta avusta. Vöyriläiset kuljettivat saunan Euroviisuihin Sveitsiin, mutta emme onnistuneet luomaan toivomaamme Wikipedia-sitoutumista paikallisen tiedon ja valokuvauksen suhteen.
6) Lopetimme maailman pelastamisen Projekt Katerynalla
Pari vuotta sitten aloitimme Projekt Katerynan, joka tekisi Ukrainalle sen mitä Fredrika tekee ruotsinkieliselle Suomelle. Huolimatta paikallisesta kiinnostuksesta Ukrainassa ja omista ponnisteluistamme kiinnostuksen herättämiseksi lännessä, emme onnistuneet löytämään sopivaa rahoitusta läntisestä maailmasta. Uskomme, että vuoden 2008 sota Georgiassa ja vuosien 2014 ja 2022 sodat eivät olisi koskaan tapahtuneet ilman kaikkea tietämättömyyttä Ukrainasta ja Venäjän koloniaalisesta sorrosta – tietämättömyyttä, joka pitäisi korjata viimeistään nyt.
Katso Kajn esitys Lontoossa YouTubessa: Saving the World by feeding the AI Dragon with unbiased open data / Kaj Arnö @ SOOCon25 London. Projektin verkkosivusto elää edelleen osoitteessa projektkateryna.netlify.app.
Mitä haluamme tehdä vuonna 2026?
SLS: Biografiskt lexikon ja muuta
Suunnittelemme jatkavamme Biografiskt lexikon för Finlandilla (blf.fi) ainakin kahdessa paketissa. Haluamme myös pitää “muokkausjuhlia” useammista SLS:n kirjoista – ottaa kirjallisia tekstejä ja heijastaa niitä Wikipediaan. Tähtäämme muun muassa kirjoihin Westermarckista ja Suomenruotsalaiseen antifasismiin.
Svenska kulturfonden: Ruoki tekoälylohikäärmettä 2
Olemme hakeneet rahoitusta päivitetylle 2026-versiolle raportista “Ruotsinkielinen Suomi Wikipediassa” vuodelta 2020. Tekoälyllä voimme tehdä sen nopeammin ja kattavammin. Ja ennen kaikkea: haluamme tunnistaa aukot – mitkä osat ruotsinkielisestä Suomesta ovat huonosti katettuja?
Englanninkieliset artikkelit
Tekoäly harjoittelee vahvasti englanninkielisellä materiaalilla. Siksi suomenruotsalaisilla, jotka ovat tavalla tai toisella vaikuttaneet maailmanhistoriaan – Westermarck, Nordenskiöld, Alma Pihl – pitäisi olla kunnolliset englanninkieliset Wikipedia-artikkelit. Kyse on näkyvyydestä siellä, mistä tekoälymallit saavat tietonsa.
Kansalliskirjasto ja Forum
Forum för ekonomi och teknik on kultakaivos suomenruotsalaiselle taloushistorialle. Ja Kansalliskirjasto digitoi vanhoja sanomalehtiä. Molemmat nämä lähteet pitäisi sisällyttää avoimeen dataan.
Eteenpäin
Paljon on vielä tekemättä. Mutta vuosi 2025 on osoittanut, että tekoäly on voimakas liittolainen työssä ruotsinkielisen Suomen näkyväksi tekemiseksi verkossa. Niin kauan kuin on digitaalista materiaalia lähtökohtana, voimme aivan eri tavalla kuin ennen tuoda tietoa Wikipediaan ja Wikidataan.
Projekt Fredrika förbättrar täckningen av det svenska i Finland på Wikipedia, främst på svenska men också på andra språk. Läs om oss på Wikipedia (Projektsidan, Project page, Projektisivut, Projektseite, Page du projet, страница проекта, eller följ oss på Twitter, Facebook, Instagram, eller Youtube.







