AncestryAI-algoritmi piirtää sukupuusi yli 300 vuoden päähän
Aalto-yliopiston tohtorikoulutettavan Eric Malmin kehittämä AncestryAI-niminen sukupuualgoritmi etsii linkkejä 5 miljoonan kastetapahtuman välillä 1600-luvun lopulta 1800-luvun puoliväliin ja osin 1900-luvun alkuun. Omien sukujuurten tutkimiseksi täytyy olla tietoinen omasta esi-isästään, koska viimeisten sadan vuoden ajalta kastetapahtumat eivät ole julkista tietoa.
”Aineisto on peräisin Historiakirjoista eli HisKi-projektista, jota organisoi Suomen Sukututkimusseura ja jossa vapaaehtoiset sukututkijat tallettavat kirkonkirja-aineistoja tietokantaan. Kastetapahtumien lisäksi aineisto sisältää naimisiin menneitä, haudattuja ja muuttaneita, joita algoritmi ei kuitenkaan toistaiseksi vielä hyödynnä. Aineistossa on aukkoja johtuen esimerkiksi kirkkojen palamisesta, mutta siitä huolimatta se on kansainvälisestikin harvinaisen kattava sisältäen tietoja usean vuosisadan ajalta”, kertoo Malmi.
Sukupuualgoritmi etsii automaattisesti lasten todennäköisimmät vanhemmat ja piirtää näin muodostuneita sukupuita. Algoritmi antaa useita vaihtoehtoja perustuen vanhempien syntymäaikaan, nimien samankaltaisuuteen ja syntymäpaikkaan. Koko aineiston linkittämiseen algoritmilta kuluu noin puoli tuntia.
”Polkuhaun avulla taas voi selvittää, ovatko kaksi henkilöä jotain kautta sukua toisilleen. Monia saattaa esimerkiksi kiinnostaa, ovatko he jotain sukua Aleksis Kivelle tai muille tunnetuille historian henkilöille. Täytyy kuitenkin ottaa huomioon, että jos polku on pitkä ja kaikki linkit ovat epävarmoja, on hyvin epätodennäköistä että polku on kokonaisuudessaan oikein”, tähdentää Malmi.
AncestryAI:n käyttäjät voivat jättää kommentteja algoritmin päättelemien sukulaisuussuhteiden paikkansapitävyydestä. Kommenttien avulla avulla algoritmia voidaan kouluttaa päättelemään sukulaisuussuhteet entistä tarkemmin, ja kommentit näkyvät myös muille käyttäjille.
”Koko Suomen kattava sukupuu olisi kiinnostava, koska sen avulla voitaisiin tutkia esimerkiksi sotien, epidemioiden ja luokkayhteiskunnan vaikutuksia ja muutosta. Toistaiseksi se ei kuitenkaan ole mahdollista, koska esimerkiksi rippikirjat eivät ole algoritmin käytössä. Algoritmi ei korvaakaan sukututkijan tekemää työtä, vaan toimii siinä avustavassa roolissa, nopeuttaen ja osin myös tarkkuutta parantaen”, lisää Malmi lopuksi.
Malmi esittelee AncestryAI:ta Suku 2017 -tapahtumassa Otaniemessä 19.3.2017. Huhtikuun alussa Malmi esittelee algoritmin teknisiä ominaisuuksia ja linkityksiä World Wide Web -konferenssissa Australiassa. AncestryAI on käytettävissä osoitteessa ja vaatii toimiakseen joko Chrome- tai Firefox-selaimen. AncestryAI on osa Malmin väitöskirjatutkimusta.
äپٴDz:
Eric Malmi
Tohtorikoulutettava
Aalto-yliopisto, tietotekniikan laitos
eric.malmi@aalto.fi
Lue lisää uutisia
Hämeenlinnan taidemuseon näyttely herättää teokset henkiin elokuvan keinoin
Hämeenlinnan taidemuseossa nähdään yhteistyössä Aalto-yliopiston elokuvataiteen laitos ELO:n kanssa toteutettu Kehyskertomuksia: 24 fps / Reframing Cinema -näyttely.
Tutkimusaineiston julkaiseminen tutkimusartikkeleiden yhteydessä
Tieteelliset lehdet vaativat enenevässä määrin ns. tutkimusdatan saatavuuslausuntoja (data availability statements). Ne sisältävät tiedot siitä, mitä dataa on saatavilla, mistä se löytyy ja datan mahdolliset käyttöehdot.
Kuka julkaisee avoimet julkaisumme?
Aalto-yliopiston ja Helsingin yliopiston tutkijat suosivat julkaisemista suurten kustantajien kirjoittajamaksullisissa avoimissa lehdissä. Kirjoittajille maksuttomissa avoimissa lehdissä kustantajana on usein yliopisto tai tieteellinen seura.