Tutkimus ja taide

Parhaita käytäntöjä ٱätyökalujen hyödyntämiseen tutkimuksessa

Kokoelma parhaita käytäntöjä ٱätyökalujen hyödyntämiseen tutkimuksessa.
A banner that says "AI and Research Work"

Huomio: Tämä sivu täydentää ohjeistusta "Tekoälyn vastuullinen käyttö tutkimusprosessin aikana" käytännön vinkeillä. Sisältö perustuu lukuisiin vuorovaikutustilanteisiin yli tuhannen tutkijan kanssa kolmen viime vuoden ajalta, jolloin on järjestetty kurssi ”AI and Research Work” (Glerean, Silva) [zenodo][youtube], pakollista kurssia ”Research Ethics for Doctoral Students” (ٱäaiheet: Glerean, Solin, Rehbinder) sekä CodeRefinery-työpajaa ”Responsible Use of Generative AI in Assisted Coding” (Glerean, CodeRefinery) [materials][youtube]. Haluatko täydentää näitä käytännön ohjeita? Ota yhteyttä Enrico Glereaniin ja Aalto Data Agents -verkostoon (researchdata@aalto.fi). Valmistelemme avointa MOOC-verkkokurssia, joka on saatavilla syyskuusta 2026 alkaen. 

Tekoäly ja tutkimustyö

Tekoälyn (AI) työkaluja, esimerkiksi generatiiviseen ٱäyn perustuvia, käytetään tutkimuksen kaikissa vaiheissa: kirjallisuushausta ohjelmistojen koodaukseen ja käsikirjoitusten editointiin. Tutustu ohjeeseen Generatiivisen ٱän vastuullinen käyttö tutkimusprosessissa, jos et ole vielä tehnyt niin. Tämä sivu auttaa tunnistamaan, missä ”ٱä” voi auttaa, ja samalla tiedostamaan sen riskit liittyen tutkimusetiikkaan ja hyvän tieteelliseen käytännön periaatteisiin.

1. Tekoäly tutkimuksessa: mitä ٱä on?

Tutkimuksen kontekstissa ٱä voi toimia kolmessa roolissa:

  • Tekoäly tutkimuskohteena: ٱän itsensä tutkiminen (esim. ihmisen ja chatbotin vuorovaikutus, uudet koneoppimisalgoritmit (ML)).
  • Tekoäly menetelmänä: ML:n tai muiden ٱämenetelmien käyttäminen tutkimuksesi analyysimenetelmänä (esim. luokittelu, ennustaminen).
  • Tekoäly työkaluna: ٱällä (usein generatiivinen ٱä) varustettujen ohjelmistotyökalujen hyödyntäminen tehtävissä, jotka eivät sinänsä koske ٱää (esim. oikoluku, koodin debuggaus).

Useimmille tutkijoille (myös niille, jotka eivät tutki ٱää aiheena tai käytä sitä menetelmänä) ٱä on työkalu, jonka he kohtaavat päivittäin. 

Tämä sivu keskittyy (generatiiviseen) ٱäyn työkaluna: yleisimpään tilanteeseen suurimmalle osalle tutkijoista.

2. Generatiivisen ٱän työkalut tutkimuksen eri vaiheissa

Generatiivisen ٱän työkalut voivat auttaa tutkimusprosessin jokaisessa vaiheessa:

Vaihe Esimerkkejä ٱäavusta
Suunnittelu Kirjallisuushaku, apurahahakemusten luonnostelu, tutkimuskysymysten ideointi
Aineiston keruu Kyselyiden suunnittelu, aineiston kokoaminen, simulaatiot
äٳٱ Muotoilu, laadunvarmistus, aineiston siivoaminen
Analyysi Analyysikoodin tuottaminen, laadulliset annotaatiot
äٳäԱ Dokumentointi, README-tiedostojen luonti, metadata
Jakaminen Käsikirjoituksen luonnostelu, lehdistötiedotteet, sosiaalisen median julkaisut
ܻ԰äٳö Koodin dokumentointi, aineistokuvaukset

Jokaiseen käyttötilanteeseen liittyy riskejä. Mikään tehtävä ei ole ٱän kanssa aina hyvä tai aina huono, vaan se riippuu kontekstista ja ٱätyökalun käyttäjästä. Vastuullisena tutkijana tehtäväsi on arvioida riskit ennen kuin päätät jatkaa ٱän hyödyntämistä. Jos olet epävarma, voit keskustella asiasta kollegoiden kanssa (esim. data-asiantuntijoiden kanssa osoitteessa researchdata@aalto.fi) tai yksinkertaisesti välttää ٱän käyttöä kyseisessä tehtävässä. 

3. Vältä kolmea tutkimusvilpin muotoa: Miten ٱä voi mahdollistaa sepittämisen, vääristelyn ja plagioinnin?

Tutkimusvilppi tarkoittaa Suomessa (ja laajemmin akateemisessa maailmassa) 辱ٳää, ääٱä ja plagiointia. Ellei generatiivista ٱää käytetä huolellisesti, siitä voi käytännössä tulla “täydellinen vilppikone”, koska se voi erittäin helposti syyllistyä mihin tahansa näistä kolmesta väärinkäytöksen muodosta. Tutustu riskeihin, jotka on käsitelty ohjeistuksessa Tekoälyn vastuullinen käyttö tutkimusprosessin aikana.

4. Riskin arviointi: asiantuntijuus × tuotoksen riskitaso -matriisi

Kaikki ٱän käyttö ei ole samanarvoista. Jos olet epävarma, voit pohtia kahta tekijää arvioidaksesi, kuinka varovainen sinun tulisi olla:

  1. Oma asiantuntijuutesi tehtävässä, jonka delegoit ٱälle
  2. Tuotoksen tärkeys: lähetetäänkö se vertaisarvioitavaksi vai onko kyse matalan tärkeyden sisällöstä (esim. työpajan verkkosivu)?
  Vähän asiantuntemusta Paljon asiantuntemusta
Korkea riski (vertaisarvioitava julkaisu: teksti, koodi, kuvat, viitteet) Käytä ٱää vain ideoiden pallotteluun: kysy, mitä lähteitä kannattaisi lukea, pyydä avainsanaehdotuksia ja käy sitten itse lukemassa varsinaiset lähteet.

Esimerkki: etsi sopivia avainsanoja tai kysy, mitkä tilastolliset menetelmät voisivat sopia aineistoosi, ja käy sen jälkeen lukemassa niistä itse.
Käytä ٱää yksinkertaisiin delegoituihin tehtäviin, jotka pystyt tarkistamaan kokonaan. Tarkista kaikki yhtä huolellisesti kuin jos olisit kirjoittanut sen itse alusta asti. Yliluottamus on tässä kohtaa erityisen vaarallista.

Esimerkkejä: lyhyiden koodinpätkien generoiminen funktio kerrallaan. Tekstin muokkaus: pyydä ٱää merkitsemään ehdottamansa muutokset lihavoinnilla, jotta voit itse päättää, mitkä muutokset otat mukaan lopulliseen tekstiin.
Matala riski (tapahtuman verkkosivu, some-päivitys, esitykset) Käytä ٱää, mutta hyväksy se, että virheitä voi lipsahtaa läpi.

 Esimerkki: apu CSS:n kanssa työpajan verkkosivulla tai pienen demon ”vibe-koodaus”.
Delegoi suurin osa työstä ٱälle. Varmista, että tuotos on järkevä.

Esimerkki: laatimasi skriptien dokumentoinnin generointi tai esitysluonnoksen tekeminen omien äänitystesi litteroinnista.

(matriisi: Glerean, 2026, ”AI and research work”, valmisteilla)

Huomio 1: Aineistosi arkaluonteisuus nostaa riskitasoa. Luottamuksellisten tai henkilötietojen kanssa sinun täytyy kiinnittää huomiota paitsi siihen, miten käytät työkaluja, myös siihen, mitä työkaluja käytät.

Huomio 2: Erityistapaus, joka ulottuu eri riskitasojen yli, liittyy generoituun ohjelmakoodiin silloin, kun haluttu toiminnallisuus voidaan muotoilla automatisoitujen yksikkötestien avulla, testit on määritelty hyvin ja ne kattavat koodin kannalta oleellisen käyttäytymisen. Tämä voi pienentää riskitasoa, mutta siirtää laatuvaatimuksia itse testeihin.

Huomio 3: Voi olla myös muita erityisiä käyttötapauksia, jotka eivät istu tähän 2×2-matriisiin. Sinä olet viime kädessä vastuussa ja arvioit, onko ٱän käyttö tilanteessa tarkoituksenmukaista.

5. ձäٲö첹n valinta: tietojen luokittelu

Käyttämäsi ٱätyökalu tulisi valita sen mukaan, miten arkaluonteista tai julkista tieto on, jota käytät. 
Ohjeemme (Pay attention to privacy, confidentiality and intellectual property rights, saatavilla vain englanniksi) edellyttävät Aalto AI Assistantin käyttöä kaikissa käyttötapauksissa, joissa date ei ole täysin julkista. Alla oleva taulukko yhdistää Aallon neljä tiedon suojaustasoa sopiviin ٱätyökaluihin.

Taso Esimerkkejä datasta ձäٲö첹
Julkinen Wikipedia-sisältö, CC-lisensoidut julkaistut artikkelit, julkinen data Mikä tahansa ٱätyökalu käy
äԱ Muistiot kokouksista, kuluraportit, yliopiston sisäiset sivut Suosi hyväksyttyjä organisaation omia työkaluja
Luottamuksellinen Osallistujien data, julkaisemattomat tutkimustulokset Käytä vain työkaluja, joilla on sopimukseen perustuvat tietosuojatakuu (kuten ai.aalto.fi), tai aja ٱämalleja paikallisesti (esim. Triton-klusterilla)
Salainen Data, jonka vuoto aiheuttaisi vakavaa vahinkoa (esim. potilastiedot) Ei pilvipohjaisia ٱätyökaluja, vain paikallisia työkaluja luotetussa tutkimusympäristössä (Trusted Research Environment), kuten SECDATAssa

Jos käytät hyväksymättömiä työkaluja, mieti datana hyödyntämistä: Kaikki, mitä data jonka lisäät ٱäjärjestelmään, saatetaan käyttää mallin koulutukseen tai se voi päätyä muiden saatavilla. Hyvänä käytännön nyrkkisääntönä kohtele vuorovaikutusta Meta AI:n, Grokin (xAI) ja DeepSeekin kanssa täysin julkisena riippumatta siitä, mihin tietoluokkaan jakamasi sisältö kuuluu ja riippumatta niiden lupaamista yksityisyydensuojakäytännöistä. Näillä työkaluilla on joko sallivat tietosuojakäytännöt, jotka mahdollistavat syötteidesi käytön mallien kouluttamiseen, tai niitä tarjoavat organisaatiot, joiden tietokäytännöt eivät ole riippumattomasti todennettavissa.

Jopa julkisen datan yhteydessä julkaisemattomien tutkimusideoiden jakaminen ٱäpalveluille sisältää aina riskin idean päätymisestä muiden käyttöön tai julkiseen internetiin.

6. Tekoälyn käytön ilmoittaminen

Aalto-yliopiston ohjeet ٱän vastuulliseen käyttöön tutkimuksessa pohjautuvat ALLEAn eurooppalaisen hyvä tieteellinen käytäntö -ohjeiston neljään periaatteeseen: luotettavuuteen, rehellisyyteen, kunnioitukseen ja vastuullisuuteen. Käytännössä nämä tarkoittavat käsikirjoituksen valmistelussa seuraavaa:

Mitä pitää ilmoittaa? 

Esimerkkinä tässä ovat Elsevierin suositukset (tarkista oman kustantajasi suositukset ennen käsikirjoituksen lähettämistä):

  • Ilmoitusta ei tarvita: vain kirjoitusvirheiden ja kieliopin korjaaminen
  • Ilmoitus vaaditaan: kaikenlainen tekstin yhteenveto, koodin generointi, kuvien luonti, analyysimenetelmien ehdottaminen tai minkä tahansa osion luonnostelu
  • Tekoälyllä tuotetut kuvat: sallittuja vain työnkulun tai menetelmän havainnollistamiseen; ei koskaan tuloskuvina tai määrällisinä kuvaajina

Ilmoitusmalli

Kun ilmoitat ٱän käytöstä, sisällytä esimerkiksi seuraavanlainen lausuma (Elsevierin esimerkki):

  • Osion otsikko: Ilmoitus generatiivisen ٱän ja ٱäavusteisten teknologioiden käytöstä käsikirjoituksen valmistelussa
  • Lausuma: Tämän työn valmistelun aikana kirjoittaja(t) käytti(vät) [TYÖKALUN / PALVELUN NIMI] [SYY]. Työkalun/palvelun käytön jälkeen kirjoittaja(t) tarkasti(vat) ja muokkasi(vat) sisältöä tarvittaessa ja ottaa(vat) täyden vastuun julkaistun artikkelin sisällöstä.

7. Käytännön neuvoja

Tässä on joukko käytännön vinkkejä ja ٱätyökalujen käyttötapauksia tutkimuksessa, satunnaisessa järjestyksessä.

8. Kysymyksiä ja vastauksia

Tässä joitakin kysymyksiä, joita on usein noussut esiin tutkimusetiikan kurssilla tai “Tekoäly tutkimustyössä” -työpajoissamme.

9. Video­luentoja ٱästä ja tutkimuksesta

Tämä osio näkyy vain, jos olet kirjautunut sisään. Osiossa on videoita tohtoriopiskelijoiden tutkimusetiikan kurssilta, jonka opettajina ovat Arno Solin (Etiikka ٱätutkimuksessa), Enrico Glerean (Generatiivinen ٱä ja tutkimuksen integriteetti) ja Maria Rehbinder (AI-asetus). Valmistelemme MOOC-verkkokurssia, johon sisältyy näiden videoiden lisäksi paljon muutakin. Otathan yhteyttä, jos haluat osallistua MOOCin tekemiseen.

dzٴDZääö

Nykyisessä ٱän aikakaudessa, jossa se laajenee kaikkiin elämämme osa-alueisiin, vastuullisia tutkijoita eivät ole ne, jotka välttelevät ٱää kokonaan, eivätkä ne, jotka delegoivat sille kaiken. Vastuulliset tutkijat ymmärtävät, miten nämä järjestelmät toimivat ja mitä niille delegoidaan. He osaavat tarkistaa tulokset, pohtia dataan ja lainsäädäntöön liittyviä riskejä, kertoa ٱän käytöstä rehellisesti ja säilyttää tutkimuksessa tarvittavat keskeiset inhimilliset taidot: lukemisen, päättelyn, dokumentoinnin, viestinnän ja vastuun kantamisen. 

Aalto-yliopiston logo, jonka yläpuolella isoilla kirjaimilla 'A!'. Nimen alla kolmella kielellä.

Tekoälyn vastuullinen käyttö tutkimusprosessin aikana

Tutkimuksen toistettavuus, vastuunkanto tutkimustulosten oikeellisuudesta, toisten tutkijoiden tekemän työn tunnustaminen ja kunnioittaminen, ja tiedon suojaus.

Palvelut
Suloinen valkoinen AI-robotti kaaviossa, jossa datasyötöt, käsittelykuvakkeet ja vihreät tulossymbolit

Koodausassistentit Aallossa

Koodiavustajat ovat AI-työkaluja, jotka auttavat kirjoittamaan ohjelmakoodia, arvioimaan sitä ja nopeuttamaan siten kehitysprosesseja.

Palvelut
Local AI llm gateway banner

Tutkimukselle ja opetukselle oma rajapinta suurelle kielimallille

Aallon tutkijoille, opettajille ja opiskelijoille tarjolla turvallinen tapa rakentaa suuria kielimalleja hyödyntäviä työkaluja

Uutiset
Light bulb

Vinkkejä opettajalle ٱän käytöstä opetuksessa

Opettajalle vinkkejä miten ٱän käyttöä opetuksessa voi huomioida

Palvelut
Mustia ympyröitä ja neliöitä, jotka on yhdistetty katkoviivoilla sinisellä taustalla.

Tekoälyjärjestelmät ja tekijänoikeus

Tekoälyjärjestelmät ja niihin liittyvät tekijänoikeuskysymykset.

Palvelut
  • äٱٳٲ:
  • Julkaistu:
Jaa
URL kopioitu