Tekoälyn vastuullinen käyttö tutkimusprosessin aikana
Tutkimuksen toistettavuus, vastuunkanto tutkimustulosten oikeellisuudesta, toisten tutkijoiden tekemän työn tunnustaminen ja kunnioittaminen, ja tiedon suojaus.
Huomio: Tämä sivu täydentää ohjeistusta "Tekoälyn vastuullinen käyttö tutkimusprosessin aikana" käytännön vinkeillä. Sisältö perustuu lukuisiin vuorovaikutustilanteisiin yli tuhannen tutkijan kanssa kolmen viime vuoden ajalta, jolloin on järjestetty kurssi ”AI and Research Work” (Glerean, Silva) [zenodo][youtube], pakollista kurssia ”Research Ethics for Doctoral Students” (ٱäaiheet: Glerean, Solin, Rehbinder) sekä CodeRefinery-työpajaa ”Responsible Use of Generative AI in Assisted Coding” (Glerean, CodeRefinery) [materials][youtube]. Haluatko täydentää näitä käytännön ohjeita? Ota yhteyttä Enrico Glereaniin ja Aalto Data Agents -verkostoon (researchdata@aalto.fi). Valmistelemme avointa MOOC-verkkokurssia, joka on saatavilla syyskuusta 2026 alkaen.
Tekoälyn (AI) työkaluja, esimerkiksi generatiiviseen ٱäyn perustuvia, käytetään tutkimuksen kaikissa vaiheissa: kirjallisuushausta ohjelmistojen koodaukseen ja käsikirjoitusten editointiin. Tutustu ohjeeseen Generatiivisen ٱän vastuullinen käyttö tutkimusprosessissa, jos et ole vielä tehnyt niin. Tämä sivu auttaa tunnistamaan, missä ”ٱä” voi auttaa, ja samalla tiedostamaan sen riskit liittyen tutkimusetiikkaan ja hyvän tieteelliseen käytännön periaatteisiin.
Tutkimuksen kontekstissa ٱä voi toimia kolmessa roolissa:
Useimmille tutkijoille (myös niille, jotka eivät tutki ٱää aiheena tai käytä sitä menetelmänä) ٱä on työkalu, jonka he kohtaavat päivittäin.
Tämä sivu keskittyy (generatiiviseen) ٱäyn työkaluna: yleisimpään tilanteeseen suurimmalle osalle tutkijoista.
Generatiivisen ٱän työkalut voivat auttaa tutkimusprosessin jokaisessa vaiheessa:
| Vaihe | Esimerkkejä ٱäavusta |
|---|---|
| Suunnittelu | Kirjallisuushaku, apurahahakemusten luonnostelu, tutkimuskysymysten ideointi |
| Aineiston keruu | Kyselyiden suunnittelu, aineiston kokoaminen, simulaatiot |
| äٳٱ | Muotoilu, laadunvarmistus, aineiston siivoaminen |
| Analyysi | Analyysikoodin tuottaminen, laadulliset annotaatiot |
| äٳäԱ | Dokumentointi, README-tiedostojen luonti, metadata |
| Jakaminen | Käsikirjoituksen luonnostelu, lehdistötiedotteet, sosiaalisen median julkaisut |
| ܻäٳö | Koodin dokumentointi, aineistokuvaukset |
Jokaiseen käyttötilanteeseen liittyy riskejä. Mikään tehtävä ei ole ٱän kanssa aina hyvä tai aina huono, vaan se riippuu kontekstista ja ٱätyökalun käyttäjästä. Vastuullisena tutkijana tehtäväsi on arvioida riskit ennen kuin päätät jatkaa ٱän hyödyntämistä. Jos olet epävarma, voit keskustella asiasta kollegoiden kanssa (esim. data-asiantuntijoiden kanssa osoitteessa researchdata@aalto.fi) tai yksinkertaisesti välttää ٱän käyttöä kyseisessä tehtävässä.
Tutkimusvilppi tarkoittaa Suomessa (ja laajemmin akateemisessa maailmassa) 辱ٳää, ääٱä ja plagiointia. Ellei generatiivista ٱää käytetä huolellisesti, siitä voi käytännössä tulla “täydellinen vilppikone”, koska se voi erittäin helposti syyllistyä mihin tahansa näistä kolmesta väärinkäytöksen muodosta. Tutustu riskeihin, jotka on käsitelty ohjeistuksessa Tekoälyn vastuullinen käyttö tutkimusprosessin aikana.
Kaikki ٱän käyttö ei ole samanarvoista. Jos olet epävarma, voit pohtia kahta tekijää arvioidaksesi, kuinka varovainen sinun tulisi olla:
| Vähän asiantuntemusta | Paljon asiantuntemusta | |
|---|---|---|
| Korkea riski (vertaisarvioitava julkaisu: teksti, koodi, kuvat, viitteet) | Käytä ٱää vain ideoiden pallotteluun: kysy, mitä lähteitä kannattaisi lukea, pyydä avainsanaehdotuksia ja käy sitten itse lukemassa varsinaiset lähteet. Esimerkki: etsi sopivia avainsanoja tai kysy, mitkä tilastolliset menetelmät voisivat sopia aineistoosi, ja käy sen jälkeen lukemassa niistä itse. |
Käytä ٱää yksinkertaisiin delegoituihin tehtäviin, jotka pystyt tarkistamaan kokonaan. Tarkista kaikki yhtä huolellisesti kuin jos olisit kirjoittanut sen itse alusta asti. Yliluottamus on tässä kohtaa erityisen vaarallista. Esimerkkejä: lyhyiden koodinpätkien generoiminen funktio kerrallaan. Tekstin muokkaus: pyydä ٱää merkitsemään ehdottamansa muutokset lihavoinnilla, jotta voit itse päättää, mitkä muutokset otat mukaan lopulliseen tekstiin. |
| Matala riski (tapahtuman verkkosivu, some-päivitys, esitykset) | Käytä ٱää, mutta hyväksy se, että virheitä voi lipsahtaa läpi. Esimerkki: apu CSS:n kanssa työpajan verkkosivulla tai pienen demon ”vibe-koodaus”. |
Delegoi suurin osa työstä ٱälle. Varmista, että tuotos on järkevä. Esimerkki: laatimasi skriptien dokumentoinnin generointi tai esitysluonnoksen tekeminen omien äänitystesi litteroinnista. |
(matriisi: Glerean, 2026, ”AI and research work”, valmisteilla)
Huomio 1: Aineistosi arkaluonteisuus nostaa riskitasoa. Luottamuksellisten tai henkilötietojen kanssa sinun täytyy kiinnittää huomiota paitsi siihen, miten käytät työkaluja, myös siihen, mitä työkaluja käytät.
Huomio 2: Erityistapaus, joka ulottuu eri riskitasojen yli, liittyy generoituun ohjelmakoodiin silloin, kun haluttu toiminnallisuus voidaan muotoilla automatisoitujen yksikkötestien avulla, testit on määritelty hyvin ja ne kattavat koodin kannalta oleellisen käyttäytymisen. Tämä voi pienentää riskitasoa, mutta siirtää laatuvaatimuksia itse testeihin.
Huomio 3: Voi olla myös muita erityisiä käyttötapauksia, jotka eivät istu tähän 2×2-matriisiin. Sinä olet viime kädessä vastuussa ja arvioit, onko ٱän käyttö tilanteessa tarkoituksenmukaista.
Käyttämäsi ٱätyökalu tulisi valita sen mukaan, miten arkaluonteista tai julkista tieto on, jota käytät.
Ohjeemme (Pay attention to privacy, confidentiality and intellectual property rights, saatavilla vain englanniksi) edellyttävät Aalto AI Assistantin käyttöä kaikissa käyttötapauksissa, joissa date ei ole täysin julkista. Alla oleva taulukko yhdistää Aallon neljä tiedon suojaustasoa sopiviin ٱätyökaluihin.
| Taso | Esimerkkejä datasta | ձäٲö첹 |
|---|---|---|
| Julkinen | Wikipedia-sisältö, CC-lisensoidut julkaistut artikkelit, julkinen data | Mikä tahansa ٱätyökalu käy |
| äԱ | Muistiot kokouksista, kuluraportit, yliopiston sisäiset sivut | Suosi hyväksyttyjä organisaation omia työkaluja |
| Luottamuksellinen | Osallistujien data, julkaisemattomat tutkimustulokset | Käytä vain työkaluja, joilla on sopimukseen perustuvat tietosuojatakuu (kuten ai.aalto.fi), tai aja ٱämalleja paikallisesti (esim. Triton-klusterilla) |
| Salainen | Data, jonka vuoto aiheuttaisi vakavaa vahinkoa (esim. potilastiedot) | Ei pilvipohjaisia ٱätyökaluja, vain paikallisia työkaluja luotetussa tutkimusympäristössä (Trusted Research Environment), kuten SECDATAssa |
Jos käytät hyväksymättömiä työkaluja, mieti datana hyödyntämistä: Kaikki, mitä data jonka lisäät ٱäjärjestelmään, saatetaan käyttää mallin koulutukseen tai se voi päätyä muiden saatavilla. Hyvänä käytännön nyrkkisääntönä kohtele vuorovaikutusta Meta AI:n, Grokin (xAI) ja DeepSeekin kanssa täysin julkisena riippumatta siitä, mihin tietoluokkaan jakamasi sisältö kuuluu ja riippumatta niiden lupaamista yksityisyydensuojakäytännöistä. Näillä työkaluilla on joko sallivat tietosuojakäytännöt, jotka mahdollistavat syötteidesi käytön mallien kouluttamiseen, tai niitä tarjoavat organisaatiot, joiden tietokäytännöt eivät ole riippumattomasti todennettavissa.
Jopa julkisen datan yhteydessä julkaisemattomien tutkimusideoiden jakaminen ٱäpalveluille sisältää aina riskin idean päätymisestä muiden käyttöön tai julkiseen internetiin.
Aalto-yliopiston ohjeet ٱän vastuulliseen käyttöön tutkimuksessa pohjautuvat ALLEAn eurooppalaisen hyvä tieteellinen käytäntö -ohjeiston neljään periaatteeseen: luotettavuuteen, rehellisyyteen, kunnioitukseen ja vastuullisuuteen. Käytännössä nämä tarkoittavat käsikirjoituksen valmistelussa seuraavaa:
Esimerkkinä tässä ovat Elsevierin suositukset (tarkista oman kustantajasi suositukset ennen käsikirjoituksen lähettämistä):
Kun ilmoitat ٱän käytöstä, sisällytä esimerkiksi seuraavanlainen lausuma (Elsevierin esimerkki):
Tässä on joukko käytännön vinkkejä ja ٱätyökalujen käyttötapauksia tutkimuksessa, satunnaisessa järjestyksessä.
Kehotteiden suunnittelu ei kannata, koska LLM-mallit ovat ihmistä parempia kirjoittamaan kehotteita. Sen sijaan, että opettelisit kehotteiden suunnittelua tai tallentaisit kirjanmerkkeihin kehotteita, jotka eivät ehkä enää toimi uusien mallien kanssa, voit pyytää ٱää kirjoittamaan kehote puolestasi ja huolehtia siitä, että ohjeistat sitä myös esittämään täsmentäviä kysymyksiä ennen kehotteen tuottamista.
Esimerkki 1: Tässä esimerkissä on luottamuksellista tietoa käynnissä olevasta tutkimusprojektista, joten tätä voisi käyttää Aalto AI Assistantissa, ai.aalto.fi:ssä.
Yritän valita, mitä analyysimenetelmää käyttäisin aineistoni kanssa (litteroidut haastattelut suomalaisista yrityksen omistajista, jotka liittyvät heidän asenteeseensa ٱän aiheuttamaa työn vaativuuden alenemista kohtaan). Laadi minulle kehote käytettäväksi [mallin] kanssa. Ennen kuin tuotat kehotteen, esitä minulle muutama kysymys sen tarkentamiseksi.
Esimerkki 2: Aalto AI Assistantilla ei ole pääsyä internetiin, joten se ei voi tehdä hakuja tai tarkistaa kirjallisuutta. Tässä on kehote, joka käyttää Google Geminin "deep research" -ominaisuutta (OpenAI:n ChatGPT:llä ja Anthropicin Claudella on jotain vastaavaa), jotta se voi hakea tietoa internetistä. Tämä kehote ei sisällä mitään luottamuksellisia yksityiskohtia:
Olen aivokuvantamistutkija, mutta en tunne genomiikkaa ja aivokuvantamiskirjallisuutta kovin hyvin. Kirjoita minulle kehote käytettäväksi Google Geminin Deep Research -toiminnon kanssa, jotta se kartoittaa viimeisen viiden vuoden olennaista kirjallisuutta ja tunnistaa tärkeät vertaisarvioidut artikkelit, joissa yhdistyvät genetiikka ja aivokuvantaminen. Myös katsausartikkelit tulisi sisällyttää. Ennen kuin tuotat kehotteen, esitä minulle muutama kysymys sen tarkentamiseksi.
Huomio: vaikka "deep research" vaikuttaa ensi käyttökerralla hämmästyttävältä, monet Aallon tutkijat, jotka ovat osallistuneet aiempiin työpajoihimme, ovat kertoneet, että se taipuu sepittämään asioita ja raportoimaan yksityiskohtia, joita ei ole lainkaan mainituissa viitteissä. Suhtaudu deep researchiin välineenä, jonka avulla voi löytää osan kirjallisuudesta, mutta lue sen jälkeen varsinaiset artikkelit ja tee tavanomaiset haut artikkelitietokannoista.
Generatiivinen ٱä on erittäin hyvä kääntämään yhdestä kielestä toiseen, ja yksi hyödyllisimmistä käyttötapauksista on luonnollisen englannin kääntäminen Pythoniksi (tai miksi tahansa ohjelmointikieleksi, jota käytät). CodeRefineryn oppitunnissa “Responsible Use of Generative AI in Assisted Coding” esitellään kolme tapaa työskennellä ٱän tuottaman koodin kanssa:
Aloita skenaariosta 1. Siirry skenaarioon 2 vasta, kun olet varma, että osaat arvioida tuotettua koodia. Skenaariosta 3 kerrotaan seuraavassa osiossa.
ձäⲹԳپ (erityisesti koodausagentit) aiheuttavat suurempia riskejä, koska ne voivat toimia itsenäisesti. Ainakin kaksi riskityyppiä tulisi mainita.
Ennen kuin käytät agentteja jaetulla infrastruktuurilla, lue aiheeseen liittyvät ohjeet ja tutustu siellä olevaan riskitaulukkoon. Suurin osa HPC-järjestelmiä (High Performance Computing) koskevista riskeistä pätee yhtä lailla henkilökohtaiseen tietokoneeseen.
Ohjeet Aalto-koodiavustajien käytön aloittamiseen | Aalto-yliopisto
Yleinen suositus on käyttää vain Aallon hyväksymiä ٱätyökaluja, ja tässä sovelletaan ohjetta Responsible use of Generative Artificial Intelligence in the research process. Tutkijoiden täytyy kuitenkin usein vertailla erilaisia työkaluja tai käyttää uusia ominaisuuksia, joita Aallon ekosysteemissä ei vielä ole. Jos sinun täytyy testata ei-hyväksyttyä työkalua, noudata näitä yleisiä suosituksia:
Joissakin tapauksissa tehtäväsi on hyvin rajattu eikä vaadi suurta kielimallia. Esimerkiksi puheesta tekstiksi -transkriptio voidaan tehdä kokonaan paikallisesti Aallon laskentaympäristössä.
Käännöksiä kielestä toiseen voidaan myös suorittaa paikallisesti. IT-palvelumme ja tutkimusohjelmistojen asiantuntijat kehittävät näitä työkaluja, ja sillä välin voit käyttää Aalto AI Assistantia ja pyytää sitä kääntämään tekstin puolestasi.
Tekoälyä voidaan käyttää kuvien tuottamiseen, mutta koska tutkijalla ei yleisesti ole tekijänoikeuksia puhtaasti ٱän tuottamiin kuviin, niitä ei hyväksytä moniin tieteellisiin tarkoituksiin, kuten tieteellisiin julkaisuihin. Tästä huolimatta tällainen työkalu voi olla hyödyllinen tutkijoille visuaalisen aineiston luomisessa. Joitakin hyväksyttäviä tapoja integroida generatiivista ٱää tieteelliseen työskentelyyn ovat:
Käsitteellinen kartoitus ja estetiikan tutkiminen
Kun jokin käsite on liian abstrakti tai kun monimutkaisten käsitteiden kääntäminen konkreettisiksi esityksiksi on hankalaa, tutkijat voivat käyttää ٱää visualisoidakseen käsitettä. Voit luoda visuaalisia metaforia datalle sekä kokeilla erilaisia väripaletteja, tekstuureja ja esitystyylejä rakentaaksesi yhtenäisen visuaalisen ilmeen tutkimusprojektille tai rahoitushakemukselle.
Useiden variaatioiden luominen yhdestä konseptista
Edellinen kohta käsitteli abstraktien ideoiden tutkimista, kun taas tässä on kyse siitä, miten toteuttaa visuaalisesti jo määritelty konsepti. Tekoäly pystyy tuottamaan täsmälleen saman konseptin lukuisissa eri taidetyyleissä. Voit pyytää sitä luonnostelemaan kuvan, joka on lähellä haluttua estetiikkaa, ja siten testata nopeasti erilaisia sommitteluja, kuvakulmia ja rajauksia. Kun löydät sopivan visuaalisen lähestymistavan, tämä ٱän tuottama kuva voi toimia rakenteellisena pohjana tai viiteluonnoksena, jonka voit jäljentää käsin ja luoda oman alkuperäisen vektorigrafiikkasi (esim. Inkscapella tai Illustratorilla).
Nopea kuvageneraattori esityksiä varten
Joskus tiedät tarkalleen, millaisen kuvan haluat, mutta sinulla ei ole riittävästi aikaa sen tekemiseen. Visuaalinen materiaali voi usein ratkaista sen, saatko yleisön huomion, olipa kyseessä ryhmäkokous tai seminaariesitys. Koska tällaiset tuotokset ovat yleensä sisäiseen käyttöön tai tilapäisiin esityksiin, tekijänoikeuden omistaminen ei ole välttämätöntä. Tekoäly soveltuu mainiosti taustagrafiikan, käsitteellisten ikonien tai koriste-elementtien luomiseen esityskalvoja varten.
Skriptaus 3D-mallinnuksen ja renderöinnin automatisointiin
Kuvamallien lisäksi ٱä soveltuu erinomaisesti skriptien laatimiseen. Voit pyytää laajaa kielimallia, LLM:ää, kirjoittamaan Python-skriptejä Blenderiin (ja vastaaviin), jotta voit ohjelmallisesti luoda tarkkoja geometrioita, asettaa kamerakulmia tai animoida molekyylirakenteita.
Tekstistä diagrammisyntaksiksi
Dokumentaation, koejärjestelyjen ja projektiaikataulujen ylläpito edellyttää selkeitä ja helposti muokattavia kaavioita. LLM-mallit ovat erittäin taitavia muuntamaan tekstikuvauksia diagrammikoodeiksi (esim. Mermaid.js, Graphviz, PlantUML). Tällä lähestymistavalla voit luoda vuokaavioita, diagrammeja ja tiekarttoja koodilla, jota voidaan muokata, versioida Gitin avulla ja renderöidä suoraan markdown-dokumentteihin tai laboratorion muistiinpanoihin.
Laadullinen tutkimus on perinteisesti toteutunut ensisijaisesti tutkijan, aineiston ja tutkimusryhmän kollegoiden välillä. Tällaisessa tutkimuksessa keskeistä ovat tutkijan tulkinnat sekä vastuu pohtia omaa vaikutustaan aineiston tulkintaan. Menetelmällisessä kirjallisuudessa tätä kutsutaan refleksiivisyydeksi, ja sitä on pitkään pidetty laadullisen tutkimuksen ytimessä. Monissa laadullisen tutkimuksen traditioissa analyysilla ei tavoitella yhtä ainoaa absoluuttista totuutta, vaan se koostuu aineiston subjektiivisesta tulkinnasta ja sen käsittelemisestä yhtenä todellisuuden muotona. Tämä subjektiivisuus on olennainen osa analyyttista prosessia ja toimii tutkijalle resurssina (Braun & Clarke, 2019). Se, mitä voidaan pitää perusteltuna tulkintana, riippuu tutkijan omaksumasta tietoteoreettisesta kannasta ja niistä perusteista, joihin tulkinnalliset valinnat pohjautuvat.
Suurten kielimallien (Large Language Models, LLM) pohjalle rakentuva ٱäjärjestelmä tuo analyyttiseen vuorovaikutukseen mukaan uuden osallistujan, joka tuottaa sanoja ja generoi valtaosan chat-käyttöliittymän kautta syntyvästä tekstistä. Tekoäly ei kuitenkaan toimi yksinkertaisesti täysin itsenäisenä kolmantena osallistujana, koska se ei ole yhtenäinen tai pysyvä toimija, vaan mallit toimivat erilaisten mahdollisten persoonien superpositiona. Jokainen kehote tuottaa vastauksia, joita muovaavat useat kerrostumat, kuten laajaan tekstiaineistoon perustuva esikoulutus, esimerkkikeskusteluihin perustuva hienosäätö sekä ihmispalautteeseen perustuvat säädöt (kuten RLHF), jotka kaikki yhdessä rakentavat tyypillistä avustajapersoonaa. Lisäksi tuotokseen vaikuttavat myös itse kehotus, istunnon konteksti ja muisti.
Koska tutkijat keskustelevat näiden järjestelmien kanssa arkikielellä chatin kautta, he voivat käydä edestakaista vuoropuhelua, joka ajan myötä vaikuttaa heidän ajatteluunsa ja päätöksiinsä. Laadullisesta tulkinnasta tulee helpommin puolustettavissa oleva, kun tutkija pystyy selittämään, miten se on muotoutunut, mutta merkitysten muuttuessa pitkäkestoisen dialogin myötä yhteisrakenteisiksi refleksiivisyyden ylläpitäminen voi olla haastavaa. Mikään tämä ei tee ٱästä käyttökelvotonta laadullisessa työssä; refleksiivisesti käytettynä se voi auttaa jäsentämään omia ajatuksia, järjestämään aineistoa uudelleen tai testaamaan tulkintaa eri vaihtoehtoihin verrattuna, kunhan tutkija tietoisesti säilyttää toimijuuden tulkintaprosessin ohjauksessa. Seuraavassa on joitakin hyödyllisiä vinkkejä, jotka on hyvä pitää mielessä tehtäessä laadullista analyysia ٱäjärjestelmän kanssa:
Braun, V., & Clarke, V. (2019). Reflecting on reflexive thematic analysis. Qualitative Research in Sport, Exercise and Health, 11(4), 589–597.
Finlay, L. (2002). Negotiating the swamp: The opportunity and challenge of reflexivity in research practice. Qualitative Research, 2(2), 209–230.
Gulay, E., Picco, E., Glerean, E., & Coupette, C. (2026). Relational dissonance in human-AI interactions: The case of knowledge work. Teoksessa Proceedings of the 2026 CHI Conference on Human Factors in Computing Systems (CHI ’26). ACM.
Madill, A., Jordan, A., & Shirley, C. (2000). Objectivity and reliability in qualitative analysis: Realist, contextualist and radical constructionist epistemologies. British Journal of Psychology, 91(1), 1–20.
Tässä joitakin kysymyksiä, joita on usein noussut esiin tutkimusetiikan kurssilla tai “Tekoäly tutkimustyössä” -työpajoissamme.
V1: Manuaalinen tarkistus on käytännössä ainoa luotettava menetelmä. Työnkulku, jota kuvataan The Lancet -lehdessä (2026):
Tekoälypohjaiset tunnistustyökalut (jotka nekin perustuvat ٱäyn) eivät ole luotettavia tähän tarkoitukseen.
V2: Horizon Europe on . ICML teki , jossa saatiin opettavaisia havaintoja sääntörikkomuksista.
V3: Kyllä, kaikkein sitkeimpiä tutkijoita ovat ne, jotka osaavat edelleen ajatella huolellisesti silloinkin, kun ٱää ei ole saatavilla tai se on väärässä, ja jotka pystyvät aina palaamaan alkuperäisiin lähteisiin (lukevat artikkelit kokonaan, osaavat tarkistaa ohjelmistokirjastojen dokumentaation). Kuten jokainen 7-vuotias sanoisi: kertotaulut kannattaa yhä opetella, vaikka laskimia on olemassa.
A4: Kirjallisuudessa esitetyt havainnot ovat ristiriitaisia. Ohjelmoinnissa, joka on se alue, jolla ٱä suoriutuu parhaiten, tuottavuuden kasvua voidaan mitata, mutta hinnaksi koituu suurempi määrä vaikeasti ylläpidettävää koodia sekä nopeasti nousevat työkalukustannukset. Laajemmin tutkimuksessa ٱä voi poistaa joitakin pullonkauloja yksittäisten tutkijoiden työstä, mutta siirtää pullonkaulan vertaisarviointiin, joka pysyy edelleen tiukkana rajana sille, millä vauhdilla tutkimusta voidaan validoida ja julkaista. Tuottavuuden lisäys, joka ohittaa arvioinnin laadun, ei ole todellista edistystä tieteen kannalta.
V5: Joidenkin tutkimusten mukaan vaikutukset ympäristöön ovat selviä (yksi esimerkki täällä), mutta toisaalta datakeskukset kertovat käyttävänsä vihreää energiaa ja tavoittelevansa jätteettömyyttä vuoteen 2030 mennessä (katso Microsoft Azure).
Yleisesti ottaen suurten ٱäjärjestelmien energiakustannukset ovat korkeammat kuin yksinkertaisen verkkohakukonehaun (joka ei käytä ٱää) suorittaminen, joten jos kysymykseesi löytyy vastaus tavallisella hakukoneella, kannattaa harkita sen käyttämistä ٱäkeskustelubotin sijaan. Esimerkkejä hyvistä hakukoneista, joissa ٱätulokset voi kytkeä pois päältä ja jotka ovat myös yksityisyyttä kunnioittavia: https://duckduckgo.com/ , https://www.ecosia.org/
V6: Tieteellinen vapaus on yksi tutkimuksen perusperiaatteista. Sinun ei tulisi koskaan tuntea itseäsi pakotetuksi käyttämään ٱää työssäsi, varsinkaan silloin, kun tiedät sen aiheuttavan enemmän haittaa kuin hyötyä. On kuitenkin tärkeää oppia, miten näitä työkaluja on rakennettu ja miten ne voivat (tai eivät voi) toimia tutkimuksesi kannalta. Luovan ٱän järjestelmien käyttäminen, kun ne on rakennettu aineistoilla, jotka on kerätty tai , ei ehkä ole linjassa omien eettisten periaatteidesi kanssa. Harkitse ٱätyökalujen käyttämistä, kun ne on rakennettu vastuullisesti. Valitettavasti tämä on helpommin sanottu kuin tehty – tehdään töitä tämän eteen yhdessä!
Tutkimusvilppi tarkoittaa Suomessa (ja laajemmin akateemisessa maailmassa) 辱ٳää, ääٱä ja plagiointia. Ellei generatiivista ٱää käytetä huolellisesti, siitä voi käytännössä tulla “täydellinen vilppikone”, koska se voi erittäin helposti syyllistyä mihin tahansa näistä kolmesta väärinkäytöksen muodosta. Tutustu riskeihin, jotka on käsitelty ohjeistuksessa.
Generatiiviset ٱäjärjestelmät sepittävät asioita koko ajan, ja näitä sepitteitä kutsutaan usein ”harhoiksi”: ne voivat olla uskottavan näköistä tekstiä, viitteitä, tilastoja tai dataa, joita ei todellisuudessa ole olemassa. Vuoden 2026 tutkimus () havaitsi, että yli 2800 vertaisarvioitua artikkelia, jotka on julkaistu kahden viime vuoden aikana, sisältää sepitettyjä viittauksia. ArXiv-preprintpalvelu on nyt ottanut käyttöön käsikirjoituksille, jotka sisältävät ٱän sepittämiä viitteitä tai muuta kiistatonta ٱäkuraa. Kustantajat ovat ottamassa käyttöön samankaltaisen linjauksen.
Tekoälyn käyttäminen viitteiden muotoilun apuna tai viite-ehdotusten tekemiseen ilman, että jokaista viitettä tarkistetaan käsin, on merkittävä riski. Tämä koskee jopa näennäisen ”turvallisia” muotoilutehtäviä: viitelistaa järjestävä ٱä voi muuttaa kirjoittajien järjestystä, julkaisuvuotta tai keksiä uuden otsikon tai lehden nimen (tämä on todennäköisempää, jos lista on pitkä). Generatiivinen ٱä on myös melko huono artikkeleiden tiivistämisessä: se liioittelee tai lisää, poistaa tai muuttaa tuloksia aina sepittämiseen asti ().
ձäٲö첹t eivät päättelyltään toimi kuten ihmiset, vaan ne ennustavat koulutusdatansa perusteella tilastollisesti todennäköisintä seuraavaa merkkiä (tokenia). Tekoälyn käyttäminen tutkimustulosten tuottamiseen tai tulkintaan luo korkean riskin virheellisille johtopäätöksille. Määrällinen ja laadullinen analyysi on tehtävä menetelmillä, jotka tutkija voi luotettavasti validoida ja toistaa (reproduktiivisuus). un ٱää käytetään ehdottamaan analyysitapaa, suorita aina keskeiset vaiheet itsenäisesti uudelleen tai varmista ne tunnetulla menetelmällä ennen kuin luotat tulokseen.
Suuret kielimallit on koulutettu käytännössä kaikella saatavilla olevalla ihmistekstillä (sekä äänillä ja kuvilla). Ne tuottavat uutta tekstiä ilmoittamatta lähteitä. Tuoreen tutkimuksen () mukaan suuresta kielimallista oli mahdollista purkaa lähes sanatarkkana jopa 95 % yhdestä Harry Potter -kirjasta. Vaikka et kopioisi ja liittäisi suoraan ٱän tuottamaa tekstiä plagioinnin välttämiseksi, ٱän käyttäminen ideoiden ”sparraajana” ja tämän jälkeen idean esittäminen omana alkuperäisenäsi, ilman että tarkistat, esiintyykö sama idea jo kirjallisuudessa, voi silti täyttää plagioinnin tunnusmerkit.
Tämä osio näkyy vain, jos olet kirjautunut sisään. Osiossa on videoita tohtoriopiskelijoiden tutkimusetiikan kurssilta, jonka opettajina ovat Arno Solin (Etiikka ٱätutkimuksessa), Enrico Glerean (Generatiivinen ٱä ja tutkimuksen integriteetti) ja Maria Rehbinder (AI-asetus). Valmistelemme MOOC-verkkokurssia, johon sisältyy näiden videoiden lisäksi paljon muutakin. Otathan yhteyttä, jos haluat osallistua MOOCin tekemiseen.
Nykyisessä ٱän aikakaudessa, jossa se laajenee kaikkiin elämämme osa-alueisiin, vastuullisia tutkijoita eivät ole ne, jotka välttelevät ٱää kokonaan, eivätkä ne, jotka delegoivat sille kaiken. Vastuulliset tutkijat ymmärtävät, miten nämä järjestelmät toimivat ja mitä niille delegoidaan. He osaavat tarkistaa tulokset, pohtia dataan ja lainsäädäntöön liittyviä riskejä, kertoa ٱän käytöstä rehellisesti ja säilyttää tutkimuksessa tarvittavat keskeiset inhimilliset taidot: lukemisen, päättelyn, dokumentoinnin, viestinnän ja vastuun kantamisen.
Tutkimuksen toistettavuus, vastuunkanto tutkimustulosten oikeellisuudesta, toisten tutkijoiden tekemän työn tunnustaminen ja kunnioittaminen, ja tiedon suojaus.
Koodiavustajat ovat AI-työkaluja, jotka auttavat kirjoittamaan ohjelmakoodia, arvioimaan sitä ja nopeuttamaan siten kehitysprosesseja.
Aallon tutkijoille, opettajille ja opiskelijoille tarjolla turvallinen tapa rakentaa suuria kielimalleja hyödyntäviä työkaluja
Opettajalle vinkkejä miten ٱän käyttöä opetuksessa voi huomioida
Tekoälyjärjestelmät ja niihin liittyvät tekijänoikeuskysymykset.