Hallusinaatioista

Tekoälyn hallusinointi on ilmiö, jossa suuri kielimalli havaitsee malleja ja kohteita, jotka eivät ole olemassakaan. Tämän takia tekoäly alkaa tuottaa tuloksia, jotka ovat järjettömiä tai epätarkkoja.

Näillä hallusinaatioilla voi olla kohtalokkaitakin seurauksia mm. terveydenhuollon alalla. Samoin tekoälyn hallusinointi voi johtaa disinformaation leviämiseen. Keskeisimpiä syitä hallusinaatioihin ovat syötevinoumat (input bias) ja kehotteiden ristiriitainen käyttö.

Jotta laajat kielimallit voisivat toimia, on niitä opetettava laajalla määrällä dataa. Jos tämä koulutusdata sisältää ennakkoluuloja ja puolueellisia näkemyksiä, niin ne siirtyvät sellaisinaan kielimalliin. Tästä hyvänä esimerkkinä voidaan mainita Googlen Bard (nykyinen Gemini), joka väitti James Webb -avaruusteleskoopin ottaneen ensimmäisenä kuvan aurinkokuntamme ulkopuolisesta planeetasta.

Googlen Bard hallusinoi

Tämä sinänsä harmiton virhe voisi sattua kenelle tahansa, mutta koneen kohdalla se merkitsee aina vakavampaa ongelmaa, koska tietokone ei ole samassa mielessä erehtyväinen kuin ihminen.

Tekoälymalleja voidaan myös manipuloida vahingossa ja tarkoituksellisesti hallusinoimaan. Kun tekoälylle annetaan tarpeeksi ristiriitaisia kehotteita, niin se voi hämmentyä ja alkaa tuottaa tekaistua sisältöä. Tämä johtuu siitä, että tekoäly on tehty tuottamaan tuloksia, vaikka se olisi hämmentynyt. Tekoälyn kehittämisessä ja käytössä on otettava nämä uhkat tosissaan ja niitä varten tulee suojautua entistä tarkemmin.

Miten estää hallusinointi?

Kun me käytämme tekoälyä, niin me voimme estää hallusinointia toimenpiteillä. Osa näistä toimenpiteistä on huomattavan yksinkertaisia.

Laadukas koulutusdata

Koulutusaineiston laatu ja relevanssi määrittävät miten malli käyttäytyy ja minkälaisia tuloksia se tulee tuottamaan. Hallusinoinnin välttämiseksi tekoälyn kouluttamiseen käytetyn datan tulisi olla mahdollisimman monipuolista, tasapainoista ja rakenteeltaan selkeää.

Tekoäly on kuin opiskelija, jonka menestyminen elämässä on käytettyjen oppikirjojen sisällön varassa. Tämän takia parhaat kielimallit perustuvat kattaviin tietojoukkoihin, jotka ova rakenteellisesti koherentteja. Tietenkin yksittäinen käyttäjä ei kykene paljoakaan vaikuttamaan käytettävän kielimallin koulutusdataan, mutta tämä on hyvä pitää mielessä, kun annamme kielimallin käsiteltäväksi yksittäisiä dokumentteja. Mitä sekavampaa käsiteltävä aineisto on, sitä suurempi vaara on tekoälyn tuottamien tulosten olevan hallusinaation tulosta.

Määritä tekoälylle selkeä tarkoitus

Käytettäessä tekoälyä sille on hyvä määrittää selkeä tarkoitus. Mitä sen käytöltä halutaan? Monet käyttävät tekoälyä Googlen tai muiden hakukoneiden korvikkeena ja sellaisena se itse asiassa ei ole kovin hyvä tai tehokas. Mutta jo olemassa olevan materiaalin läpikäymisessä, uudelleen muokkaamisessa ja toiseen muotoon muuttamisessa tekoäly on mitä mainioin työkalu.

Tämä tulee esille erityisesti yritysten ja organisaatioiden käyttäessä tekoälyä. On hyvä määritellä yhdessä kaikki ne käyttötavat, joihin tekoälyä tullaan käyttämään. Tekoälylle voidaan myös kertoa, että missä roolissa sen odotetaan toimivan. Tämä auttaa järjestelmää suorittamaan tehtävät tehokkaammin ja vähentää hallusinointia.

Rajoita vastauksia

Tekoälymallit voivat alkaa tuottaa perätöntä sisältöä, koska sille ei ole asetettu rajoituksia. Tämän takia välillä on hyvä antaa tekoälylle rooli, jonka pohjalta sen odotetaan toimivan.

Inhimillinen valvonta

Ihminen on aina vastuussa tekoälyn tuottaman sisällön levittämisestä. Me emme voi ulkoistaa vastuuta tekoälylle, vaan meidän tulee tarkistaa, että tuotettu lopputulos on oikeanlainen.

Kehotteiden kirjoittaminne ja hallusinointi

Estääksemme tekoälyä hallusinoimasta meidän tulee noudattaa muutamia hyvin yksinkertaisia ja selkeitä ohjeita kirjoittaessamme kehotteita.

Selkeät ja yksityiskohtaiset kehotukset

Vältä epämääräisiä ohjeita. Olen mahdollisimman tarkka ja yksityiskohtainen. Näin tekoäly ymmärtää paremmin, minkälaisia lopputuloksia siltä odotetaan.

  • Epäselvä kehote:
    ”Kerro minulle koirista.”
  • Selkeä kehote:
    ”Tee minulle yksityiskohtainen kuvaus kultaisen noutajan fyysisistä ominaisuuksista ja temperamentista.”

Epäselvä kehote tuottaa tulokseksi hyvin geneerisen vastauksen. Vastaus voi olla täysin oikea, mutta näin geneerisen kehotteen kohdalla tekoäly voi alkaa hallusinoida. Selkeä kehote tekee hyvin selväksi, mitä tekoälyltä halutaan lopputulokseksi.

Ankkurointi/maadoitus

Liitä tahdottu lopputulos johonkin tiettyyn lähteeseen tai näkökulmaan. Tekoäly kykenee täten ymmärtämään paremmin, miten rajoittaa lopputuloksen antamista.

  • Ankkuroimaton kehote:
    ”Mitä on rauha?”
  • Ankkuroitu kehote:
    ”Mitä on rauha Wikipedian mukaan?”

Ankkuroimaton kehote on taas hyvin geneerinen ja hallusinaatioiden vaara on ilmeinen. Mutta kun kehote ankkuroidaan käyttämään jotain tiettyä lähdettä (kuten Wikipedia), niin tekoäly tietää keskittyä lähteen sisältöön vastauksen muodostamisessa.

Rajoitukset ja säännöt

Anna kehotteessa tekoälylle selkeät rajoitukset tai säännöt. Näin tekoälyn on helpompi ymmärtää, mitä siltä odotetaan lopputulokseksi.

  • Rajoittamaton kehote:
    ”Kirjoita minulle rakkausruno.”
  • Rajoitettu kehote:
    ”Kirjoita sonetti rakkaudesta, jossa on 14 säettä ja kussakin säkeessä 10 tavua.”

Kun tekoälylle annetaan selkeät rajat ja säännöt, joita sen tulee noudattaa lopputuloksen tuottamisessa, niin hallusinaatioiden määrä vähenee huomattavasti.

Monivaiheiset kehotteet

Jaa monimutkaiset kysymykset pienempiin osiin. Kehotteen jakaminen useampaan osaan laittaa tekoälyn ottamaan vastaan lisää tietoa ennen lopullisen vastauksen antamista.

  • Yksivaiheinen kehote:
    ”Miten diabetesta hoidetaan?”
  • Monivaiheinen kehote:
    ”Mitkä ovat yleisimmät käytetyt hoidot diabeteksen hoitoon?”
    Vastauksen saatuamme voimme jatkaa kehotetta:
    ”Mitä näistä hoidoista on tutkitusti tehoikkaimpia?”

Kehotteita kirjoitettaessa kannattaa käyttää keskustelevaa tyyliä mahdollisimman usein. Kun tekoäly antaa jonkun geneerisen ja epämääräisen vastauksen, niin siitä huomauttaminen tai syventävän kysymyksen esittäminen antaa sille paremmat edellytykset ymmärtää, mitä lopputulokseksi haetaan.

Roolin määrittäminen

Määrittele tekoälylle rooli, mikä auttaa kohdentamaan lopputuloksen tarkemmin. Roolittaminen rohkaisee tekoälyä toimimaan paremmin juuri tahdotussa osaamisalueessa ja estää tehokkaasti hallusinaatioita.

  • Kehote ilman roolia:
    ”Mitä on metsäkato?”
  • Kehote roolilla:
    ”Kuinka lähestyisit metsäkadon ongelmaa ilmastotieteilijänä sen ympäristövaikutusten minimoimiseksi?”

Jälkimmäinen kehote asettaa tekoälylle selkeän roolin, jonka puitteissa sen odotetaan toimivan. Ilman tätä rajoitetta tekoäly voisi tuottaa vastauksen myös ilmastomuutoksen kieltävästä näkökulmasta.

Kontekstuaalisen tiedon lisääminen

Tarjoa riittävästi taustietoa tekoälylle, jotta se ymmärtää paremmin tehtävän vaatimukset. Kontekstuaalilseen tietoon sisältyvät mm. avainsanat, tagit, kategoriat, esimerkit, referenssit ja lähteet.

Lopuksi voidaan mainita, että tekoälyn tekemät hallusinaatiot vähenevät sitä myötä, kun teknologia kehittyy ja käyttäjien taidot paranevat. Tästä huolimatta kannattaa aina suhtautua tietyllä varauksella tekoälyn tuottamiin lopputuloksiin. Terveellä järjellä ja asioiden tarkistamisella säästyy suuremmilta ongelmilta melkein kokonaan.

Promptaus | Miksi hyvät kehotteet ovat tärkeitä tekoälylle?
Selkeys, täsmällisyys ja konteksti | Hallusinaatioista