
Kanadassa Vancouverissa sijaitsevan kansainvälisen tekoälyn turvallisuuslaitosten verkoston koollekutsumisen yhteydessä verkosto julkaisi kolmannen yhteisen testaustoimensa tulokset. Harjoituksessa keskityttiin arvioimaan ”agensseja” eli kehittyneiden tekoälyohjelmien luokkaa, joka itsenäisesti syyttää, suunnittelee, käyttää työkaluja ja suorittaa tehtäviä. Tavoitteena on edistää maailmanlaajuista ymmärrystä siitä, miten näitä kehittyviä agenttijärjestelmiä, jotka aiheuttavat uusia riskejä ihmisen valvonnan vähenemisen vuoksi, voidaan testata turvallisesti ja luotettavasti.
Kolmannessa testissä keskityttiin kahteen ensisijaiseen riskialaan:
- Arkaluonteisten tietojen vuotaminen ja petokset
- Kyberturvallisuus
Tämä arviointi perustuu näkemyksiin kahdesta aiemmasta yhteisestä testauksesta, jotka verkosto toteutti San Franciscossa (marraskuu2024) ja Pariisissa (helmikuu 2025). Näiden harjoitusten tavoitteena on antaa verkostolle mahdollisuus tarkentaa kehittyneiden tekoälyjärjestelmien testaamiseen liittyviä parhaita käytäntöjä.
Perinteiset arviointimenetelmät ovat osoittautuneet riittämättömiksi kuvaamaan autonomisten aineiden käyttäytymisen monimutkaisuutta. Tätä varten osallistujajäsenet kokosivat yhteen kollektiivisen teknisen ja kielellisen asiantuntemuksensa. Arvioinnissa painotettiin tulosten testaamisen lisäksi myös menetelmien parantamista. Arvioinnin suunnittelussa tehdyt pienet muutokset voivat vaikuttaa tuloksiin merkittävästi.
Tämä yhteistyö on tärkeä askel agenttiarvioinnin tieteen edistämisessä ja kriittinen investointi kehittyneiden tekoälyjärjestelmien turvalliseen ja luotettavaan kehittämiseen.