
AdobeStock © Supatman
S cieľom sprevádzať zvolanie Medzinárodnej siete inštitútov pre bezpečnosť umelej inteligencie vo Vancouveri (Kanada) sieť uverejnila výsledky svojho tretieho spoločného testovania. Cvičenie sa zameralo na hodnotenie „agentov“ – triedy pokročilých programov umelej inteligencie, ktoré autonómne zdôvodňujú, plánujú, používajú nástroje a vykonávajú úlohy. Cieľom je pokročiť v globálnom chápaní toho, ako bezpečne a spoľahlivo testovať tieto vznikajúce agensové systémy, ktoré predstavujú nové riziká v dôsledku zníženého ľudského dohľadu.
Tento tretí test bol zameraný na dve prioritné rizikové oblasti:
- Únik citlivých informácií a podvod
- Kybernetická bezpečnosť
Toto cvičenie vychádza z poznatkov z dvoch predchádzajúcich spoločných testovacích cvičení, ktoré vykonala sieť v San Franciscu (november2024) a v Paríži (február 2025). Cieľom týchto cvičení je umožniť sieti ďalej zdokonaľovať najlepšie postupy testovania pokročilých systémov umelej inteligencie.
Tradičné metódy hodnotenia sa ukázali ako nedostatočné na zachytenie zložitosti správania autonómnych činiteľov. Na riešenie tohto problému zúčastnení členovia spojili svoje kolektívne technické a jazykové odborné znalosti. Dôraz sa kládol nielen na výsledky testovania, ale aj na zlepšenie metodík, pričom sa uznalo, že malé zmeny v koncepcii hodnotenia môžu mať významný vplyv na výsledky.
Toto spoločné úsilie predstavuje dôležitý krok pri presadzovaní vedy o agentickom hodnotení a predstavuje kritickú investíciu do bezpečného a dôveryhodného vývoja pokročilých systémov umelej inteligencie.