У міру того, як інструменти штучного інтелекту еволюціонують від ізольованих чат-ботів до автономних, гіперпідключених систем, вони створюють велику нову площину для атак. Дізнайтеся, як керувати цим ризиком, приділяючи особливу увагу прозорості, агентності та семантичній безпеці, щоб захистити дедалі складнішу інфраструктуру агентних систем штучного інтелекту вашої організації.
Основні моменти
- Організації перейшли від ізольованих чат-ботів на базі ШІ до автономних, гіперпідключених агентів, здатних виконувати дії та отримувати доступ до конфіденційних внутрішніх сховищ даних, що призводить до експоненціального зростання кіберризиків.
- Виникає серйозна проблема безпеки, оскільки агентам ШІ часто надаються можливості, що значно перевищують їхні передбачувані завдання, що створює невиправдано велику та небезпечну зону ураження.
- Забезпечення безпеки агентського ШІ вимагає переходу від реактивного виявлення порушень до проактивної стратегії, заснованої на управлінні поверхнею атаки та зосередженої на повній видимості, коригуванні стану безпеки та моніторингу семантичних векторів атак.
Ось типова ситуація, з якою сьогодні часто стикаються організації: команда — чи то фінансовий відділ, відділ кадрів, чи відділ маркетингу — налаштовує ШІ-агента для виконання, здавалося б, простого завдання, наприклад, для збору інформації про завдання та надсилання її електронною поштою відповідним адресатам.
Але чи справді цей ШІ-агент такий нешкідливий, як здається? При більш уважному розгляді стає очевидним значний потенціал ризиків, пов’язаних з автономним ШІ. Цьому, здавалося б, нешкідливому ШІ-агенту надано право підключатися до сховища конфіденційних даних і виводити ці дані. Чи безпечно це? Чи був він налаштований належним чином?
А тепер уявіть собі, що цей сценарій повторюється тисячу разів — або навіть більше. Процес запуску автономних ШІ-агентів стає повсякденною рутиною, оскільки постачальники ШІ-рішень дедалі більше спрощують їх налаштування. Таким чином, прагнучи автоматизувати процеси та підвищити продуктивність, типова сучасна організація може мати у своєму розпорядженні тисячі автономно працюючих ШІ-агентів.
Для фахівців з кібербезпеки широке поширення ШІ-агентів становить серйозну нову проблему. Як забезпечити безпеку тисяч ШІ-агентів, здатних діяти самостійно та тісно взаємопов’язаних між собою, а також із незліченними внутрішніми та зовнішніми системами й сховищами даних?
У цій статті детально розглянемо цей ризикований сценарій і визначимо правильний підхід до захисту цієї нової площини атаки, що утворилася внаслідок стрімкого поширення ШІ-агентів.
Проблема безпеки агентного ШІ має три аспекти
Перша хвиля інструментів ШІ, які організації почали впроваджувати ще у 2022 році, в основному складалася з ізольованих чат-ботів, які працювали практично без інтеграції з іншими корпоративними системами. Таким чином, вони мали обмежений доступ до внутрішніх баз даних або не мали його взагалі і не могли виконувати дії у внутрішніх системах.
Як багато може змінитися за кілька років. Сьогодні організації буквально завалені інструментами ШІ з автономними функціями, потенціал яких у плані кіберризиків зростає в геометричній прогресії завдяки трьом ключовим факторам: гіперпов’язаності, автономності та семантиці.
Давайте детальніше розглянемо, як кожна з цих характеристик інструментів ШІ сприяє формуванню великої поверхні атаки, яку повинні захищати фахівці з кібербезпеки.
Гіперпов’язаність
Вам необхідно проаналізувати ландшафт автономних інструментів ШІ у вашій організації та розглядати його не як набір окремих ресурсів, а як систему, що складається з безлічі взаємопов’язаних компонентів.
Деякі з цих компонентів є внутрішніми, а інші — зовнішніми. Деякі були розроблені власними силами, а інші — сторонніми постачальниками. Деякі розміщені в хмарі, інші — на кінцевих пристроях, а треті — на платформах штучного інтелекту.
Фахівці з кібербезпеки повинні не тільки виявляти всі ці компоненти ШІ, де б вони не знаходилися, а й розуміти, як вони пов’язані між собою та як взаємодіють.
Наприклад, в організації може бути встановлений ШІ-агент Copilot Studio, призначений для узагальнення інформації, отриманої з Інтернету. Однак у цій гіпотетичній конфігурації цей агент також взаємодіє з іншим агентом, побудованим на базі AWS Bedrock, який забезпечує виконання деяких ваших критично важливих процесів у хмарі.
А що, якщо агент Copilot Studio отримає непряму підказку з Інтернету, яка, у свою чергу, надасть зловмиснику можливість втрутитися у критично важливі хмарні операції, до яких має доступ агент AWS Bedrock? І ось те, що здавалося простим впровадженням агентського ШІ, раптом перетворилося на небезпечну комбінацію з потенційно катастрофічними наслідками.

Крім того, середовище налаштування інструментів ШІ стає дедалі складнішим. Це означає, що фахівцям із кібербезпеки не можна обмежуватися лише перевіркою та схваленням продуктів ШІ, таких як Anysphere’s Cursor, Anthropic’s Claude Code або Microsoft’s Copilot, у відриві від реального контексту.
Як тільки організація дає дозвіл на використання інструменту штучного інтелекту, ІТ-відділ приступає до його налаштування різними способами та інтеграції з внутрішніми системами, що створює ризик неправильного налаштування та небезпечних підключень. Запитайте себе: куди надходить код, згенерований інструментом штучного інтелекту?
Крім того, чи знаєте ви, що такі інструменти, як Claude Code та Cursor, можна налаштувати на роботу в «режимі агента», що дозволяє їм виконувати команди на кінцевих пристроях, фактично діючи як повноцінні автономні агенти?
Нарешті, умови використання цих інструментів штучного інтелекту швидко й постійно змінюються, оскільки вони обробляють дедалі більший обсяг різноманітних даних, що може зробити їх вразливими до зловмисних маніпуляцій.
Автономність
Ось сувора реальність: ми створюємо системи, здатні діяти автономно, але забезпечуємо їхню безпеку так, ніби вони до цього не здатні. І це проблема, оскільки люди вже практично не беруть участі в процесі прийняття рішень, коли йдеться про ШІ. До того ж системи ШІ — це не детерміновані системи, як традиційне ІТ-обладнання, а ймовірнісні, а це означає, що їхні результати важко передбачити. Для команд з кібербезпеки це означає кардинальні зміни.
Найімовірніше, наступний серйозний інцидент у сфері кібербезпеки ШІ, з яким вам доведеться зіткнутися, буде спричинений не зламом, а дією, яку було дозволено виконати одній із ваших систем ШІ.
Розглянемо це детальніше. Існує три основні компоненти агентства ШІ:
- Мета: Створення ШІ-агента для складання коротких зведень новин, електронних листів або завдань.
- Можливості: Часто ШІ-агент здатний виконувати певні дії, що виходять за межі необхідного для досягнення поставленої мети.
- Сфера впливу: Це все, що може піти не так, якщо можливості ШІ-агента опиняться під загрозою.
Проблема полягає в тому, що досить часто можливості ШІ-агента — тобто завдання, які він здатний виконувати — перевищують ті цілі, для досягнення яких він був створений. Іншими словами, більшість ШІ-агентів мають надто широкі повноваження. Цей розрив між можливостями та цілями призводить до надмірного зростання кіберризиків.
Проблема ускладнюється тим, що організації схильні довіряти ШІ, внаслідок чого контроль з боку людини над цими системами, як правило, є мінімальним.
Семантика
Хоча у сфері кібербезпеки традиційно покладаються на точне збіг даних, щоб переконатися в тому, що система не піддавалася злому, цей підхід не працює у випадку з системами штучного інтелекту, які спираються на зміст, а не на суворий синтаксис.
Саме тому зловмиснику легко обійти традиційні заходи захисту, змінюючи вхідні дані, що обробляються інструментом ШІ, за допомогою синонімів, друкарських помилок, перефразувань та інших подібних лінгвістичних хитрощів. Вкрай складно відстежувати цей обширний і постійно розширюваний семантичний вектор атак та запобігати отруєнню моделей, маніпуляціям з результатами та атакам із використанням підстановки в командному рядку.
Іншими словами, зловмисникам більше не потрібно обходити засоби захисту. Їм достатньо обійти їх, використовуючи семантичні прийоми.
Як забезпечити безпеку агентного ШІ?
Історично склалося так, що стратегії кібербезпеки були зосереджені на реактивному виявленні порушень та реагуванні на них. Однак для захисту ваших ШІ-агентів вкрай важливо перейти до превентивного, проактивного підходу, заснованого на управлінні ризиками. Таким чином, ви зможете зрозуміти динаміку роботи ШІ-агентів та їхні можливості під час виконання, а також усунути помилки в налаштуваннях і вразливості до того, як зловмисники скористаються ними.
Для забезпечення ефективного управління та безпеки агентного ШІ необхідно базувати свою стратегію управління ризиками на трьох основних принципах:
Видимість
Вам необхідно провести інвентаризацію всіх ШІ-агентів у вашому середовищі, а також їх окремих компонентів, незалежно від того, де вони знаходяться — на кінцевих пристроях, у хмарі, на ШІ-платформах або в локальній інфраструктурі.
Але цього недостатньо. Вам також необхідно знати про кожного агента наступне:
- Дані, на яких він був навчений, база знань, з якої він черпає інформацію, та сховища даних, до яких він підключений.
- Можливості, якими він володіє, такі як дії, які він може виконувати, та протоколи поведінки, що регулюють його роботу.
- Зв’язки, які він має з іншими системами як всередині вашої організації, так і за її межами; з іншими ШІ-агентами; а також з ШІ-користувачами та користувачами, які не використовують ШІ.
- Його наміри, такі як його цілі, а також радіус впливу
Позиція
Вам необхідно розуміти, що саме може робити ШІ-агент у рамках ширшої динамічної системи, а також у чому його можливості виходять за межі поставлених цілей, щоб ви могли коригувати коло його повноважень без шкоди для його ефективності.
Припустимо, у вас є кілька ШІ-агентів, які інтегровані між собою та взаємодіють один з одним, і ці агенти можуть, наприклад, підключатися до Інтернету та до вашого найбільш вразливого хмарного середовища. Вкрай важливо розуміти, на що здатна ця динамічна мультиагентна система в реальних умовах, щоб виявити будь-які потенційно небезпечні комбінації серед її компонентів.
Завдяки цим даним ви зможете точно визначити заходи щодо усунення вразливостей у системі безпеки, спричинених небезпечними комбінаціями ШІ.
Виявлення загроз
Як тільки ви зрозумієте, на що здатний цей динамічний кластер із безлічі агентів, вам потрібно навчитися виявляти тривожні сигнали у вашому середовищі виконання, щоб постійно знижувати вразливість системи.
Висновок
Безпека ШІ має бути забезпечена в усіх аспектах вашого середовища, а досягти цього можна шляхом впровадження платформи управління ризиками та відповідної стратегії.
Коротко кажучи, управління ризиками дозволяє фахівцям з кібербезпеки виявляти всі ресурси у вашому середовищі — не лише системи штучного інтелекту, а й ІТ-рішення, хмарні сервіси, системи управління ідентифікацією та обладнання операційних технологій. На цій основі воно допомагає оцінювати, розставляти пріоритети та координувати заходи з усунення вразливостей по всій поверхні атаки ШІ, забезпечуючи вам контроль над цим новим середовищем, в якому у вашій інфраструктурі з’являється дедалі більше агентів ШІ.
Джерело: Mastering agentic AI security through exposure management
