Одним із найбільш важливих аспектів цієї атаки є те, як зловмисники спочатку почали співпрацювати з Claude. Вони не використовували програмну вразливість і не обходили елементи керування аутентифікацією, а замість цього використовували введення підказок (prompt injection), щоб обійти захисні механізми моделі:
«Ключем була рольова гра: зловмисники-оператори стверджували, що вони є співробітниками легітимних кібербезпекових фірм, і переконали Claude, що його використовують для захисного тестування кібербезпеки».
Введення підказок, за допомогою якого зловмисники використовують інструкції у запитах для виклику зловмисної або небажаної поведінки моделі, є ризиком номер один у переліку OWASP Top 10 Risks для LLM-застосунків, оскільки вона становить потенційний “парадний вхід” до корпоративних систем ШІ, що вимагає рішучого захисту.
CrowdStrike підтримує найбільш повну в галузі таксономію введення підказок завдяки придбанню Pangea, відстежуючи понад 150 різних технік. Підприємства, які створюють та розгортають власні системи ШІ, також повинні усвідомити, що ці системи можуть бути піддані маніпуляції та використані як зброя за допомогою введення підказок.
Традиційні засоби контролю безпеки, такі як фаєрволи, антивіруси та контроль доступу, не захищають від зловмисників, які можуть успішно переконати систему ШІ повернути інформацію або виконати дію всупереч її початковому призначенню та обмеженням.
Це вимагає нової групи засобів контролю безпеки, спеціально розробленої для систем ШІ: для виявлення введення підказок, перевірки контексту, фільтрації вихідних даних та моніторингу поведінки взаємодій зі ШІ. Підприємства повинні впроваджувати захисні бар’єри, які перевіряють легітимність запитів, підтверджують, що дії ШІ узгоджуються з авторизованими сценаріями використання та виявляють маніпуляції системи ШІ для виконання несанкціонованих дій.
Площина атаки розширилася до семантичного рівня. Ми витратили десятиліття на захист кінцевих точок, застосунків, мереж, облікових даних та хмарних середовищ – тепер настав час захищати це.
Компанія iIT Distribution є дистриб’ютором рішень CrowdStrike в Україні, країнах Східної Європи, Середньої Азії та Балтії. CrowdStrike – лідер індустрії кіберзахисту, який активно впроваджує передові технології штучного інтелекту у свої рішення.