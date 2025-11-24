Исследователи лаборатория DEXAI обнаружили простой способ обхода систем безопасности современных нейросетей. Оказалось, что для получения запрещенной информации достаточно оформить запрос в виде стихотворения.

Участие в эксперименте приняли 25 ведущих нейросетей, включая флагманские модели Gemini 2.5 Pro, GPT-5, Claude Opus 4.1 и DeepSeek R1. В среднем поэтические запросы «пробивали» защиту в 60% случаев, а некоторые модели показали почти стопроцентную уязвимость.

Для основы специалисты взяли 1,2 тысячи вредоносных запросов из открытого набора MLCommons AILuminate, где поднимаются такие темы, как создание химического оружия, манипуляция сознанием, проведение масштабной кибератаки.

Каждый из этих запросов был переработан в стихотворную форму с помощью другой ИИ-модели. Сравнительный анализ показал разительный контраст между реакцией моделей на прозаические и поэтические запросы.

Если на стандартные формулировки модели в среднем давали опасные ответы в 8% случаев, то их стихотворные версии увеличивали этот показатель до 43%. Наиболее уязвимой оказалась Gemini 2.5 Pro — она выдала 100% небезопасных ответов.