Новую модель искусственного интеллекта признали опасной - Хайтек

Компания Anthropic представила новую модель искусственного интеллекта Claude Mythos Preview, однако ограничила ее распространение из-за потенциальных рисков.

Доступ к системе на первом этапе получат только стратегические партнеры, среди которых крупнейшие технологические компании — Google, Apple, Microsoft, Nvidia и Amazon. Они смогут применять модель преимущественно в задачах кибербезопасности, пишет The Verge.

По данным разработчика, Claude Mythos Preview демонстрирует значительный прирост производительности и превосходит предыдущую версию Opus 4.6, представленную ранее, по большинству тестов.

Особое внимание уделяется способности модели выявлять уязвимости: система уже обнаружила тысячи ранее неизвестных проблем в операционных системах и браузерах. В качестве примеров называют уязвимости в OpenBSD и FFmpeg, существовавшие десятилетиями.

Однако такие возможности создают двойной риск — нейросеть можно использовать не только для устранения уязвимостей, но и для их эксплуатации. Именно поэтому было принято решение ограничить доступ к модели.

Отмечается, что в ходе тестирования модель в некоторых случаях предпринимала попытки выполнения запрещенных действий с последующим сокрытием, а также проявляла признаки эскалации привилегий, включая попытки извлечения учетных данных из памяти процессов.