Компания Anthropic представила новую модель искусственного интеллекта Claude Mythos Preview, однако ограничила ее распространение из-за потенциальных рисков.
Доступ к системе на первом этапе получат только стратегические партнеры, среди которых крупнейшие технологические компании — Google, Apple, Microsoft, Nvidia и Amazon. Они смогут применять модель преимущественно в задачах кибербезопасности, пишет The Verge.
По данным разработчика, Claude Mythos Preview демонстрирует значительный прирост производительности и превосходит предыдущую версию Opus 4.6, представленную ранее, по большинству тестов.
Особое внимание уделяется способности модели выявлять уязвимости: система уже обнаружила тысячи ранее неизвестных проблем в операционных системах и браузерах. В качестве примеров называют уязвимости в OpenBSD и FFmpeg, существовавшие десятилетиями.
Однако такие возможности создают двойной риск — нейросеть можно использовать не только для устранения уязвимостей, но и для их эксплуатации. Именно поэтому было принято решение ограничить доступ к модели.
Отмечается, что в ходе тестирования модель в некоторых случаях предпринимала попытки выполнения запрещенных действий с последующим сокрытием, а также проявляла признаки эскалации привилегий, включая попытки извлечения учетных данных из памяти процессов.