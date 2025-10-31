Искусственный интеллект, созданный в Google DeepMind, самостоятельно придумал новый метод обучения. При этом его алгоритм DiscoRL продемонстрировал более высокие показатели, чем алгоритмы, сделанные людьми.

Искусственный интеллект традиционно учится методом проб и ошибок, но до сих пор алгоритмы этого обучения разрабатывали люди. Обучение происходит с подкреплением, когда ИИ получает награды за успехи. Процесс разработки алгоритмов трудоемкий и ограничен человеческой интуицией. Ученые решили переложить эту задачу на ИИ, и он справился лучше человека, следует из публикации в журнале Nature.

Ученые создали большую цифровую популяцию ИИ-агентов, которые пытались решать множество задач, а за ними следила «мета-нейросеть» — родительский ИИ, он анализировал действия агентов и изменял обучение так, чтобы следующее поколение училось быстрее и работало эффективнее. В результате система создала новые правила обучения DiscoRL.

Используя DiscoRL, ученые обучили нового ИИ-агента, а затем сравнили результаты с лучшими человеческими алгоритмами. Агент, обученный на DiscoRL, превзошел все алгоритмы, разработанные людьми.



