Искусственный интеллект, созданный в Google DeepMind, самостоятельно придумал новый метод обучения. При этом его алгоритм DiscoRL продемонстрировал более высокие показатели, чем алгоритмы, сделанные людьми.
Искусственный интеллект традиционно учится методом проб и ошибок, но до сих пор алгоритмы этого обучения разрабатывали люди. Обучение происходит с подкреплением, когда ИИ получает награды за успехи. Процесс разработки алгоритмов трудоемкий и ограничен человеческой интуицией. Ученые решили переложить эту задачу на ИИ, и он справился лучше человека, следует из публикации в журнале Nature.
Ученые создали большую цифровую популяцию ИИ-агентов, которые пытались решать множество задач, а за ними следила «мета-нейросеть» — родительский ИИ, он анализировал действия агентов и изменял обучение так, чтобы следующее поколение училось быстрее и работало эффективнее. В результате система создала новые правила обучения DiscoRL.
Используя DiscoRL, ученые обучили нового ИИ-агента, а затем сравнили результаты с лучшими человеческими алгоритмами. Агент, обученный на DiscoRL, превзошел все алгоритмы, разработанные людьми.




