Алан Тьюринг и Премия Тьюринга
Именитый математик Алан Тьюринг, чье имя носит Премия Тьюринга, издал статью «Вычислительные машины и разум» в 1950-х годах, вопросив, могут ли компьютеры думать. Эта работа затрагивала схожие концепции относительно обучения на основании опыта.
Работы Энди Барто и Ричарда Саттона
Энди Джи. Барто, профессор-эмерит Университета Массачусетса, и Ричард С. Саттон, профессор Университета Альберты, разработали ключевые алгоритмы и теории в рамках усиленного обучения. Их работы начались еще в 1980-х годах и включают технику обучения под названием «обучение с временными разностями».
- Инициативы начались в 1980-х годах.
- Разработка техники обучения с временными разностями.
- Публикация учебника «Введение в усиленное обучение».
Роль усиленного обучения и Google Deepmind
Усиленное обучение получило значительное внимание благодаря Google Deepmind, который создал ИИ, победивший лучших в мире игроков в AlphaGo. Недавно китайская стартап-компания DeepSeek попала в заголовки газет, опираясь на усиленное обучение для создания более эффективных моделей.
Тьюринговская премия или «Нобелевская премия по вычислительной технике»
Тьюринговская премия, организуемая ACM, часто сравнивается с Нобелевской премией, однако и Нобелевская премия все чаще касается компьютерной сферы. Так, Джефф Хинтон и Джон Хопфилд получили Нобелевскую премию по физике за их работу в области искусственного интеллекта.
Наследие исследований в области усиленного обучения
Президент ACM Янис Иоаннидис отмечает, что исследования Бартo и Саттона продолжат вносить вклад в развитие ИИ и иных дисциплин, открывая новые перспективы для открытий в вычислительной технике и за ее пределами.








