Алгоритм AlphaZero стал гроссмейстером трех игр

Новости

Главная Лучшие Популярные Список Добавить

Новости > Hi-Tech > Программы

Разместил: Писатель Дата: 11.12.2018 Прочитано: 159

AlphaZero — новый алгоритм от DeepMind — продолжает дело своего предшественника AlphaGo. Только играет он на высшем уровне сразу в несколько игр, и научился этому не подглядывая в партии гроссмейстеров-людей.

В 2015 году Google DeepMind разработала алгоритм AlphaGo для игры в го. Используя силу машинного обучения, уже в 2016 году AlphaGo расправился с сильнейшим игроком в го среди людей — Ли Седолем. Это был первый случай победы алгоритма над профессионалом такого уровня. Сразу после игры Корейская ассоциация го присвоила AlphaGo высший уровень мастерства.

Этот матч по важности сравнивают с шахматным матчем между программой Deep Blue и Гарри Каспаровым. С тем лишь нюансом, что освоить го машине намного сложнее.

Но несмотря на всю сложность и отточенность, этот алгоритм был узкоспециализированным. Поэтому сразу после этого специалисты DeepMind принялись за разработку более универсального игрового ИИ — AlphaZero. Он обучается сразу трем настольным играм: помимо го, это традиционные шахматы, а также японские шахматы — сеги.

Zero получился более сбалансированным и совершенным. Всего за три дня и без какого-либо вмешательства человека он стал гроссмейстером во всех трех дисциплинах, пишет Ars Technica.

Сооснователь DeepMInd Демис Хассабис объясняет:

«Начиная с совершенно случайных действий в игре, AlphaZero постепенно доходит до представления о том, как выглядит хороший матч. Он формирует собственные оценки об игре. В этом смысле он свободен от тех ограничений, которые присущи людям, когда они думают о построении стратегий».

В этом важнейшее отличие от предыдущей версии. Для победы над Ли Седолем алгоритму были необходимы примеры успешных партий мастеров го. Zero достаточно только правил игры. Алгоритм стал полностью независимым от человека.

После трехдневного обучения Zero победил в го подряд в 100 партиях.

Секретным ингредиентом стало обучение с подкреплением. Этот подход позволил существенно уменьшить необходимые для алгоритма ресурсы. Чтобы дойти до уровня AlphaGo алгоритму Zero пришлось отыграть 4,9 млн партий. Сам AlphaGo шел к своему уровню мастерства через 30 млн партий.

Шахматный гроссмейстер Гарри Каспаров с восхищением пишет об алгоритме: «Вместо того, чтобы обрабатывать человеческие инструкции и знания с огромной скоростью, как все предыдущие шахматные машины, AlphaZero генерирует свои собственные знания. Это происходит всего за несколько часов, и результаты превосходят любого человека или машину».

В DeepMind все же отмечают, что их алгоритм имеет дело хоть и с огромным, но ограниченным количеством исходов игр. Это можно воспринимать как сильно упрощенную модель реального мира, но не сам мир. Поэтому в более широком применении даже AlphaGo пока будет слаб.

Игры же остаются важным полигоном для отработки алгоритмов. Недавно нейросеть, разработанная специалистами компаний OpenAI и DeepMind, превзошла людей в серии классических игр на приставке Atari 2600.

Смотрите также связанные новости

	12.02.2019 - Microsoft в 2019 году полностью изменил меню «Пуск» в Windows 10
	12.02.2019 - В интернет-магазинах «засветились» карты ZOTAC GeForce GTX 1660 Ti
	12.02.2019 - Ученые оценили готовность людей к войне с роботами
	12.02.2019 - Черные дыры помогут ученым обнаружить новые сверхлегкие частицы
	10.02.2019 - Планируется выпуск новой крупнейшей яхты с названием Valkyrie
	10.02.2019 - Флагманы Samsung Galaxy S10 получат минимум 128 ГБ ПЗУ
	09.02.2019 - Выходец из России выяснил, как ускорить аналоговый квантовый компьютер
	08.02.2019 - Управление мозгом человека
	03.02.2019 - В AnTuTu назвали самые мощные смартфоны января
	02.02.2019 - Тачка на прокачку ДВА
	28.01.2019 - Робофест - 2019
	26.01.2019 - Стала известна дата презентации нового Android Q
	24.01.2019 - Секрет графики от Intel и будущее CPU
	22.01.2019 - Модики в России тестируют устройство для общения с помощью силы мысли
	19.01.2019 - T800 Arm
	19.01.2019 - Северный магнитный полюс перемещается из Канады в Сибирь
	19.01.2019 - Microsoft снова заставила пользователей обновить Windows 10
	17.01.2019 - Huawei Mate 20 и Mate 20 PRO
	17.01.2019 - Опубликовано живое фото флагманского смартфона Samsung Galaxy S10+
	17.01.2019 - Ученые МФТИ нашли способ для создания лазера размером с бактерию

Нет комментариев. Почему бы Вам не оставить свой?

Вы не можете отправить комментарий анонимно, пожалуйста войдите или зарегистрируйтесь.

Нет содержания для этого блока!

	Главная
	Анекдоты
	Гороскоп
	Карта сайта
	Каталог сайтов
	Новенькое на БОРЩЕЦЕ
	Опросы
	Сонник
	Статьи
	Уроки 2D графики
	Это ИНТЕРЕСНО

	Nikon
	Canon
	Sony
	Pentax
	Olympus
	Samsung
	Fujifilm
	Kodak
	Panasonic
	Hasselblad
	Mamiya
	Да я вообще не фотографирую и нет у меня фотоаппарата

Основные разделы

Последние новости

Опросы

Добавить проект

Новости

Алгоритм AlphaZero стал гроссмейстером трех игр

Смотрите также связанные новости