Ник:
Пароль:

Опросы

Какой фирмы Вы предпочитаете фототехнику?

Nikon
Canon
Sony
Pentax
Olympus
Samsung
Fujifilm
Kodak
Panasonic
Hasselblad
Mamiya
Да я вообще не фотографирую и нет у меня фотоаппарата


Результаты
Другие опросы

Всего голосов: 186
Комментарии: 4

Добавить проект

global ; echo (2); ?>

Новости



Новости > Hi-Tech > Программы

Алгоритм AlphaZero стал гроссмейстером трех игр

0
Разместил: Писатель Дата: 11.12.2018 Прочитано: 159
Программы

 

AlphaZero — новый алгоритм от DeepMind — продолжает дело своего предшественника AlphaGo. Только играет он на высшем уровне сразу в несколько игр, и научился этому не подглядывая в партии гроссмейстеров-людей.



В 2015 году Google DeepMind разработала алгоритм AlphaGo для игры в го. Используя силу машинного обучения, уже в 2016 году AlphaGo расправился с сильнейшим игроком в го среди людей — Ли Седолем. Это был первый случай победы алгоритма над профессионалом такого уровня. Сразу после игры Корейская ассоциация го присвоила AlphaGo высший уровень мастерства.

Этот матч по важности сравнивают с шахматным матчем между программой Deep Blue и Гарри Каспаровым. С тем лишь нюансом, что освоить го машине намного сложнее.

Но несмотря на всю сложность и отточенность, этот алгоритм был узкоспециализированным. Поэтому сразу после этого специалисты DeepMind принялись за разработку более универсального игрового ИИ — AlphaZero. Он обучается сразу трем настольным играм: помимо го, это традиционные шахматы, а также японские шахматы — сеги.

Zero получился более сбалансированным и совершенным. Всего за три дня и без какого-либо вмешательства человека он стал гроссмейстером во всех трех дисциплинах, пишет Ars Technica.

Сооснователь DeepMInd Демис Хассабис объясняет:

«Начиная с совершенно случайных действий в игре, AlphaZero постепенно доходит до представления о том, как выглядит хороший матч. Он формирует собственные оценки об игре. В этом смысле он свободен от тех ограничений, которые присущи людям, когда они думают о построении стратегий».

В этом важнейшее отличие от предыдущей версии. Для победы над Ли Седолем алгоритму были необходимы примеры успешных партий мастеров го. Zero достаточно только правил игры. Алгоритм стал полностью независимым от человека.

После трехдневного обучения Zero победил в го подряд в 100 партиях.

Секретным ингредиентом стало обучение с подкреплением. Этот подход позволил существенно уменьшить необходимые для алгоритма ресурсы. Чтобы дойти до уровня AlphaGo алгоритму Zero пришлось отыграть 4,9 млн партий. Сам AlphaGo шел к своему уровню мастерства через 30 млн партий.

Шахматный гроссмейстер Гарри Каспаров с восхищением пишет об алгоритме: «Вместо того, чтобы обрабатывать человеческие инструкции и знания с огромной скоростью, как все предыдущие шахматные машины, AlphaZero генерирует свои собственные знания. Это происходит всего за несколько часов, и результаты превосходят любого человека или машину».

В DeepMind все же отмечают, что их алгоритм имеет дело хоть и с огромным, но ограниченным количеством исходов игр. Это можно воспринимать как сильно упрощенную модель реального мира, но не сам мир. Поэтому в более широком применении даже AlphaGo пока будет слаб.

Игры же остаются важным полигоном для отработки алгоритмов. Недавно нейросеть, разработанная специалистами компаний OpenAI и DeepMind, превзошла людей в серии классических игр на приставке Atari 2600.

Смотрите также связанные новости

12.02.2019 - Microsoft в 2019 году полностью изменил меню «Пуск» в Windows 10
12.02.2019 - В интернет-магазинах «засветились» карты ZOTAC GeForce GTX 1660 Ti
12.02.2019 - Ученые оценили готовность людей к войне с роботами
12.02.2019 - Черные дыры помогут ученым обнаружить новые сверхлегкие частицы
10.02.2019 - Планируется выпуск новой крупнейшей яхты с названием Valkyrie
10.02.2019 - Флагманы Samsung Galaxy S10 получат минимум 128 ГБ ПЗУ
09.02.2019 - Выходец из России выяснил, как ускорить аналоговый квантовый компьютер
08.02.2019 - Управление мозгом человека
03.02.2019 - В AnTuTu назвали самые мощные смартфоны января
02.02.2019 - Тачка на прокачку ДВА
28.01.2019 - Робофест - 2019
26.01.2019 - Стала известна дата презентации нового Android Q
24.01.2019 - Секрет графики от Intel и будущее CPU
22.01.2019 - Модики в России тестируют устройство для общения с помощью силы мысли
19.01.2019 - T800 Arm
19.01.2019 - Северный магнитный полюс перемещается из Канады в Сибирь
19.01.2019 - Microsoft снова заставила пользователей обновить Windows 10
17.01.2019 - Huawei Mate 20 и Mate 20 PRO
17.01.2019 - Опубликовано живое фото флагманского смартфона Samsung Galaxy S10+
17.01.2019 - Ученые МФТИ нашли способ для создания лазера размером с бактерию


Нет комментариев. Почему бы Вам не оставить свой?
Вы не можете отправить комментарий анонимно, пожалуйста войдите или зарегистрируйтесь.

Нет содержания для этого блока!