О книге: Глубокое обучение с подкреплением. AlphaGo и другие технологии; Издательский дом "Питер", 2020

от 1092 р. до 2659 р.

Где купить

О книге


ПараметрЗначение
Автор(ы)
ПереплетМягкий (3)
ИздательИздательский дом "Питер"
Год издания2020
Возрастные ограничения16
Кол-во страниц496
СерияДля профессионалов
Формат164x233мм
ИздательствоООО "Прогресс книга"
Количество страниц496
Тип обложкимягкая
Возрастное ограничение16+
Количество книг1
Вес0.63кг
ISBN978-5-4461-1079-7
Размеры70x100/16
Обложкамягкая обложка
Язык изданияРусский
Авторбез автора
РазделПрограммирование


Где купить (6)

Цена от 1092 р. до 2659 р. в 6 магазинах

МагазинЦенаНаличие
Яндекс.Маркет
5/5
1092 р.
2184 р. -50% Кэшбэк до 3.8%
Промокоды на скидку

16.06.2024
2659 р.
Минимальная сумма заказа 100 рублей Крупнейшая сеть книжных магазинов Кэшбэк до 6.3%
Промокоды на скидку

17.06.2024
2659 р.
2829 р. -6% Минимальные сроки доставки. Кэшбэк до 6.3%
Промокоды на скидку

17.06.2024
2659 р.
2829 р. -6% Кэшбэк до 6.3%
Промокоды на скидку

17.06.2024
1092 р.
4216 р. -74% Повышенный кешбэк до 40%
Промокоды на скидку

17.06.2024
1615 р.
2822 р. -43%

17.06.2024
Avito доставка позволит получить любой товар, не выходя из дома

История цены

МагазинПоследняя известная ценаОбновлено
Лабиринт
2694 р.
21.02.2024
ЛитРес
550 р.
31.12.2021
МАЙШОП
1710 р.
20.02.2024

Предложения банков


Компания Предложение
Альфа-Банк

Беспроцентный период - до 100 дней. Выпуск кредитной карты - бесплатно

Халва

Рассрочка 0% до 36 мес. Лимит кредитования - до 500 000 рублей. Снятие заемных средств в рассрочку на 3 мес. Кэшбэк до 10%

Описание

Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям.

Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения.

В этой книге

- Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения.

- Изучите основу RL: марковские процессы принятия решений.

- Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других.

- Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах.

- Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением.

- Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента.

- Реализуете метод AlphaGo Zero для игры в Connect4.

- Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №1

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №2

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №3

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №4

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №5

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №6

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №7

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №8

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №9

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №10

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №11

Глубокое обучение с подкреплением. AlphaGo и другие технологии - фото №12

Смотри также о книге.

Отзывы (3)


  • 4/5

    очень полезная книга для темы обучения с подкрепление, тут описана как математика для данной области, так и инструменты для ее применения, минусом могу отметить что у оглавления нет ссылок из-за этого навигация по книги сильно усложняется

  • 5/5

    Познакомился с кодом к главе 8. Заметное число критических ошибок. Код с листа не проходит, нужны исправления. Подключение некоторых, необходимых для выполнения кода пакетов опущено. Приходится восстанавливать по факту ошибок и с поиском в сети. Запуск кода из командной строки приведен только для одного скрипта. Все остальные аргументы параметры запуска пришлось вычислять анализом кода. Удивило, что критерием остановки цикла принят np.inf и в коде train_model.py и в коде train_model_conv.py. Содержание файла requirements.txt, которое определяет необходимый софт для работы с книгой - некорректно. Приходится достаточно долго подбирать вручную, без шансов для новичков. Предоставленные скрипты в неудовлетворительном состоянии. Текстовая часть книги сжата, но представляет интерес принятой манерой изложения. В английском варианте книги этот пример уже в главе 10 количество недочетов никак не меньше, прежние сохранились.



Зарегистрируйтесь и получайте бонусы за покупки!


Книги: Машинное обучение. Анализ данных - издательство "Прогресс книга"

Книги: Машинное обучение. Анализ данных

Категория 873 р. - 1310 р.

закладки (0) сравнение (0)

14 ms