О книге: Современный скрапинг веб-сайтов с помощью Python; Издательский дом "Питер", 2021

Где купить

О книге


ПараметрЗначение
Автор(ы)
ИздательИздательский дом "Питер"
Год издания2021
ПереплетМягкий переплёт
Возрастные ограничения16
Кол-во страниц336
СерияБестселлеры O`Reilly
РазделПрограммирование
ISBN978-5-4461-1693-5
Возрастное ограничение16+
Количество страниц336
Формат165x231мм
Вес0.45кг
Тип обложкимягкая
Количество книг1
ИздательствоООО "Прогресс книга"
Бумагаофсет


Где купить

Последняя известная цена от 559 р. до 2859 р. в 6 магазинах

В данный момент у нас нет информации о наличии данного товара в магазинах.
Вы можете поискать его на других площадках:

МагазинЦенаНаличие
Avito доставка позволит получить любой товар, не выходя из дома

История цены

МагазинПоследняя известная ценаОбновлено
Лабиринт
2859 р.
02.01.2024
ЛитРес
559 р.
15.08.2024
book24
2063 р.
09.02.2023
Яндекс.Маркет
1808 р.
27.06.2024
Мегамаркет
1808 р.
02.07.2024

Описание

Если программирование напоминает волшебство, то веб-скрапинг - это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.

В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.

- Разбирайте сложные HTML-страницы.

- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.

- Изучайте методы хранения данных, полученных с помощью скрапинга.

- Считывайте и извлекайте данные из документов.

- Очищайте и нормализуйте плохо отформатированные данные.

- Читайте и пишите информацию на естественных языках.

- Освойте поиск по формам и логинам.

- Изучите скрапинг JavaScript и работу с API.

- Используйте и пишите программы для преобразования изображений в текст.

- Учитесь обходить скрапинговые ловушки и блокаторы ботов.

- Протестируйте собственный сайт с помощью скрапинга.

2-е международное издание.

Смотри также о книге.

Отзывы (4)


  • 3/5

    В целом книга полезна, но даёт довольно скромную информацию. И в самой книге написано, и в целом преподносится, что нас научат парсить динамические сайты и вызывать скрипты JS. Эт ложь, немного расскажут про Ajax сайты, что есть запросы, которые можно изучить и тогда...При этом я ожидал хотя бы описания парсинга сложных сайтов через консоль, что отслеживать, вот примеры - нет такого. Простые случаи вам прям дотошно расскажут, но не такие сложные детали. Спойлер - в книге просто посоветуют селениум. Сомнительно, но тоже можно использовать. Расскажут, как парсить ворд, csv, немного про многоточность и многопроцессность...Нет, в целом, это очень интересно и полезно для общего развития, но мы тут вроде как должны сайты парсить?! А википедии парсить можно и из википедии научиться. Если вы новичок и только хотите научиться парсингу, то подойдёт и будет интересно. Если ваша цель именно улучшить навыки парсинга и найти новые фичи - проходите мимо. Прям если коротко, то по стеку технологии книги советы : знать как работать с БД, selenium webdriver, немного затронут многопоточку...и всё в целом)

  • 5/5

    Книга дельная, но есть немного устаревшая информация. Однако это не критично, все нюансы легко гуглятся в рунете. Знание линукса не нужны, по крайней мере в первой части книги точно. До второй пока не дошел)

Все отзывы (4)



Зарегистрируйтесь и получайте бонусы за покупки!


Книги: Информационные технологии, Программирование - издательство "Издательский дом "Питер""

Категория 447 р. - 670 р.

Книги: Информационные технологии, Программирование

Категория 447 р. - 670 р.

закладки (0) сравнение (0)

9 ms