КорзинаКорзина

Современный скрапинг веб-сайтов с помощью Python

Современный скрапинг веб-сайтов с помощью Python
Издательство: Питер
Год выпуска: 2021
ISBN: 978-5-4461-1693-5
Наличие: На складе
2262 р.
Купить Современный скрапинг веб-сайтов с помощью Pythonкупить

Если программирование напоминает волшебство, то веб-скрапинг - это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете. В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга. - Разбирайте сложные HTML-страницы. - Разрабатывайте поисковые роботы с помощью фреймворка Scrapy. - Изучайте методы хранения данных, полученных с помощью скрапинга. - Считывайте и извлекайте данные из документов. - Очищайте и нормализуйте плохо отформатированные данные. - Читайте и пишите информацию на естественных языках. - Освойте поиск по формам и логинам. - Изучите скрапинг JavaScript и работу с API. - Используйте и пишите программы для преобразования изображений в текст. - Учитесь обходить скрапинговые ловушки и блокаторы ботов. - Протестируйте собственный сайт с помощью скрапинга. 2-е международное издание.

Товар имеет сертификаты качества и безопасности и соответствует нормам санитарной гигиены. Гарантийное обязательство также прилагается. Предлагается дисконтная накопительная система, а также корпоративная скидка 10% на заказ от 20 шт. На странице офомления заказа будет отображена более подробная информация о стоимости доставки в ваш регион и о вашей личной скидке.

Книжный раздел

Позвольте Вам предложить