Якщо програмування нагадує магію, то Веб-скрапінг-це дуже сильне чаклунство. Написавши просту автоматизовану програму, можна відправляти запити на веб-сервери, запитувати з них дані, а потім аналізувати їх і витягувати необхідну інформацію. Нове розширене видання книги знайомить не тільки з веб-скрапінгом, але і допоможе зібрати будь-якого виду дані в сучасному інтернеті.
У частині I основна увага приділена механіці веб-скрапінгу: як за допомогою Python запитувати інформацію з веб-сервера, проводити базову обробку серверного відгуку і організувати автоматизовану взаємодію з сайтами.
У частині II досліджені більш специфічні інструменти і додатки, які стануть в нагоді при будь-якому сценарії веб-скрапінгу.
- розбирайте складні HTML-сторінки.
- розробляйте пошукові роботи за допомогою фреймворку Scrapy.
- вивчайте методи зберігання даних, отриманих за допомогою скрапінгу.
- Зчитуйте та витягуйте дані з документів.
- Очищайте та нормалізуйте погано відформатовані дані.
- Читайте та пишіть інформацію природними мовами.
- Освойте пошук за формами та логінами.
- вивчіть скрапінг JavaScript і роботу з API.
- Використовуйте та пишіть програми для перетворення зображень у текст.
- Вчіться обходити скрапінгові пастки і блокатори ботів.
- протестуйте власний сайт за допомогою скрапінгу.
формати: pdf, epub
https://privatelink.de/?https://www.piter.com/product/sovremennyy-skraping-veb-saytov-s-pomoschyu-python