你将收获

掌握Selenium动态渲染页面信息的爬取 学会Scrapy框架与Selenium的结合使用 了解IP代理服务的设置 学会使用收费代理服务爬取网站信息 学会使用MongoDB数据库 学会使用Redis数据库 了解分布式爬虫原理 掌握Scrapy分布式的实现

适用人群

所有人

课程介绍

本周课程主要讲解网爬虫进阶实战的应用。具体有:Selenium动态渲染页面信息爬取、Scrapy框架与Selenium的结合、IP代理的设置、收费代理服务的使用、分布式爬虫原理、Scrapy分布式的实现、MongoDB和Redis非关系型数据库的使用。关于实战案例有:爬取淘宝网站的商品信息、微信公众号文章信息爬取实战。

课程目录