你将收获

掌握Python的正则表达式,以及在网络爬虫中的应用

能够使用urllib、urllib3和requests库实现网站信息的爬取

掌握和使用GET、POST请求爬取数据方式 学会使用Xpath、BeautifulSoup、PyQuery解析网页的信息

学会网络爬虫中的常见错误处理

适用人群

所有人

课程介绍

本周课程主要讲解Python网络爬虫的基础内容。具体有:Python中的正则表达式,网络爬虫基础介绍,爬虫的工作原理,urllib、urllib3和requests库的使用,GET和POST请求抓取数据实战,网络爬虫中常见错误的处理,以及网页信息解析库的使用(Xpath,BeautifulSoup,PyQuery)。

课程目录