你将收获

提升网络采集能力,成为资深爬虫工程师

能够应对js加密的网站抓取

精通Phantomjs技术,将浏览器渲染技术嵌入到自己已有的爬虫系统

设计更加完善的分布式爬虫系统

适用人群

爬虫工程师,数据采集工程师,对数据采集感兴趣的学者

课程介绍

本课程使用java作为编程语言,主要内容包括爬虫的基本原理,使用Phantomjs技术抓取拉钩企业招聘信息进行系统分析、Phantomjs的详细使用方法,如何使用Phantomjs分析html代码,基于队列的爬虫、数据存储、数据拆分、爬虫限速、网页跟踪,脚本注入等技术。
任务作业:
请抓取拉钩企业招聘数据进行企业岗位数据分析实战《各大城市招聘状况分析》。
(注意: 作业需写在CSDN博客中,请把作业链接贴在评论区,老师会定期逐个批改~~)
讨论留言

正在加载中...