你将收获

提升网络采集能力,成为资深爬虫工程师

能够应对js加密的网站抓取

精通Phantomjs技术,将浏览器渲染技术嵌入到自己已有的爬虫系统

设计更加完善的分布式爬虫系统

适用人群

爬虫工程师,数据采集工程师,对数据采集感兴趣的学者

课程介绍

本课程使用java作为编程语言,主要内容包括爬虫的基本原理,使用Phantomjs技术抓取拉钩企业招聘信息进行系统分析、Phantomjs的详细使用方法,如何使用Phantomjs分析html代码,基于队列的爬虫、数据存储、数据拆分、爬虫限速、网页跟踪,脚本注入等技术。
任务作业:
请抓取拉钩企业招聘数据进行企业岗位数据分析实战《各大城市招聘状况分析》。
(注意: 作业需写在CSDN博客中,请把作业链接贴在评论区,老师会定期逐个批改~~)

课程讨论

各位同学大家好,重要课程附件已经上传到,重要代码已经在视频里了,大家可以照着视频敲就好,部分章节只讲解抓取思路

第二天 作业 配置运行 遇到问题 https://blog.csdn.net/hujingyao/article/details/108404034

按您的配置运行报 java.lang.IllegalStateException: The path to the driver executable must be set by the phantomjs.binary.path capability/system property/PATH variable; for more information, see https://github

简直了,血亏。。。。不要买了。。。

不建议购买,源代码都没有放出来

源码呢 怎么不发出来,需要源码啊!!!!!