你将收获

掌握爬虫技术原理,能够从互联网爬取自己感兴趣的信息

掌握常用的爬虫技术框架,页面分析技术,掌握反爬虫技术对策等。

适用人群

具有java基础的学员

课程介绍

本课程是java大数据系列课程的数据采集部分,通过java爬虫技术从互联网进行在线数据采集,存储。对于本课程学习要求具有一定的java编程基础。通过本课的学习,能够掌握爬虫技术原理,数据采集的原则,数据采集的方式,Jsoup页面分析技术,Httpclient工具的使用等爬虫项目实战。

课程目录

讨论留言

正在加载中...

同学笔记

  • java_zhangfei 2020-08-20 21:13:16

    来源:Xpath工具的使用 查看详情

    Xpath语法

    1、nodename (选取此节点的所有子节点)

    2、/ (从根节点选取)

    3、//  (从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置)

    4、.   (选取当前节点) 

    5、..    (选取当前节点的父节点)

    6、@   (选取属性)

    7、*    (匹配任何元素节点)

    8、@*    (匹配任何属性节点)

    9、node()    (匹配任何类型的节点 )

没有更多了