JAVA使用Jsoup的select语法进行元素查找

select详解

Document 继承自 Element 类。select方法将返回一个Elements集合。

1.通过标签名来查找: 

测试代码:

select写法:

下面的例子都按照上面的格式来写,就不进行重复的标注了。

2.通过id来查找:

3.通过class名来查找:

4.利用标签内属性名查找元素:

5.利用标签内属性名前缀查找元素:

6.利用标签内属性名+正则表达式查找元素

对正则表达式不了解的同学下去一定要学习正则表达式哦,因为它在爬虫中可是很重要的。

7.利用标签文本包含某些内容来查找:

8.利用标签文本包含某些内容+正则表达式来查找:

当然select还有其他强大的功能,如果对select感兴趣的同学可以查看select API,我只是列出了获取网页特定内容所需要的select的基本语法,基本上对于大部分的爬虫需求来说已经足够了。

下来给大家展示一个使用select获取特定元素值的代码:

上面的代码可以看到select的用法与前面讲的没有什么区别。对于Element 这个类来说,如果我们要获取一个标签中的属性值或文本内容可以这样来做:

推荐阅读更多精彩内容

  • 问答题47 /72 常见浏览器兼容性问题与解决方案? 参考答案 (1)浏览器兼容问题一:不同浏览器的标签默认的外补...
    _Yfling阅读 11,865评论 1 91
  • 第一部分 HTML&CSS整理答案 1. 什么是HTML5? 答:HTML5是最新的HTML标准。 注意:讲述HT...
    kismetajun阅读 22,865评论 1 45
  • 概要 64学时 3.5学分 章节安排 电子商务网站概况 HTML5+CSS3 JavaScript Node 电子...
    阿啊阿吖丁阅读 4,449评论 0 2
  • 是个极为孩子气,却假装的十分成熟的男孩。他常常说着一些与众不同的观点,小园却能敏锐地察觉那个假装很厉害的男生之下的...
    郁郁钰鱼阅读 56评论 0 0
  • 禾心作文第一期师训如期举办,在这一天刚好遇见你。 刚刚好在这里遇见禾心,遇见爱上文字的自己。 第一界师训,首届的老...
    任亚阅读 157评论 0 0