首页 / GROOVY / 用groovy采集网页数据
用groovy采集网页数据
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了用groovy采集网页数据,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1026字,纯文字阅读大概需要2分钟。
内容图文
首先,用?http://groovyconsole.appspot.com/?测试下面的代码,发现引用总是失败.
下载了GGTS:?https://spring.io/tools/ggts
测试成功:?
@Grapes( @Grab(group=‘org.ccil.cowan.tagsoup‘, module=‘tagsoup‘, version=‘1.2‘) )
import org.ccil.cowan.tagsoup.Parser;
class TestHtml {
public static void main(String[] args){
String ENCODING = "UTF-8"
def PARSER = new XmlSlurper(new Parser() )
def url = "http://www.nfl.com/stats/categorystats?archive=false&conference=null&statisticCategory=PASSING&season=2010&seasonType=REG&experience=null&tabSeq=0&qualified=true&Submit=Go"
new URL(url).withReader (ENCODING) { reader ->
def document = PARSER.parse(reader)
def data = document.‘**‘.find {it.@class == ‘data-table1‘}.tbody.tr.collect {
[
Rk: it.td[0].text().trim(),
Player: it.td[1].text().trim(),
PlayerUrl: "http://www.nfl.com" + it.td[1].a.@href.text().trim(),
Team: it.td[2].text().trim(),
Pos: it.td[3].text().trim()
]
}
data.each { it -> println it }
}
}
}
原文:http://www.cnblogs.com/fengwenit/p/5620484.html
内容总结
以上是互联网集市为您收集整理的用groovy采集网页数据全部内容,希望文章能够帮你解决用groovy采集网页数据所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。