Jsoup解析和遍历一个HTML文档(二)
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Jsoup解析和遍历一个HTML文档(二),小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2254字,纯文字阅读大概需要4分钟。
内容图文
![Jsoup解析和遍历一个HTML文档(二)](/upload/InfoBanner/zyjiaocheng/1231/e2f1ccb5b0a64a6d974380ba00f994e0.jpg)
关于Eclipse编辑器汇总console中字体调整:
1,下载jsoup的jar包:http://jsoup.org/download
2, jsoup英文的开发手册:http://jsoup.org/cookbook/
3,jsoup的jsoup cookbook中文版:http://www.open-open.com/jsoup/
- - - - - - - - - - - - - - -
- - - - - - - - - - - - - - -
小实例:
![技术分享](/img/jia.gif)
![技术分享](/img/jian.gif)
1 package cn.cast.test; 2 3 4 5 import org.jsoup.Jsoup; 6 import org.jsoup.nodes.Document; 7 import org.jsoup.nodes.Element; 8 import org.jsoup.select.Elements; 9 10 11 import java.io.IOException; 12 13 import org.jsoup.Jsoup; 14 import org.jsoup.Jsoup; 15 import org.jsoup.nodes.Document; 16 import org.jsoup.nodes.Element; 17 import org.jsoup.select.Elements; 18 19 20 public class test_1 { 21 22 public static void main(String[] args) { 23 // TODO Auto-generated method stub 24 getUrlAndTitle(); 25 getTextMes(); 26 } 27 28 public static void getUrlAndTitle() 29 { 30 String url="http://finance.sina.com.cn/"; 31try { 32 Document doc=Jsoup.connect(url).timeout(10000).get();//get all infomation from url website 33//System.out.println(doc); 34 Elements ListDiv = doc.getElementsByAttributeValue("class","fin_tabs0_c0"); 35//System.out.println(ListDiv);36for (Element div :ListDiv) { 37 Elements links = div.getElementsByTag("a"); 38// System.out.println(links);39for (Element link : links) { 40 String linkHref = link.attr("href").trim(); 41 String linkText = link.text().trim(); 42 System.out.println(linkHref+"\t"+linkText); 43 } 44 } 45 } catch (IOException e) { 46// TODO Auto-generated catch block47 e.printStackTrace(); 48 } 49 } 5051publicstaticvoid getTextMes() 52 { 53 String url="http://finance.sina.com.cn/hy/20140823/100220099682.shtml"; 54 String textMes=""; 55try { 56 Document doc=Jsoup.connect(url).timeout(10000).get(); 57 Elements ListDiv = doc.getElementsByAttributeValue("class","blkContainerSblkCon BSHARE_POP"); 58//System.out.println(ListDiv);59for(Element div:ListDiv) 60 { 61 Elements textInfos=div.getElementsByTag("p"); 62//System.out.println(textInfos);63for(Element textInfo:textInfos) 64 { 65 String text=textInfo.text().trim(); 66 textMes=textMes+text+"\n"; 67 } 68 } 69 System.out.println(textMes); 70 } catch (IOException e) { 71// TODO Auto-generated catch block72 e.printStackTrace(); 73 } 74 } 75 }
原文:http://www.cnblogs.com/kmingspirit/p/7120304.html
内容总结
以上是互联网集市为您收集整理的Jsoup解析和遍历一个HTML文档(二)全部内容,希望文章能够帮你解决Jsoup解析和遍历一个HTML文档(二)所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。