Jsonp 使用 爬取 可直接解析页面
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了Jsonp 使用 爬取 可直接解析页面,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含2055字,纯文字阅读大概需要3分钟。
内容图文

目标 : 爬取某网站 并导出到excel
方法 : 使用 JSOUP 爬取网站 ,使用AlibabaExcel 导出到文件
实现 :
1.pom.xml 应用对应jar包
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.11.3</version>
</dependency>
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>easyexcel</artifactId>
<version>2.2.3</version>
</dependency>
2.java 代码实现 直接 使用列表信息
使用jsoup 从网站获取数据
public static void main(String[] args) {
Document doc = null;
try {
//
doc = Jsoup.connect("http://*****.html").get(); // 具体方法可以查看 jsoup 文档
Element singerListDiv = doc.getElementsByAttributeValue("class", "content").first();
Elements links = singerListDiv.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
System.out.println("==============" + linkText);
}
} catch (IOException e) {
e.printStackTrace();
}
}
3.使用easyExcel 写入excel 说明文档 https://alibaba-easyexcel.github.io/quickstart/write.html
public class TestExcel {
private List<DemoData> data() {
List<DemoData> list = new ArrayList<DemoData>();
for (int i = 0; i < 10; i++) {
DemoData data = new DemoData();
data.setString("字符串" + i);
data.setDate(new Date());
data.setDoubleData(0.56);
list.add(data);
}
return list;
}
@Test
public void simpleWrite() {
// 写法1
String fileName = "D:/htmls/simpleWrite" + System.currentTimeMillis() + ".xlsx";
// 这里 需要指定写用哪个class去写
ExcelWriter excelWriter = EasyExcel.write(fileName, DemoData.class).build();
WriteSheet writeSheet = EasyExcel.writerSheet("模板").build();
excelWriter.write(data(), writeSheet);
// 千万别忘记finish 会帮忙关闭流
excelWriter.finish();
}
}
使用到的对象 DemoData
@Data
public class DemoData {
@ExcelProperty("字符串标题")
private String string;
@ExcelProperty("日期标题")
private Date date;
@ExcelProperty("数字标题")
private Double doubleData;
/**
* 忽略这个字段
*/
@ExcelIgnore
private String ignore;
}
可以根据对应的 jsoup 爬取对应网站 的页面 然后将数据拼装到内存 对象 在写入Excel 思路比较简单。EasyExcel使用的比较简单的用法,喜欢更复杂的可以查看对应的api
原文:https://www.cnblogs.com/JC-0527/p/12882233.html
内容总结
以上是互联网集市为您收集整理的Jsonp 使用 爬取 可直接解析页面全部内容,希望文章能够帮你解决Jsonp 使用 爬取 可直接解析页面所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。