首页 / HTML / java-如何通过文本内容获取HTML DOM路径？

java-如何通过文本内容获取HTML DOM路径？

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了java-如何通过文本内容获取HTML DOM路径？，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2260字，纯文字阅读大概需要4分钟。

内容图文

一个HTML文件：

<html>
    <body>
        <div class="main">
            <p id="tID">content</p>
        </div>
    </body>
</html>

我有一个字符串==“ content”,

我想使用“内容”获取HTML DOM路径：

html body div.main p#tID

chrome开发人员工具具有此功能(Elements标签,底部栏),我想知道如何在Java中做到这一点？

谢谢你的帮助：)

解决方法:

玩得开心：)

JAVA代码

import java.io.File;

import javax.xml.xpath.XPath;
import javax.xml.xpath.XPathConstants;
import javax.xml.xpath.XPathFactory;

import org.htmlcleaner.CleanerProperties;
import org.htmlcleaner.DomSerializer;
import org.htmlcleaner.HtmlCleaner;
import org.htmlcleaner.TagNode;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;



public class Teste {

    public static void main(String[] args) {
        try {
            // read and clean document
            TagNode tagNode = new HtmlCleaner().clean(new File("test.xml"));
            Document document = new DomSerializer(new CleanerProperties()).createDOM(tagNode);

            // use XPath to find target node
            XPath xpath = XPathFactory.newInstance().newXPath();
            Node node = (Node) xpath.evaluate("//*[text()='content']", document, XPathConstants.NODE);

            // assembles jquery/css selector
            String result = "";
            while (node != null && node.getParentNode() != null) {
                result = readPath(node) + " " + result;
                node = node.getParentNode();
            }
            System.out.println(result);
            // returns html body div#myDiv.foo.bar p#tID 

        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    // Gets id and class attributes of this node
    private static String readPath(Node node) {
        NamedNodeMap attributes = node.getAttributes();
        String id = readAttribute(attributes.getNamedItem("id"), "#");
        String clazz = readAttribute(attributes.getNamedItem("class"), ".");
        return node.getNodeName() + id + clazz;
    }

    // Read attribute
    private static String readAttribute(Node node, String token) {
        String result = "";
        if(node != null) {
            result = token + node.getTextContent().replace(" ", token);
        }
        return result;
    }

}

XML范例

<html>
    <body>
        <br>
        <div id="myDiv" class="foo bar">
            <p id="tID">content</p>
        </div>
    </body>
</html>

解释说明

>对象文档指向评估后的XML.
> XPath // * [text()=’content’]查找text =’content’的所有内容,并找到节点.
> while循环到第一个节点,获取当前元素的ID和类.

更多说明

>在此新解决方案中,我使用的是HtmlCleaner.因此,例如您可以使用< br&gt ;,而清洁剂将替换为< br />.
>要使用HtmlCleaner,只需下载最新的jar here.

内容总结

以上是互联网集市为您收集整理的java-如何通过文本内容获取HTML DOM路径？全部内容，希望文章能够帮你解决java-如何通过文本内容获取HTML DOM路径？所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/670940.html

来源：【匿名】

【上一篇】c#-XPath表达式在HtmlAgilityPack中不起作用【下一篇】PHP 和 HTML

更多 ►

【java-如何通过文本内容获取HTML DOM路径？】教程文章相关的互联网学习教程文章

Spring MVC 以.html为后缀名访问获取数据，报406 Not Acceptable错误。【代码】【图】

如题，最近以spring mvc作为后台框架，前端异步获取数据时（.html为后缀名的访问方式），报406 Not Acceptable错误。当初都不知道啥原因，前后台都没报错就是返回不了数据，于是查了下http 406响应码：406 (SC_NOT_ACCEPTABLE)表示请求资源的MIME类型与客户端中Accept头信息中指定的类型不一致。下面请看出错的操作流程及代码：1、先配置spring mvc 核心servlet （DispatcherServlet）至web.xml中，其中配置可以以.html和.do为后缀...

html textarea 获取换行显示

html textarea 获取换行显示参考资料：http://www.cnblogs.com/zhenmingliu/archive/2011/12/27/2303931.html原文：http://www.cnblogs.com/springlight/p/6109389.html

HTML5 获取用户坐标方法【代码】

1function GetLocation() {2if (navigator.geolocation) {3var locationOptions = {4//是否使用高精度设备，如GPS。默认是true 5 enableHighAccuracy: true,6//超时时间，单位毫秒，默认为0 7 timeout: 5000,8//使用设置时间内的缓存数据，单位毫秒9//默认为0，即始终请求新数据 10//如设为Infinity，则始终使用缓存数据11 maximumAge: 012 }; 13//只...

html5+jquery获取微信openid【图】

最近在修改一个移动商城，由于wap端是HTML5的，还大量使用了art模板技术，一开始修改很不适应，而且实现HTML5取openid一直没能实现很好的实现，经过对获取原理的理解和学习，终于还是实现了HTML获取微信openid,而且改动不大，闲话少说，直接上干货：一、写个js,用于取accesscode,并直接通过openid读取用户表中的注册信息$(function () {var wxopenid=getcookie('wxopenid');var key=getcookie('key');if (key==''){var access_code...

jQuery设置和获取HTML、文本和值【代码】

jQuery设置和获取HTML、文本和值按 Ctrl+C 复制代码 <script type="text/javascript">//<![CDATA[$(function(){//获取<p>元素的HTML代码$("input:eq(0)").click(function(){alert( $("p").html() );});//获取<p>元素的文本$("input:eq(1)").click(function(){alert( $("p").text() );});//设置<p>元素的HTML代码$("input:eq(2)").click(function(){$("p").html("<strong>你最喜欢的水果是?</strong>");}); //设置<p>元素的文本...

HTML 获取select标签内option对应得值

示例代码：<h3>视频标题：<select id="l_id">{% for item in ress %}<option value="{{ item.id }}" >{{ item.leibie }}</option>{% endfor %}</select></h3> script中获取选中得值var type_id = $("#l_id option:selected").val() 原文：https://www.cnblogs.com/wjohh/p/10816448.html

html5中checkbox的选中状态的设置与获取【代码】

获取checkbox是否选中：$("#checkbox").is(":checked");获得的值为true或false。设置checkbox是否选中：$("#checkbox").attr("checked", true);//设置为选中状态 $("#checkbox").attr("checked", false);//设置为未选中状态原文：https://www.cnblogs.com/lhlong/p/11253536.html

php操作mysql获取html标签<select>下拉列表数据【图】

650) this.width=650;" src="/upload/getfiles/default/2022/11/13/20221113025755550.jpg" title="psb (1)_副本.png" />650) this.width=650;" src="/upload/getfiles/default/2022/11/13/20221113025756099.jpg" title="psb_副本.png" />650) this.width=650;" src="/upload/getfiles/default/2022/11/13/20221113025756585.jpg" title="psb (2)_副本.png" />本文出自 “IT5808” 博客，请务必保留此出处http://it5808.blog.5...

js获取Html元素的实际宽度高度

情况一：宽高都写在样式表里，即外部样式或嵌入式样式，比如#div1{width:120px;}。这种情况通过#div1.style.width拿不到宽度，而通过#div1.offsetWidth才可以获取到宽度。情况二：宽和高是写在行内中，即内联式样式，比如style="width:120px;"，这中情况通过上述2个方法都能拿到宽度。因为id.offsetWidth和id.offsetHeight无视样式写在样式表还是行内，所以我们获取元素宽和高的时候最好用这2个属性。注意如果不是写在行内style中的...

页面爬虫(获取其他页面HTML)加载到自己页面示例

复制代码代码如下://前台 <div id="showIframe"></div> $(document).ready(function() { var url = "@Url.Action("GetPageHtml","Catalog")"; $.ajax({ url: url, type: "POST", dataType:"json", data: { url: "http://www.baidu.com" }, error: function () { alert("bbb"); }, success: function (data) { $("#showIframe").append(data); //$("#showIframe div").hide(); //$("#showIframe>#container").show(); //$("#showIf...

HTML5页面直接调用百度地图API,获取当前位置，直接导航目的地

<!DOCTYPE html> <html lang="zh-cmn-Hans"> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width,initial-scale=1,user-scalable=0"> <title>HTML5页面直接调用百度地图API,获取当前位置，直接导航目的地</title> <script type="text/javascript" src="http://api.map.baidu.com/api?v=2.0&ak=wDYEcxgRRheZwyC9jpN1Tt7fzr2zjosZ"></script> <script src="http://cdn.bootcss.c...

jQuery获取自身HTML【代码】

1 <html>2 <head>3 <title>jQuery获取自身HTML</title>4 <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />5 <meta http-equiv="Content-Language" content="zh-CN" />6 <script type="text/javascript" src="http://files.cnblogs.com/Zjmainstay/jquery-1.6.2.min.js"></script>7 </head>8 <body>9 <div class="aa" style="border:1px solid #ABC;width:200px;text-align:center;">点击获...

[转] HTML 获取屏幕、浏览器、页面的高度宽度【图】

本篇主要介绍Web环境中屏幕、浏览器及页面的高度、宽度信息。目录1. 介绍：介绍页面的容器(屏幕、浏览器及页面)、物理尺寸与分辨率、展示等内容。2. 屏幕信息：介绍屏幕尺寸信息；如：屏幕、软件可用以及任务栏的高度和宽度。3. 浏览器信息：介绍浏览器尺寸信息；如：浏览器、内部页面以及工具栏的高度和宽度。4. 页面信息：介绍HTML页面尺寸信息；如：body总的、展示的高度和宽度。一、介绍1. 容器一个页面的展示，从外到内的容器...

基于 html5 geolocation来获取经纬度地址(copy)

geolocation来获取经纬度地址以前如果要获取互联网用户所在地都是根据用户的IP地址来获取地理位置，这样获取到的数据和真实数据有很大的偏差。为了获取更加精确的位置，可以使用了html5的geolocation来获取经纬度，然后再获取所在地理位置，如何获取，我在下面会说到。先说下基本概念。　　Geolocation在的navigator 对象中，我们可以通过 navigator.geolocation 来使用它。不支持 geolocation 的浏览器并不包含这一对象，那么可以...

Jquery 选择html 标签获取值【图】

https://zhidao.baidu.com/question/299628455.html 这个问题包含两个方面：jquery选择器（即针对你指定的那个input元素）和获取内容（即获得输入的值），所以综合起来有如下代码可以实现$("input#test").val(); // 推荐这种方式，因为id是唯一的$("input[name=‘test‘]").val(); // 此时需要注意是否有同名的input元素$("input:text").val(); // 这种方式只有整个网页只有一个文本输入框才是正确的下面给出示例：...

首页 / HTML / java-如何通过文本内容获取HTML DOM路径？

java-如何通过文本内容获取HTML DOM路径？

内容导读

内容图文

内容总结

内容备注

内容手机端

【java-如何通过文本内容获取HTML DOM路径？】教程文章相关的互联网学习教程文章

Spring MVC 以.html为后缀名访问获取数据，报406 Not Acceptable错误。【代码】【图】

html textarea 获取换行显示

HTML5 获取用户坐标方法【代码】

html5+jquery获取微信openid【图】

jQuery设置和获取HTML、文本和值【代码】

HTML 获取select标签内option对应得值

html5中checkbox的选中状态的设置与获取【代码】

php操作mysql获取html标签<select>下拉列表数据【图】

js获取Html元素的实际宽度高度

页面爬虫(获取其他页面HTML)加载到自己页面示例

HTML5页面直接调用百度地图API,获取当前位置，直接导航目的地

jQuery获取自身HTML【代码】

[转] HTML 获取屏幕、浏览器、页面的高度宽度【图】

基于 html5 geolocation来获取经纬度地址(copy)

Jquery 选择html 标签获取值【图】

JAVA - 相关标签

HTML - 相关标签

DOM - 相关标签

HTML - 技术教程分类

HTML - 最新教程

HTML - 最热教程