【php – 解析html页面】教程文章相关的互联网学习教程文章

spring – 无法使用javaconfig解析名为’dispatcher’的servlet中名为’htmlviews / index.html’的视图【代码】

我得到这样的例外:javax.servlet.ServletException: Could not resolve view with name 'htmlviews/index.html' in servlet with name 'dispatcher' org.springframework.web.servlet.DispatcherServlet.render(DispatcherServlet.java:1211) org.springframework.web.servlet.DispatcherServlet.processDispatchResult(DispatcherServlet.java:1011) org.springframework.web.servlet.DispatcherServlet.doDispatch(DispatcherSe...

c#使用AngleSharp解析HTML,找到ID为ID的DIV【代码】

我只是尝试以下操作来查找HTML中具有ID的已知部分的所有div:var AllDiv = document.All.Where(m => m.LocalName == "div" && m.GetAttribute("id").StartsWith("new_order_"));它始终导致NullReferenceException.我也尝试使用“约束”,但结果相同. div的外观如下:<div id="new_order_50000_US">...</div> <div id="new_order_4000_EU">...</div>有人可以帮我吗? 谢谢解决方法:您可能需要检查当前div是否具有id属性,然后再检查属...

C#使用HTML Agility Pack解析隐藏字段【代码】

我需要为一个可解析隐藏字段的朋友站点编写一个应用程序.我已经下载了Html Agility Pack库,但是有点困惑,因为实际上没有任何示例. HTML字段如下所示:<input type = "hidden" autocomplete="off" value="randomvalue" name="foo">我将如何从该领域获得价值?解决方法:从内存中,类似于:var value = docroot.SelectSingleNode("//input[@type='hidden' and @name='foo']").Attributes["value"].Value;

需要帮助来解析python3中的html,格式不适合xml.etree.ElementTree

我到处都有不匹配的标记错误.我不确定为什么会这样,这对craigslist主页上的文字对我来说看起来不错,但是我还没有对它进行足够的略读.也许我可以使用一些更宽容的方法,或者这是与标准库进行html解析的最佳选择?解决方法:标签不匹配的错误很可能是由标签不匹配引起的.浏览器以接受草率的html而闻名,它使网页编码人员可以轻松地编写格式错误的html,因此其中有很多.没有理由认为,creagslist应该不受不良网页设计师的影响. 您需要使用允...

PHP简单HTML DOM解析器-查找单词【代码】

我使用PHP简单的html dom解析器库,并且仅想用[WORD FIND HERE]替换所有“ manteau”词.这是我下面的代码,不适用于不在标签中的单词.它仅在Strong标签中与单词“ manteau”一起使用.如何解析所有节点文本? 注意:str_replace不是解决方案.此处需要使用DOM PARSER.我不想在锚或图像标签中选择单词.<?phprequire_once '../simple_html_dom.php';$html = new simple_html_dom();$html = str_get_html('Un manteau permet de tenir cha...

java-通过JMeter regexp解析HTML【代码】

我在JMeter中使用正则表达式遇到了一些麻烦.我在HTML中有此表格<form class="UIForm" id="UIComposer" action="/portal/intranet/?portal:componentId=b5914710-6c12-4fa9-9a18-2707d97111b7&interactionstate=JBPNS_rO0ABXcmAAt1aWNvbXBvbmVudAAAAAEAClVJQ29tcG9zZXIAB19fRU9GX18*&portal:type=action" onsubmit="return false;" method="post">我需要获取JMeter中componentId和interactstate的值作为变量.解决方法:请改用XPath E...

php-如何将HTML标记解析为纯文本?我想实现类似Facebook或Twitter的功能【代码】

例如:我有这个字符串@[1234:peterwateber] <b>hello</b> <div>hi!</div> https://stackoverflow.com我想像这样将其转换为HTML:<a href="1234">@peterwateber</a> <b>hello</b> <div>hi!<divb> <a href="http://sackoverflow.com">https://stackoverflow.com</a>我正在使用QueryPath,并且我有这段代码,您可以在其中从“ @ [123:peterwateber]”中获取文本,分别输出为“ 123和peterwateber”.The code to do that is: $hidden_in...

java-从html文件解析图片网址【代码】

我想搜索一个html文件,然后将该URL转到该页面上的图像.然后,该网址应另存为字符串-多数民众赞成.问题是我真的不知道如何开始. 我的应用程序当然知道图像所在页面的网址.举个例子,让这个URL: 在此页面上,我需要大图像的URL作为字符串.当我查看源代码时,我可以找到该URL,但是我不知道该如何编码-这是我需要的URL: (仅引号内的文本).解决方法:使用JSoup.这是一个HTML解析器,可让您使用css选择器(如jQuery)访问DOM元素.// Parse your...

PHP简单的HTML DOM解析器【代码】

我刚开始使用PHP Simple HTML DOM Parser. 现在,我正在尝试提取所有包含< b> -tag inclduing< / b>的元素.来自现有的HTML文档.这很好用foreach($html->find('b') as $q)echo $q;如何才能显示仅包含< b>,< / b> -tags后跟< span class =“标记为”>? 更新:我用firebug来获取元素的css路径.现在它看起来像这样:foreach ($html->find('html body div#wrapper table.desc tbody tr td div span.marked') as $x)foreach ($x->find('h...

PHP简单HTML DOM解析器:访问自定义属性【代码】

我想访问我添加到HTML文件中某些元素的自定义属性,这里是littleBox =“somevalue”属性的示例<div id="someId" littleBox="someValue">inner text</div>以下不起作用:foreach($html->find('div') as $element){echo $element;if(isset($element->type)){echo $element->littleBox;} }我看到一篇有类似问题的文章,但由于某些原因我无法复制它.这是我尝试过的:function retrieveValue($str){ if (stripos($str, 'littleBox')){//ch...

可以解析HTML文档并构建DOM树(java)【代码】

是否可以使用哪些工具将html文档解析为字符串或文件,然后构造DOM树,以便开发人员可以通过某些API遍历树. 例如:DomRoot = parse("myhtml.html");for (tags : DomRoot) { }注意:这是一个不是XHtml的HTML文档.解决方法:您可以使用TagSoup – 它是一个SAX兼容解析器,可以将格式错误的内容(如HTML)从通用网页清理为格式良好的XML.This is <B>bold, <I>bold italic, </b>italic, </i>normal textgets correctly rewritten as:This is ...

PHP简单HTML DOM解析器的字符编码问题【代码】

我正在使用PHP Simple HTML DOM Parser http://simplehtmldom.sourceforge.net/从其他域获取页面标题,元描述和元标记等数据,然后将其插入数据库. 但我有一些编码问题.问题是我没有从那些不是英语的网站上得到正确的字符. 以下是代码:<?php require 'init.php';$curl = new curl(); $html = new simple_html_dom();$page = $_GET['page'];$curl_output = $curl->getPage($page);$html->load($curl_output['content']); $meta_title...

如何在Java中解析HTML字符串?【代码】

给定字符串“< table>< tr>< td> Hello World!< / td>< / tr>< / table>”,获取表示它的DOM元素的(最简单)方法是什么?解决方法:这是一种方式:import java.io.*; import javax.swing.text.*; import javax.swing.text.html.*; import javax.swing.text.html.parser.*;public class HtmlParseDemo {public static void main(String [] args) throws Exception {Reader reader = new StringReader("<table><tr><td>Hello</td><td>W...

Python中的HTML解析器【代码】

使用Python文档我找到了HTML parser,但我不知道要导入哪个库来使用它,我如何找到它(请记住它没有在页面上说明).解决方法:尝试:import HTMLParser在Python 3.0中,HTMLParser模块已重命名为html.parser你可以检查一下这个here Python 3.0import html.parserPython 2.2及以上版本import HTMLParser

java – 使用JSoup进行Html解析【代码】

我试图解析以下URL的html: http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/ 获得“< p>”的文本包含教师姓名的标签.所需信息位于“< p>”内标签,但我无法使用JSoup检索标签.我不知道我做错了什么,因为当我将标签保存在Element对象中时,我们将其称为’b’,并且我调用b.getAllElements()它不会显示为其中一个元素.这不是Jsoup的getAllElements()方法吗?如果没有,有人可以向我解释我显然...