首页 / HTML / 使用python(3.3.1)在html源代码中搜索字符串

使用python(3.3.1)在html源代码中搜索字符串

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了使用python(3.3.1)在html源代码中搜索字符串，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1566字，纯文字阅读大概需要3分钟。

内容图文

我正在开发一个从网页获取信息的项目.
在html源代码中我有以下内容：

Resultado de Busca：Foram encontrados 264 casais

我需要得到“encontrados”和“casais”之间的数字

无论如何在Python中有这样做吗？我应该使用什么字符串函数？我想在这种情况下避免使用正则表达式.

import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()

print(s.split())

到目前为止我得到了这个,但现在我找不到我需要的号码了.

import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()

num = int(s[s.index("encontrados")+len("encontrados"):s.index("casais")])

这给我下面的错误

TypeError：类型str不支持缓冲区API

解决方法:

我建议使用像Beautiful Soup这样的库,如果它是你要解析的HTML.不需要正则表达式.

编辑

使用刚刚添加的URL,这是获取HTML对象的示例代码：

import BeautifulSoup
import re
import urllib

data = urllib.urlopen('http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07').read()
soup = BeautifulSoup.BeautifulSoup(data)
element = soup.find('span', attrs={'class': re.compile(r".*\btxt_resultad_busca_casamento\b.*")})
print element.text

这将在页面上找到具有类txt_resultad_busca_casamento的HTML span元素,我相信这是您要提取的数据.从那里你可以解析.text属性来获得你感兴趣的确切数据.

编辑2

哎呀,刚才意识到使用正则表达式……看起来BeautifulSoup中的类匹配并不完美！这条线应该起作用,至少在网站更改HTML之前：

element = soup.find('div', attrs={'id': 'ctl00_body_uppBusca'}).find('span')

内容总结

以上是互联网集市为您收集整理的使用python(3.3.1)在html源代码中搜索字符串全部内容，希望文章能够帮你解决使用python(3.3.1)在html源代码中搜索字符串所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/731561.html

来源：【匿名】

【上一篇】php – Codeigniter字限制器关闭html标记【下一篇】PHP 和 HTML

更多 ►

【使用python(3.3.1)在html源代码中搜索字符串】教程文章相关的互联网学习教程文章

iOS 去掉html标签留下原本的字符串【代码】

做开发有的时候会遇到服务器返回的数据是html的，我们可以选择直接用webview来加载的方式去处理，当然这个方法不适用所有场景，通常我们会选择把没有必要的html标签去掉留下需要的文字信息，现在一起来看看吧。首先提供一个html标签的字符串 NSString *html = @"劳动是人类创造物质或精神财富的活动，有体力的，也有脑力的。我们自己是劳动者，也是别人劳动的见证者。劳动存在于现在，也存...

解决 Json 中 Html 内容因为反编译带有"\"导致 WebView 无法直接加载问题(字符串的查找与替换)【代码】

NSString *path = [[NSBundle mainBundle] pathForResource:@"ad_type = 4" ofType:@"html"];NSString *htmlStr = [NSString stringWithContentsOfFile:path encoding:NSUTF8StringEncoding error:nil];if (htmlStr != nil && [htmlStr rangeOfString:@"\\"].location != NSNotFound) {htmlStr = [htmlStr stringByReplacingOccurrencesOfString:@"\\" withString:@""];}UIWebView *web = [[UIWebView alloc]initWithFrame:CGRectM...

去除字符串中html标签代码【代码】

publicstring NoHtml(string html){string StrNohtml = System.Text.RegularExpressions.Regex.Replace(html, "<[^>]+>", "");StrNohtml = System.Text.RegularExpressions.Regex.Replace(StrNohtml, "&[^;]+;", "");return StrNohtml;} 原文：https://www.cnblogs.com/lq0418/p/11250615.html

在ASP.NET中过滤HTML字符串总结【图】

先记下来，以作备用！ C#代码 /// <summary>去除HTML标记 /// /// </summary> /// <param name="Htmlstring">包括HTML的源码</param> /// <returns>已经去除后的文字</returns> public static string GetNoHTMLString(string Htmlstring) { //删除脚本 Htmlstring = Regex.Replace(Htmlstring, @"<script[^...

vue在v-html的html字符串中绑定事件【代码】【图】

最近做项目，使用得vue作为基础框架。有这样一个需求，需要给返回来的富文本绑定事件，搜了一下众说纷纭。自己摸索了和总结出一套比较好用得方式。利用JavaScript事件捕获，通过给使用v-html的标记绑定click事件，捕获到点击的标记。从而实现vue动态绑定dom元素事件的效果；代码如下：富文本数据："richTextContent": "<span sty...

HTML字符实体（Character Entities），转义字符串（Escape Sequence）【代码】

最常用的字符实体Character Entities显示说明实体名称实体编号半方大的空白&ensp; 全方大的空白&emsp; 不断行的空白格 <小于<<>大于>>&&符号&"双引号"?版权©©?已注册商标®?商标（美国）?×乘号×÷除号÷ISO 8859-1 (Latin-1)字符集HTML 4.01 支持 ISO 8859-1 (Latin-1) 字符集。备注：为了方便起见，以下表格中，“实体名称”简称为“名称”，“实体编号”简称为“编号”显示名称编号显示名称编号显示名称...

js正则实现从一段复杂html代码字符串中匹配并处理特定信息【代码】

js正则实现从一段复杂html代码字符串中匹配并处理特定信息问题：现在要从一个复杂的html代码字符串（包含各种html标签，数字、中文等信息）中找到某一段特别的信息（被一对“|”包裹着），并对他进行加粗、加下滑线处理。解决思路：1、用正则匹配“|”出现的次数，处理刚好出现2次的（html字符串中一般不会含有这个字符）2、使用正则分组，获取“|”之间的内容，并进行替换（添加样式）代码：function specialDeal(){ htmlS...

HTML网页内容转换成字符串（删除从指定字符串到指定字符串）【代码】

背景：最近遇到个小需求就是将下面字符串去掉无用字符串 “你爷爷也喜欢吃鱼嘛。” 我笑了起来，“哪有猫不喜欢吃鱼的？” 猫嘀咕了一声。 “它说什么？” “它说你怎么还钓不到，肚子都等饿了。” 我瞥了猫一眼——那对大小眼正冷冷地盯着我，眼神跟它的鼻尖一样冰凉，“你们在这吵肯定钓不到啊。” “那好，不吵了。我们回屋去，你钓到了晚上就有酸菜鱼吃。” 奶奶抱起...

[转]HTML字符实体（Character Entities），转义字符串（Escape Sequence）【代码】

为什么要用转义字符串？HTML中<，>，&等有特殊含义（<，>，用于链接签，&用于转义），不能直接使用。这些符号是不显示在我们最终看到的网页里的，那如果我们希望在网页中显示这些符号，该怎么办呢？这就要说到HTML转义字符串（Escape Sequence）了。转义字符串（Escape Sequence）也称字符实体(Character Entity)。在HTML中，定义转义字符串的原因有两个：第一个原因是像“<”和“>”这类符号已经用来表示HTML标签，因此就不能直接...

css截取字符串，实现标题过长用代替_html/css_WEB-ITnose

list .ad_title { float : left ; overflow : hidden ; text-overflow : ellipsis ; white-space : nowrap ; width : 220px ; } 效果如图：

javascript – 包含空字符串的Html属性不显示=运算符【代码】

一个用例是在jQuery中：$select.append('<option value="">All</option>');看起来它实际上是在HTML中添加元素：<option value>All</option>相反,我想要的是附加到元素,以便它给出一个空字符串值：<option value="">All</option>为什么不这样呢？解决方法:It actually add the element in HTML不,它没有. 它将元素添加到DOM,而不是HTML. 当您使用浏览器的开发人员工具查看DOM时,它将使用类似HTML的语法显示.在此语法中,将呈现值为空...

使用Javascript 从HTML列表框(多选)中的项生成逗号分隔的字符串【代码】

因此,如果您有一个html列表框,也称为多选,并且您希望生成一个逗号分隔的字符串,列出该列表框中的所有值,您可以使用以下示例执行此操作. list_to_string()js函数是这里唯一重要的事情.你可以在http://josh.gourneau.com/sandbox/js/list_to_string.html玩这个页面<html> <head><script>function list_to_string(){var list = document.getElementById('list');var chkBox = document.getElementById('chk');var str = document.getE...

使用javascript过滤html的字符串(注释标记法)_javascript技巧

代码如下:function DeleteHtmlFromStartToEnd(str, begin, end) { str = str.replace(begin + end, ""); if (str.indexOf(begin) == -1) {//没找到 return str; } var substr = str.substring(str.indexOf(begin) + begin.length, str.indexOf(end)); str = str.replace(substr, ""); return DeleteHtmlFromStartToEnd(str, begin, end); ...

shell脚本，在指定目录下通过随机小写10个字母加固定字符串oldboy批量创建10个html文件。【代码】

test10.sh #!/bin/bash#使用for循环在/test10目录下通过随机小写10个字母加固定字符串oldboy批量创建10个html文件dir=/root/wyb/test10/ [ ! -d $dir ] && mkdir -p $dirfor i in `seq 10`dotouch $dir`echo $RANDOM|md5sum|cut -c 1-10`_oldboy.htmldone [root@localhost wyb]# bash test10.sh [root@localhost wyb]# cd test10 [root@localhost test10]# ls 3fb16229e0_oldboy.html 5bf08cf5ce_oldboy.html 73e073e1e6_ol...

在Python中将特定符号替换为字符串,将LaTeX转换为HTML,而无需使用转换器【代码】

我有一个字符串w,并且我想用“”替换“ $_”以及“ $_”后的第一个“ $”和“”.我需要将“ $^”替换为“”以及后面带有“”的“ $”.我尝试了w.replace(“ $_”,“”)和w.replace(“ $”,“”),但是我不能只获得“ $_”将替换为“”,之后仅是每个“ $”.将“ $^”替换为“”的步骤相同.如何仅在“ $_”或“ $^”指示符更改之后直接调用“ $”而不更改其余部分？ Python代...

首页 / HTML / 使用python(3.3.1)在html源代码中搜索字符串

使用python(3.3.1)在html源代码中搜索字符串

内容导读

内容图文

内容总结

内容备注

内容手机端

【使用python(3.3.1)在html源代码中搜索字符串】教程文章相关的互联网学习教程文章

iOS 去掉html标签留下原本的字符串【代码】

解决 Json 中 Html 内容因为反编译带有"\"导致 WebView 无法直接加载问题(字符串的查找与替换)【代码】

去除字符串中html标签代码【代码】

在ASP.NET中过滤HTML字符串总结【图】

vue在v-html的html字符串中绑定事件【代码】【图】

HTML字符实体（Character Entities），转义字符串（Escape Sequence）【代码】

js正则实现从一段复杂html代码字符串中匹配并处理特定信息【代码】

HTML网页内容转换成字符串（删除从指定字符串到指定字符串）【代码】

[转]HTML字符实体（Character Entities），转义字符串（Escape Sequence）【代码】

css截取字符串，实现标题过长用代替_html/css_WEB-ITnose

javascript – 包含空字符串的Html属性不显示=运算符【代码】

使用Javascript 从HTML列表框(多选)中的项生成逗号分隔的字符串【代码】

使用javascript过滤html的字符串(注释标记法)_javascript技巧

shell脚本，在指定目录下通过随机小写10个字母加固定字符串oldboy批量创建10个html文件。【代码】

在Python中将特定符号替换为字符串,将LaTeX转换为HTML,而无需使用转换器【代码】

PYTHON - 相关标签

HTML - 相关标签

源代码 - 相关标签

HTML - 技术教程分类

HTML - 最新教程

HTML - 最热教程