html内容为table解析

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了html内容为table解析，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2343字，纯文字阅读大概需要4分钟。

内容图文

#html
#内容解析
from lxml import etree
import pandas as pd
import re
def get_data(html):
    html = etree.HTML(html)
    #result = etree.tostring(html)
    #print(result)
    table = html.xpath('//table[contains(@class,"torrents")]')
    # table内容转换成dataframe数据
    result =[]
    for rows in table[0].xpath('./tr'): #备注因为table有表头，所以从第一行开始抓取数据
        #去掉标题行
        elements = rows.xpath('./td')
        tmp_result = [''.join(ele.xpath('.//text()') ) for ele in elements]
        title_id = rows.xpath(".//a[contains(@href,'php?id')]/@href")
        try:
            title_id = re.search('php\?id=(\d+)',str(title_id)).group(1)    
        except:
            title_id = ''
        #title_class  = ''.join(rows.xpath(".//a[contains(@href,'?cat=')]/img/@title"))
        #print(rows.xpath(".//a[contains(@href,'php?id')]/@title"))
        tmp_result.append(title_id)
        #tmp_result.append(title_class)    

        result.append(tmp_result)

    labels = ['类型','标题','评论数','存活时间','大小','种子数','下载数','完成数','发布者','标题id']
    result
    df = pd.DataFrame.from_records(result,columns=labels)
    #删除第一行数据
    df=df.iloc[1:]
    return df
#get_data(html)

存入mongod数据库

import pandas as pd
from pymongo import MongoClient
from sqlalchemy import create_engine
def data_to_dataframe(data):
    from pymongo import MongoClient
    client = MongoClient('67.216.204.220', 27017)
    db = client.pt
    table = db.pt_btschool_net_torrents
    records = data.to_dict('records')
    table.insert_many(records)
    return 'success dataframe_to_mongodb '
#data_to_dataframe(df)

html 内容是table的解析办法：

说明：table中tbody是无效的，使用中不需要用它

import pandas as pd
from lxml import html

url = "http://www.uesp.net/wiki/Skyrim:No_Stone_Unturned"
xpath = "//*[@id=\"mw-content-text\"]/table[3]"

tree = html.parse(url)
table = tree.xpath(xpath)[0]
raw_html = html.tostring(table)

dta = pd.read_html(raw_html, header=0)[0]
dta["completed"] = 0
del dta["Map"]
参考地址：https://gist.github.com/jseabold/5892603

案例：

from lxml import etree
import pandas as pd
table = html.xpath('//table[@id="torrenttable"]')[0]
raw_html = etree.tostring(table)
data = pd.read_html(raw_html, header=0)[0]

读取mongodb数据内容

import pandas as pd
from sqlalchemy import create_engine
def read_mongb():
    from pymongo import MongoClient
    client = MongoClient('67.216.204.220', 27017)
    db = client.pt
    table = db.pt_btschool_net_torrents
    data = pd.DataFrame(pd.DataFrame(list(table.find())))
    return data
data = read_mongb()
data.head()
data.columns

内容总结

以上是互联网集市为您收集整理的html内容为table解析全部内容，希望文章能够帮你解决html内容为table解析所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1020101.html

来源：【匿名】

【上一篇】html主要结构【下一篇】PHP 和 HTML

更多 ►

【html内容为table解析】教程文章相关的互联网学习教程文章

1题目：如下图，请实现表格信息的排序功能，当点击表头的属性区域，将表格信息进行排序切换功能，即第一次点击为降序排序，再一次点击进行升序排序。2姓名　　力量敏捷智力3德鲁伊王 17 24 134月之骑士 15 22 165众神之王 19 15 206流浪剑客 23 15 147基本思路：8点击将各列数值存入数组第一次点击?(className=="as"?)升序排序(className="desc")按新排列的数组的顺序，将各列赋予新...

Html+Css+Js_之table每隔3行显示不同的两种颜色【代码】【图】

1<html> 2<head> 3<script type="text/javascript"> 4/**5 最近因项目的需求，有这样的一个问题：6 一个table显示n条记录，每3行换一次颜色，例如：1，2，3行红色背景，4，5，6行绿色背景，7，8，9行红色背景...以此类推！7*/ 8 window.onload=function() { 9var tbl = document.getElementById("table"); // 先获取table10var rows = tbl.getElementsByTagName("tr"); // 获取里面的行tr11for(...

HTML中js操作table【代码】

一、获取每一个tr1、通过table的id获取，如id="tables" 获取第一行tr，索引从0开始，用eq(),方法里面的索引可以手动更换，如第二行就是1，也可以循环tr，eq里面就是循环变量 $("#tables tr").eq(0);//遍历每一行 for (var i = 0; i < $("#tables tr").length; i++) { $("#tables tr").eq(i); } 2、通过tbody获取tr，id="tbodys"，aa的值可自行设置相应的索引，关键字“find”，子级 $("#tbodys").find(‘tr‘).eq(aa); 3、获...

HTML DOM Table summary 属性

[Table summary 属性Table 对象定义和用法summary 属性可设置或返回表格的概述。 summary 属性可设置或返回表格的概述。语法设置 summary 属性：tableObject.summary="text"返回 summary 属性：tableObject.summary提示： summary 属性没有默认值。值描述text摘要文本浏览器支持所有主要浏览器都支持 summary 属性实例实例弹出表格的摘要:<!DOCTYPE html><html><head> <meta charset="utf-8"> <title>Break易站(runoob.com)</title...

HTML中table边框的显示总结

一、1、显示表格的4个边框：<table border frame=box>2、只显示上边框: <table border frame=above>3、只显示下边框: <table border frame=below>4、只显示上下边框: <table border frame=hsides>5、只显示左右边框: <table border frame=vsides>6、只显示左边框： <table border frame=lhs>7、只显示右边框： <table border frame=rhs>8、不显示任何边框： <table border frame=void>二、1、只显示列与列之间的分隔线：<table rul...

HTML table、form表单标签的介绍【代码】【图】

本篇主要介绍 table、form标签以及表单提交方式。目录1. 标签' ref='nofollow'> 标签：在HTML 中定义表格布局。2. 标签' ref='nofollow'> 标签：用于创建 HTML 表单。3. 表单提交方式：介绍get、post方法。 1. <table> 标签1.1 说明在HTML 中定义表格布局。1.2格式<table><caption></caption><tr> <th></th></tr><tbody><tr><td></td></tr><tr><td></td><tr><tbody> </table> 1.3 包含的元素<caption></caption>：表头信息。<tr>...

HTML Table导出为Excel的方法【代码】

HTML Table导出为Excel的方法：直接上源码<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script type="text/javascript" language="javascript">var idTmr;function getExplorer() {var explorer = window.navigator.userAgent ;//ie if (explorer.indexOf("MSIE") >= 0) {return ‘ie‘;}//firefox else if (explorer.indexOf("Firefox") >= 0) {return ‘Firefox‘;}//Chromeelse if(...

ASP.net MVC把Html Table导出Excel【代码】

[HttpPost]public ActionResult ExportExcel(FormCollection form){string strHtml = form["hHtml"];strHtml = HttpUtility.HtmlDecode(strHtml);//Html解码byte[] b = System.Text.Encoding.Default.GetBytes(strHtml);//字串转byte阵列return File(b, "application/vnd.ms-excel", "这是Excel.xls");//输出档案给Client端} 原文：http://www.cnblogs.com/ilookbo/p/4112013.html

HTML学习笔记——列表和table【代码】

1>有序列表、无序列表和自定义列表<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"/><title>无标题文档</title></head><body><ol type="a"><li>有序列表1</li><li>有序列表2</li><li>有序列表3</li><li>有序...

原生的HTML Table表格实现表头添加斜杠【代码】【图】

原生的HTML Table表格实现表头添加斜杠其实就是实现类似的这样一个功能，但是呢，方式很多，有的要固定长宽，有的要固定大小，有的要写JS，有的要用动画，很费劲，然后从网上找了一个demo，稍微改一下就很简单的实现了，其实就几行CSS代码。废话不多说，直接上代码！HTML代码：<table cellspacing="0" cellpadding="0"><tbody><tr><td ><span >项目</span><span >日期</span></td><td>2010-10-15</td></tr><tr><td>采购</td><td>9...

html的table用法(让网页的视觉效果显示出来)

我们知道在网易博客可以用html时，是否把代码直接加入到摸板中，但是效果却不是很好。那是因为没有对代码进行很好的排列，现在我说一下用table来排列，可以很好的把特效显示出来。在html语法中table(即表格）是不可少的部分，没有着个，是很难对网页的视觉效果显示出来，现在我就说一下table。下面就是一个二行二列的表格：代码为：<TABLE style="BORDER-RIGHT: 1px solid; BORDER-TOP: 1px solid; BORDER-LEFT: 1px solid; B...

html 动态添加TABLE的行。【代码】【图】

以Table表为框架，在HTML中实现数据列的添加，删除，查找功能【代码】

在学习Javascript的过程中，首先遇到的便是对对象数据类型和对象函数的理解不够清晰透彻。这个需要的就只是多实践，写代码的时候仔细脑际每一个变量被赋予的数据类型和对象。　　在这次实践中对该Table实现的功能有：隔行变色，列的添加和删除（子节点），鼠标移入移出变色事件，关键字查找，分类具体查找，关键字模糊查找，多关键字查找。具体代码如下：<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://...

仿百度图片首页--HTML+CSS练手项目1【Table】【代码】【图】

【本文为原创，转载请注明出处】技术【CSS+HTML】布局【Table】图片准备【百度图标、10张不同类型图】------------------------------------------------------------------------------------------------------------步骤1 table 布局 1<!DOCTYPE html> 2<html lang="en"> 3<head> 4<meta charset="UTF-8"> 5<title>仿百度网页</title> 6</head> 7<body> 8<table"> 9<tr>10<td></td>11<td></td>12<td></td>13<td></td>14<td>...

html_table标签的属性，css样式，以及HTMLTableElement的方法

目录' ref='nofollow'>< table > 标签的特有属性' ref='nofollow'>< table > 标签的特有属性' ref='nofollow'>< td > 标签特有的属性' ref='nofollow'>< td > 标签特有的属性以 < colgroup >' ref='nofollow'>< col > 以 < colgroup > 特有属性' ref='nofollow'>< col > 特有属性在css中的可设定样式' ref='nofollow'>< table > 在css中的可设定样式HTMLTableElement对象的方法< table >< table > 标签的特有属性cellpadding:用...

HTML - 技术教程分类

HTML 教程 HTML 简介 HTML 编辑器 HTML 基础 HTML 元素 HTML 属性 HTML 标题 HTML 段落 HTML 文本格式化 HTML 链接 HTML 头部 HTML CSS HTML 图像 HTML 表格 HTML 列表 HTML 区块 HTML 布局 HTML 表单 HTML 框架 HTML 颜色 HTML 颜色名 HTML 颜色值 HTML 脚本 HTML 字符实体 HTML URL HTML 速查列表 HTML 总结 XHTML 简介 HTML 媒体(Media) HTML 插件 HTML 实例 HTML 标签列表（功能排序） HTML 属性 HTML 事件 HTML 画布 HTML 音频/视频 HTML 颜色名 HTML 字符集 HTML ASCII HTML ISO-8859-1 HTML 符号 HTML 语言代码 html 全部

HTML - 最热教程

html5代码如何实现进度条功能？（示例）javascript中html字符串转化为jquerydo...HTML5实战与剖析之CSS选择器——getEle...html5中设置或返回音频/视频是否应该被...HTML5获取设备信息 jQuery打印指定区域Html页面并自动分页...jQuery+HTML5+CSS3制作支持响应式布局时...JS+HTML5实现上传图片预览效果完整实例...php删除html标签和标签内的内容的方法总...XMLHttpRequest中responseText如何获取...

首页 / HTML / html内容为table解析

html内容为table解析

内容导读

内容图文

html 内容是table的解析办法：

读取mongodb数据内容

内容总结

内容备注

内容手机端

【html内容为table解析】教程文章相关的互联网学习教程文章

HTML中实现Table表头点击升序/降序排序【代码】

Html+Css+Js_之table每隔3行显示不同的两种颜色【代码】【图】

HTML中js操作table【代码】

HTML DOM Table summary 属性

HTML中table边框的显示总结

HTML table、form表单标签的介绍【代码】【图】

HTML Table导出为Excel的方法【代码】

ASP.net MVC把Html Table导出Excel【代码】

HTML学习笔记——列表和table【代码】

原生的HTML Table表格实现表头添加斜杠【代码】【图】

html的table用法(让网页的视觉效果显示出来)

html 动态添加TABLE的行。【代码】【图】

以Table表为框架，在HTML中实现数据列的添加，删除，查找功能【代码】

仿百度图片首页--HTML+CSS练手项目1【Table】【代码】【图】

html_table标签的属性，css样式，以及HTMLTableElement的方法

TABLE - 相关标签

HTML - 相关标签

HTML - 技术教程分类

HTML - 最新教程

HTML - 最热教程