首页 / PYTHON / php-Python：使用机械化将数据提交到表单后,提取.csv结果

php-Python：使用机械化将数据提交到表单后,提取.csv结果

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了php-Python：使用机械化将数据提交到表单后,提取.csv结果，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3505字，纯文字阅读大概需要6分钟。

内容图文

我是第一次使用Python从网络上提取数据.多亏了其他一些帖子以及webpage,我才知道如何使用机械化模块将数据提交到表单.

现在,我坚持寻找如何提取结果.提交表单时会有很多不同的结果,但是如果我可以访问csv文件,那将是完美的.我假设您必须使用re模块,但是如何通过Python下载结果呢？

运行作业后,csv文件位于此处：摘要=>结果=>下载重链表(您只需单击“加载示例”即可查看该网页的工作方式).

import re
import mechanize

br = mechanize.Browser()
br.set_handle_robots(False)   # ignore robots
br.set_handle_refresh(False)  # can sometimes hang without this

url = 'http://circe.med.uniroma1.it/proABC/index.php'
response = br.open(url)

br.form = list(br.forms())[1]

# Controls can be found by name
control1 = br.form.find_control("light")

# Text controls can be set as a string
br["light"] = "DIQMTQSPASLSASVGETVTITCRASGNIHNYLAWYQQKQGKSPQLLVYYTTTLADGVPSRFSGSGSGTQYSLKINSLQPEDFGSYYCQHFWSTPRTFGGGTKLEIKRADAAPTVSIFPPSSEQLTSGGASVVCFLNNFYPKDINVKWKIDGSERQNGVLNSWTDQDSKDSTYSMSSTLTLTKDEYERHNSYTCEATHKTSTSPIVKSFNRNEC" 
br["heavy"] = "QVQLKESGPGLVAPSQSLSITCTVSGFSLTGYGVNWVRQPPGKGLEWLGMIWGDGNTDYNSALKSRLSISKDNSKSQVFLKMNSLHTDDTARYYCARERDYRLDYWGQGTTLTVSSASTTPPSVFPLAPGSAAQTNSMVTLGCLVKGYFPEPVTVTWNSGSLSSGVHTFPAVLQSDLYTLSSSVTVPSSPRPSETVTCNVAHPASSTKVDKKIVPRDC"

# To submit form
response = br.submit()
content = response.read()
# print content

result = re.findall(r"Prob_Heavy.csv", content)
print result

打印内容时,我感兴趣的行如下所示：

<h2>Results</h2><br>
Predictions for Heavy Chain:
<a href='u17003I9f1/Prob_Heavy.csv'>Download Heavy Chain Table</a><br>
Predictions for Light Chain:
<a href='u17003I9f1/Prob_Light.csv'>Download Light Chain Table</a><br>

因此,问题是：如何下载/访问href =’u17003I9f1 / Prob_Heavy.csv’？

解决方法:

这是一个使用BeautifulSoup的快速且肮脏的示例,它请求避免使用正则表达式解析HTML. sudo pip install bs4(如果您已安装pip但尚未安装BeautifulSoup).

import re
import mechanize
from bs4 import BeautifulSoup as bs
import requests
import time


br = mechanize.Browser()
br.set_handle_robots(False)   # ignore robots
br.set_handle_refresh(False)  # can sometimes hang without this

url_base = "http://circe.med.uniroma1.it/proABC/"
url_index = url_base + "index.php"

response = br.open(url_index)

br.form = list(br.forms())[1]

# Controls can be found by name
control1 = br.form.find_control("light")

# Text controls can be set as a string
br["light"] = "DIQMTQSPASLSASVGETVTITCRASGNIHNYLAWYQQKQGKSPQLLVYYTTTLADGVPSRFSGSGSGTQYSLKINSLQPEDFGSYYCQHFWSTPRTFGGGTKLEIKRADAAPTVSIFPPSSEQLTSGGASVVCFLNNFYPKDINVKWKIDGSERQNGVLNSWTDQDSKDSTYSMSSTLTLTKDEYERHNSYTCEATHKTSTSPIVKSFNRNEC" 
br["heavy"] = "QVQLKESGPGLVAPSQSLSITCTVSGFSLTGYGVNWVRQPPGKGLEWLGMIWGDGNTDYNSALKSRLSISKDNSKSQVFLKMNSLHTDDTARYYCARERDYRLDYWGQGTTLTVSSASTTPPSVFPLAPGSAAQTNSMVTLGCLVKGYFPEPVTVTWNSGSLSSGVHTFPAVLQSDLYTLSSSVTVPSSPRPSETVTCNVAHPASSTKVDKKIVPRDC"

# To submit form
response = br.submit()
content = response.read()
# print content

soup = bs(content)
urls_csv = [x.get("href") for x in soup.findAll("a") if ".csv" in x.get("href")]
for file_path in urls_csv:
    status_code = 404
    retries = 0
    url_csv = url_base + file_path
    file_name = url_csv.split("/")[-1]
    while status_code == 404 and retries < 10:
        print "{} not ready yet".format(file_name)
        req = requests.get(url_csv )
        status_code = req.status_code
        time.sleep(5)
    print "{} ready. Saving.".format(file_name)
    with open(file_name, "wb") as f:
        f.write(req.content)

在REPL中运行脚本：

Prob_Heavy.csv not ready yet
Prob_Heavy.csv not ready yet
Prob_Heavy.csv not ready yet
Prob_Heavy.csv ready. Saving.
Prob_Light.csv not ready yet
Prob_Light.csv ready. Saving.
>>> 
>>>

内容总结

以上是互联网集市为您收集整理的php-Python：使用机械化将数据提交到表单后,提取.csv结果全部内容，希望文章能够帮你解决php-Python：使用机械化将数据提交到表单后,提取.csv结果所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/666062.html

来源：【匿名】

【上一篇】python-为什么Cython的pip安装需要这么长时间？【下一篇】浅谈PHP运行Python脚本的方法

更多 ►

【php-Python：使用机械化将数据提交到表单后,提取.csv结果】教程文章相关的互联网学习教程文章

python_way day14 HTML-day5 （form表单验证，）【代码】【图】

python-way day19 1. dJango的form表单验证一，django表单验证功能1、django验证基础：<!DOCTYPE html><html lang="en"><head><meta charset="UTF-8"><title>django form</title></head><body><div><input type="text" placeholder="用户名" name="user"></div><div><input type="password" placeholder="密码" name="password"></div><input type="button" value="提交"></body><script src="/statics/js/jquery-3.1.0.min.js"...

无法使用urllib python v3.2.1将数据发布到登录表单【代码】

import urllib.parseimport urllib.requestimport timedef __init__(self, parent= None):QtGui.QWidget.__init__(self,parent)self.ui = Ui_MainWindow()self.ui.setupUi(self)username = 'name'password = 'pass'while True:try:page=urllib.request.urlopen('http://10.100.56.55:8090/httpclient.html','&username='+username+'@da-iict.org&password='+password+'&btnSubmit=Login')the_page=page.read()我一直在尝试使这段代...

python – Django表单EmailField不接受css属性【代码】

我有一个包含一些字段,但我的css类适用于除EmailField之外的所有文件.我也尝试过sender.widget.attrs.update({‘class’：“contatct-form”})并且它仍然不起作用(只是改变字段的大小).有人知道问题是什么吗？因为我的所有搜索都没有成功. 形成：from django import forms class NameForm(forms.Form):your_name = forms.CharField(initial='Your name', max_length=100)sender = forms.EmailField()#sender.widget.attrs.update({...

javascript-RSA加密过的表单密码用python怎么模拟，的用户名和密码【图】

回复内容：用的jsencrypt加密,看登录按钮ID为signin有个click事件调用signin_go()方法, var encrypt = new JSEncrypt();encrypt.setPublicKey('MIGfMA0GCSqGSIb3DQEBAQUAA4GNADCBiQKBgQCp0wHYbg/NOPO3nzMD3dndwS0MccuMeXCHgVlGOoYyFwLdS24Im2e7YyhB0wrUsyYf0/nhzCzBK8ZC9eCWqd0aHbdgOQT6CuFQBMjbyGYvlVYU2ZP7kG9Ft6YV6oc9ambuO7nPZh+bvXH0zDKfi02prknrScAKC0XhadTHT3Al0QIDAQAB');var encrypted_input1 = encrypt.encrypt($('#inpu...

Python中使用django form表单验证的方法

一. django form表单验证引入　　有时时候我们需要使用get,post,put等方式在前台HTML页面提交一些数据到后台处理例 ; <!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><title>Form</title> </head> <body><div><form action="url" method="post" enctype="multipart/form-data">{% csrf_token %}<input type="text" name="username"/><input type="password" name="password"/><input type="submit" value="submit...

python中flask应用（表单处理）【图】

本篇文章给大家带来的内容是关于python中flask应用（表单处理），有一定的参考价值，有需要的朋友可以参考一下，希望对你有所帮助。1、为什么使用Flask-WTF？request对象公开了所有客户端发送的请求信息。特别是request.form可以访问POST请求提交的表单数据。尽管Flask的request对象提供的支持足以处理web表单，但依然有许多任务会变得单调且重复。表单的HTML代码生成和验证提交的表单数据就是两个很好的例子。优势：Flask-WTF扩展...

python模拟表单提交登录图书馆【图】

这篇文章主要为大家详细介绍了python模拟表单提交登录图书馆的实现方法，具有一定的参考价值，感兴趣的小伙伴们可以参考一下本文实例为大家分享了python模拟登录图书馆的具体代码，供大家参考，具体内容如下模拟表单提交的原理：我们都知道Http是无状态的,所以当我们提交的数据和浏览器中正常提交一样，那么服务器就会返回和浏览器中一样的响应。所以我们这里来模拟浏览器表单提交登录广东工业大学的图书馆 http://222.200.122.171...

分享两种方法解决Form表单数据无法动态刷新的方法【图】

一、无法动态更新数据的实例1. 如下，数据库中创建了班级表和教师表，两张表的对应关系为“多对多” 1 from django.db import models 2 3 4 class Classes(models.Model): 5 title = models.CharField(max_length=32) 6 7 8 class Teacher(models.Model): 9 name = models.CharField(max_length=32)10 t2c = models.ManyToManyField(Classes)models.py2. views的功能有查看、添加、编辑班级或教师表 1 from django...

python自动化表单提交【图】

今天以一个表单的自动提交，来进一步学习selenium的用法练习目标　　0）运用selenium启动firefox并载入指定页面（这部分可查看本人文章）　　1）页面元素查找（多种查找方式：find_element_*）　　2）内容填充（send_keys）　　3）iframe与父页面切换（switch_to_frame是切换到iframe，switch_to_default_content是切换到主页面）　　4）浏览器交互处理：window.alert, window.confirm, window.prompt　　　　与上面的三个浏览器交...

实例详解Python中Django后台自定义表单控件【图】

本篇文章主要介绍了Python中Django 后台自定义表单控件，其实 django 已经为我们提供了一些可用的表单控件，比如：多选框、单选按钮等，有兴趣的开业了解一下。在 django 中我们可以在 admin.py 中添加 ModelAdmin，这样就能很方便地在后台进行增删改查的操作。然而，对应 Model 生成的表单，并不友好，我们希望能像前端开发一样做出各种类型的控件，这就得对其后台的表单进行自定义。其实 django 已经为我们提供了一些可用的表单控...

教你使用模板引擎和表单插件的实例详解（python）【图】

经过了第一章的内容，已经可以做出一些简单的页面，首先用这种方式做一个登录页面，首先要创建一个login的路由方法：@app.route("/login",methods=["GET"]) def login():html="<form method=post>" \"<table>" \"<tr><td>请输入用户名</td><td><input type=text name=username/></td></tr>" \"<tr><td>请输入密码</td><td><input type=password name=password/></td></tr>" \"<tr><td><input type=submit value=登录/></td></tr>" ...

深入了解Python中Django后台自定义表单控件【图】

Python的Flask中使用WTForms表单框架

下载和安装安装 WTForms 最简单的方式是使用 easy_install 和 pip:easy_install WTForms # or pip install WTForms你可以从 PyPI 手动下载 WTForms 然后运行 python setup.py install .如果你是那种喜欢这一切风险的人, 就运行来自 Git 的最新版本, 你能够获取最新变更集的打包版本, 或者前往项目主页克隆代码仓库.主要概念Forms 类是 WTForms 的核心容器. 表单(Forms)表示域(Fields)的集合, 域能通过表单的字典形式或者属性形...

防止表单重复提交的几种策略【图】

表单重复提交是在多用户Web应用中最常见、带来很多麻烦的一个问题。有很多的应用场景都会遇到重复提交问题，比如：点击提交按钮两次。点击刷新按钮。使用浏览器后退按钮重复之前的操作，导致重复提交表单。使用浏览器历史记录重复提交表单。浏览器重复的HTTP请求。　　几种防止表单重复提交的方法　　禁掉提交按钮。表单提交后使用Javascript使提交按钮disable。这种方法防止心急的用户多次点击按钮。但有个问题，如果客户端把Java...

django1.8使用表单上传文件的实现方法

Python下有许多款不同的 Web 框架。Django是重量级选手中最有代表性的一位。许多成功的网站和APP都基于Django。Django是一个开放源代码的Web应用框架，由Python写成。在django中我们可以采用Form类来处理表单，通过实例化处理和在模板中渲染，就可以轻松完成表单的需求，采用django的表单处理方式，能帮我们省去很多的工作，比如验证不能为空，或者要符合某种模式的输入才有效，这些处理起来非常方便，不用自己再单独写代码去验证表...

PYTHON - 技术教程分类

Python3 教程 Python3 简介 Python3 环境搭建 Python3 基础语法 Python3 基本数据类型 Python3 解释器 Python3 注释 Python3 运算符 Python3 数字(Number) Python3 字符串 Python3 列表 Python3 元组 Python3 字典 Python3 集合 Python3 编程第一步 Python3 条件控制 Python3 循环语句 Python3 迭代器与生成器 Python3 函数 Python3 数据结构 Python3 模块 Python3 输入和输出 Python3 File Python3 OS Python3 错误和异常 Python3 面向对象 Python3 命名空间/作用域 Python3 标准库概览 Python3 实例 Python3 CGI编程 Python3 MySQL(PyMySQL) Python3 网络编程 Python3 SMTP发送邮件 Python3 多线程 Python3 日期和时间 Python3 内置函数 Python3 MongoDB Python3 urllib python 全部

PYTHON - 最热教程

python如何统计字符串中字母个数？使用Python进行微信公众号开发（三）回...Python+PyQT5的子线程更新UI界面的实例 python时间戳怎么获得？如何获得当前时...vscode调试python时提示无法将“conda”...python接口自动化全局变量access_token...python收取邮件(腾讯企业邮箱)python如何绘制降水图详解python并发获取snmp信息及性能测试...怎么卸载Python3.6？

首页 / PYTHON / php-Python：使用机械化将数据提交到表单后,提取.csv结果

php-Python：使用机械化将数据提交到表单后,提取.csv结果

内容导读

内容图文

内容总结

内容备注

内容手机端

【php-Python：使用机械化将数据提交到表单后,提取.csv结果】教程文章相关的互联网学习教程文章

python_way day14 HTML-day5 （form表单验证，）【代码】【图】

无法使用urllib python v3.2.1将数据发布到登录表单【代码】

python – Django表单EmailField不接受css属性【代码】

javascript-RSA加密过的表单密码用python怎么模拟，的用户名和密码【图】

Python中使用django form表单验证的方法

python中flask应用（表单处理）【图】

python模拟表单提交登录图书馆【图】

分享两种方法解决Form表单数据无法动态刷新的方法【图】

python自动化表单提交【图】

实例详解Python中Django后台自定义表单控件【图】

教你使用模板引擎和表单插件的实例详解（python）【图】

深入了解Python中Django后台自定义表单控件【图】

Python的Flask中使用WTForms表单框架

防止表单重复提交的几种策略【图】

django1.8使用表单上传文件的实现方法

PYTHON - 相关标签

PHP - 相关标签

数据 - 相关标签

PYTHON - 技术教程分类

PYTHON - 最新教程

PYTHON - 最热教程