PYTHON3 URLLIB 技术教程文章

用 Python 实现聊天机器人(tkinter+urllib)

这篇文章将使用 Python 的 urllib 模块 和 tkinter 模块实现一个聊天机器人。 本程序使用的模块有:import tkinter from tkinter import* from tkinter.colorchooser import askcolor from tkinter import messagebox from tkinter import scrolledtext import urllib.request import urllib.parse 聊天机器人设置 本程序使用了茉莉聊天机器人,通过爬虫爬取回复。 茉莉聊天机器人可以自己申请,申请链接:http://www.itpk.cn/ 申...

Python——urllib.request模块的使用【代码】

官方文档:http://cn.python-requests.org/zh_CN/latest/ llib.request请求返回网页 ulbrquett最简单的应用就是urlie.requet.urlopen了,函数使用如下: urllib. request.urlopen(ur1[,data[, timeout[, cafile[, capath[, cadefaultl,context] ] ] ] ] 按照官方文档,urllib.request.urlopen 可以打开HTTP、HTTPS、FTP协议的URL,主要应用于HTTP协议。 参数中以ca开头的都是跟身份验证有关的,不太常用。 data 参数是以post方式提交...

openwrt Python3.6通过自带的urllib通过get或post方法请求url【代码】

# coding = utf-8 import uuid import hashlib import time import ssl from urllib import request from urllib import parse ssl._create_default_https_context = ssl._create_unverified_contextdef header_Md5(Nonce, CTime):header_key = "XXXXXXXXXXXXXXXX"obj = hashlib.md5((Nonce + CTime + header_key).encode(utf-8))return obj.hexdigest()URL = https://XXXXXXXXX.com/Gateway/SmartHome/XXXXXX Nonce = "12saP2wA1...

Python标准库:HTTP客户端库urllib3【代码】

urllib3功能强大且易于使用,用于HTTP客户端的Python库。许多Python的原生系统已经开始使用urllib3。urllib3提供了很多python标准库urllib里所没有的重要特性:线程安全 连接池 客户端SSL/TLS验证 文件分部编码上传 协助处理重复请求和HTTP重定位 支持gzip和deflate压缩编码 支持HTTP和SOCKS代理 100%测试覆盖率Python3.x中将urllib2合并到了urllib,之后此包分成了以下几个模块:urllib.request: 用于打开和读取URLurllib.error:...

Python3学习笔记(urllib模块的使用)

1.urlliburllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)- url: 需要打开的网址- data:Post提交的数据- timeout:设置网站的访问超时时间直接用urllib.request模块的urlopen()获取页面,page的数据格式为bytes类型,需要decode()解码,转换成str类型。 1 from urllib import request2 3 response = request.urlopen(rhttp://pyth...

使用Tor作为代理时Python urllib2超时?【代码】

我正在将Python的urllib2与Tor一起用作访问网站的代理.当我打开网站的主页,效果很好,但是当我尝试查看登录页面时(实际上不是登录,而只是查看它)我收到以下错误…URLError: <urlopen error (10060, 'Operation timed out')>为了解决这个问题,我做了以下工作:import socket socket.setdefaulttimeout(None).我仍然收到相同的超时错误. >这是否意味着网站正在服务器端超时? (我不太了解关于http进程的信息,如果这是一个愚蠢的问题,请...

Python 2.6:使用urllib2并行解析

我目前正在使用urllib2从网站检索和解析页面.但是,它们很多(超过1000个),并且顺序地处理它们非常缓慢. 我希望有一种以并行方式检索和解析页面的方法.如果这是个好主意,那有可能吗,我该怎么做? 此外,并行处理的页面数的“合理”值是什么(我不想因为对服务器使用过多的连接而对服务器造成太大的压力或被禁止)? 谢谢!解决方法:您始终可以使用线程(即在单独的线程中运行每次下载).对于大量数据,这可能会占用太多资源,在这种情况下,我...

在Python的urllib2 urlopen中检测超时错误【代码】

我对Python还是比较陌生,因此,如果这是一个明显的问题,我深表歉意. 我的问题是关于urllib2库,它是urlopen函数.目前,我正在使用它从另一台服务器(它们都在同一远程主机上)加载大量页面,但是该脚本有时会因超时错误而被终止(我认为这是来自大型请求). 有没有办法让脚本在超时后保持运行?我希望能够提取所有页面,所以我想要一个脚本,该脚本将一直尝试直到获取页面,然后继续前进. 顺便说一句,保持对服务器开放的连接会有帮助吗?解决方...

python-302s和urllib2丢失cookie【代码】

我正在将liburl2与CookieJar / HTTPCookieProcessor结合使用,以尝试模拟登录页面以自动上传. 我已经看到了一些问题和答案,但是没有什么能解决我的问题.当我模拟登录最终以302重定向结束时,我丢失了cookie. 302响应是服务器设置cookie的位置,但是urllib2 HTTPCookieProcessor似乎在重定向期间未保存cookie.我尝试创建一个HTTPRedirectHandler类来忽略重定向,但这似乎并没有解决问题.我尝试全局引用CookieJar来处理来自HTTPRedirectH...

Python,gevent,urllib2.urlopen.read(),下载加速器【代码】

我正在尝试为Linux构建下载加速器.我的程序使用gevent,os和urllib2.我的程序收到一个URL,并尝试同时下载文件.我所有的代码都是有效的.我唯一的问题是urllib2.urlopen.read()阻止我同时运行.read()函数. 这是抛出我的例外.Traceback (most recent call last): File "/usr/lib/pymodules/python2.7/gevent/greenlet.py", line 405, in run result = self._run(*self.args, **self.kwargs) File "gevent_concurrent_downloader.py", l...

python-gevent中断请求/ urllib2超时【代码】

前段时间,我为Django项目编写了与外部服务交互的代码:try:response = requests.get('some host', timeout=TIMEOUT)except:log.warning('timeout')return None我在开发环境(python manage.py runserver)中对其进行了测试,并且超时工作正常.然后,我决定通过指定gunicorn的池实现来用gevent对其进行修补,如下所示:python manage.py run_gunicorn -k gevent 现在,getout不会被timout异常打断.我将池实现更改为eventlet,并且按预期方式...

urllib-从Python2更新到Python3【代码】

我已经尝试适应the following script.我已经获得了后续的内容.#!/usr/bin/python3import re import csvimport urllib.request, urllib.parseclass Spreadsheet(object):def __init__(self, key):super(Spreadsheet, self).__init__()self.key = keyclass Client(object):def __init__(self, email, password):super(Client, self).__init__()self.email = emailself.password = passworddef _get_auth_token(self, email, password...

在python中使用urllib时,双引号和单引号字符串之间的行为不同【代码】

我是python的新手,我知道单引号和双引号字符串没有区别.但是我发现了一些不同的行为.from bs4 import BeautifulSoup import urllib.requesturl1 = "http://www.backpackers.com.tw/forum/forumdisplay.php?f=310" url2 = 'http://www.backpackers.com.tw/forum/forumdisplay.php?f=310'如果我运行:response = urllib.request.urlopen(url1)结果:脚本完成无错误 如果我跑步:response = urllib.request.urlopen(url2)结果:错误C:...

python-无法使用urllib.urlopen()获得网页的源代码【代码】

我正在尝试从“ https://www.youtube.com/trendsdashboard#loc0=ind”获取视频链接.当我检查元素时,它会向我显示每个视频的源html代码.在使用检索的源代码中urllib2.urlopen("https://www.youtube.com/trendsdashboard#loc0=ind").read()它不显示视频的html源.还有其他方法吗?<a href="/watch?v=dCdvyFkctOo" alt="Flipkart Wish Chain"><img src="//i.ytimg.com/vi/dCdvyFkctOo/hqdefault.jpg" alt="Flipkart Wish Chain"></a>当...

带有Urllib2的Python多线程问题

我可以一次快速地用多个线程下载多个文件,但问题是几分钟后它趋于逐渐减慢到几乎停止,我不知道为什么.我的代码没有错,我的RAM / CPU很好..我唯一能想到的是urllib2没有正确处理大量连接.如果有帮助,我正在使用代理,但是在没有代理的情况下我也遇到了这个问题.是否有人对此问题有任何建议或见识?谢谢!解决方法:您可以确认不使用python进行相同数量的同时下载会继续快速下载吗?也许问题不在于您的代码,而在于您的连接受到限制或提...

Python,实现对基于套接字的应用程序(非urllib2)的代理支持

我有点困惑:我有一个简单的Messenger客户端程序(纯python,套接字),我想添加代理支持(http / s,袜子),但是我对如何使用它感到有些困惑.我假设套接字级别的连接将完成到代理服务器的连接,此时标头应包含(聊天服务器的)CONNECT目标IP和身份验证(如果代理要求的话),但是其余部分是超越我后续连接如何处理,特别是读/写等? 有没有关于在Python中基于套接字(tcp)编程的代理支持实现的指南? 谢谢解决方法:也许使用SocksiPy之类的东西,它...

如何在urllib2中使用python代码获取(当前URL查询字符串)?【代码】

我需要使用查询字符串读取当前网址? 意味着我需要获取浏览器的当前地址栏网址.解决方法:urllib2.Request对象提供了geturl()方法,该方法返回请求的完整URL.然后,您可以将其传递给urlparse.urlparse(),后者将URL分为每个URL的六个部分.然后,您可以通过查询属性访问查询部分. 一个例子:>>> from urllib2 import urlopen >>> from urlparse import urlparse >>> req = urlopen('http://capitalfm.com/?foo=bar') >>> req.geturl() 'h...

python-从`urllib2.urlopen`获取错误文本【代码】

我使用Python的urllib2.urlopen,并从服务器收到500错误.如何找到错误的文字?我希望它具有有用的信息.解决方法: from urllib2 import urlopen, HTTPErrortry:f = urlopen(url) except HTTPError, e:print(e.read())

python-使用urllib2指定请求方法?【代码】

这段代码产生一个POST请求:urllib2.urlopen("http://somedomain.com/", data)我想产生一个GET请求-有关如何执行此操作的任何想法? 谢谢您的帮助!解决方法:尝试:urllib2.urlopen("http://somedomain.com/?" + data)[编辑] 如果要在正文中发送xml / json / etc数据,请使用类似以下内容的内容:urllib2.urlopen("http://somedomain.com/?" + parameters, data)这将使用POST方法,但是任何“ GET”参数也将对您的应用程序可用.

使用Python / urllib通过“ siteminder”身份验证访问网站吗?【代码】

我正在尝试使用Python访问和解析一个工作中的网站.网站授权是通过siteminder完成的,因此通常的urllib / urllib2用户密码无效.有谁知道如何做到这一点?谢谢诺姆解决方法:只是这样做-我知道它很老套-但是如果有人希望这样做-请使用请求库.我之前用C#做到了这一点,并使用了大量的代码-但这就是登录我的公司siteminder系统所要做的全部-很好. request.session()对象将保留重定向,标头和cookie-因此,您需要担心的是发布登录表单.我确定...