首页 / 爬虫 / python笔记(爬虫 request模块)

python笔记(爬虫 request模块)

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了python笔记(爬虫 request模块)，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含2185字，纯文字阅读大概需要4分钟。

内容图文

1. 方法

requests.get
requests.post 
requests.put 
requests.delete 
...
requests.request(method='POST')

2. 参数

2.1  url
2.2  headers
2.3  cookies
2.4  params
2.5  data，传请求体
        
        requests.post(
            ...,
            data={'user':'alex','pwd':'123'}
        )
        
        GET /index http1.1\r\nhost:c1.com\r\n\r\nuser=alex&pwd=123
        
2.6  json，传请求体
        requests.post(
            ...,
            json={'user':'alex','pwd':'123'}
        )
        
        GET /index http1.1\r\nhost:c1.com\r\nContent-Type:application/json\r\n\r\n{"user":"alex","pwd":123}
2.7 代理 proxies
    # 无验证
        proxie_dict = {
            "http": "61.172.249.96:80",
            "https": "http://61.185.219.126:3128",
        }
        ret = requests.get("https://www.proxy360.cn/Proxy", proxies=proxie_dict)
        
    
    # 验证代理
        from requests.auth import HTTPProxyAuth
        
        proxyDict = {
            'http': '77.75.105.165',
            'https': '77.75.106.165'
        }
        auth = HTTPProxyAuth('用户名', '密码')
        
        r = requests.get("http://www.google.com",data={'xxx':'ffff'} proxies=proxyDict, auth=auth)
        print(r.text)
-----------------------------------------------------------------------------------------
2.8 文件上传 files
    # 发送文件
        file_dict = {
            'f1': open('xxxx.log', 'rb')
        }
        requests.request(
            method='POST',
            url='http://127.0.0.1:8000/test/',
            files=file_dict
        )
        
2.9 认证 auth

    内部：
        用户名和密码，用户和密码加密，放在请求头中传给后台。
        
            - "用户:密码"
            - base64("用户:密码")
            - "Basic base64("用户|密码")"
            - 请求头：
                Authorization： "basic base64("用户|密码")"
        
    from requests.auth import HTTPBasicAuth, HTTPDigestAuth

    ret = requests.get('https://api.github.com/user', auth=HTTPBasicAuth('wupeiqi', 'sdfasdfasdf'))
    print(ret.text)
    
2.10 超时 timeout 
    # ret = requests.get('http://google.com/', timeout=1)
    # print(ret)

    # ret = requests.get('http://google.com/', timeout=(5, 1))
    # print(ret)
    
2.11 允许重定向  allow_redirects
    ret = requests.get('http://127.0.0.1:8000/test/', allow_redirects=False)
    print(ret.text)
    
2.12 大文件下载 stream
    from contextlib import closing
    with closing(requests.get('http://httpbin.org/get', stream=True)) as r1:
    # 在此处理响应。
    for i in r1.iter_content():
        print(i)
        
2.13 证书 cert
    - 百度、腾讯 => 不用携带证书（系统帮你做了）
    - 自定义证书
        requests.get('http://127.0.0.1:8000/test/', cert="xxxx/xxx/xxx.pem")
        requests.get('http://127.0.0.1:8000/test/', cert=("xxxx/xxx/xxx.pem","xxx.xxx.xx.key"))
2.14 确认 verify =False

内容总结

以上是互联网集市为您收集整理的python笔记(爬虫 request模块)全部内容，希望文章能够帮你解决python笔记(爬虫 request模块)所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/829845.html

来源：【匿名】

【上一篇】支线任务-Python爬虫【下一篇】PHP使用swoole实现多线程爬虫

更多 ►

【python笔记(爬虫 request模块)】教程文章相关的互联网学习教程文章

request模块的简单使用+爬虫小程序【代码】

爬虫之request各种请求方式gethost_url = ‘https://www.pearvideo.com/‘ #浏览器的版本等信息 headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36" } res = requests.get(host_url, headers=headers)post r = requests.post(‘http://httpbin.org/post‘, data = {‘key‘:‘value‘})deleter = requests.delete(‘http://httpbin...

PYTHON爬虫代理如何设置？用免费IP或IP池和REQUEST库爬取网页【图】

0元免费IP列表首先分享一波：免费代理由第三方服务器提供，IP质量不高。IP地址端口号匿名程度支持协议地区稳定时间更新时间FREE 114.233.51.111 4257 超高HTTP江苏省泰州市5-1440分钟2020/10/18 11:00:01FREE 49.71.99.110 4226 超高HTTP江苏省扬州市5-1440分钟2020/10/18 10:00:01FREE 183.4.66.22 4205 超高HTTP广东省江门市5-1440分钟2020/10/18 09:00:01FREE 119.7.231.13 64261 超高HTTP四川省雅安市5-1440分钟2020/10/...

爬虫--requests爬取猫眼电影排行榜【代码】

‘‘‘目标：使用requests分页爬取猫眼电影中榜单栏目中TOP100榜的所有电影信息，并将信息写入文件URL地址：http://maoyan.com/board/4 其中参数offset表示其实条数获取信息：{排名，图片，标题，主演，放映时间，评分}‘‘‘from requests.exceptions import RequestExceptionimport requestsimport re,time,jsondef getPage(url): ‘‘‘爬取指定url页面信息‘‘‘ try: #定义请求头信息 headers = { ...

Python爬虫（二）：Requests库【代码】

所谓爬虫就是模拟客户端发送网络请求，获取网络响应，并按照一定的规则解析获取的数据并保存的程序。要说 Python 的爬虫必然绕不过 Requests 库。1 简介对于 Requests 库，官方文档是这么说的：Requests 唯一的一个非转基因的 Python HTTP 库，人类可以安全享用。警告：非专业使用其他 HTTP 库会导致危险的副作用，包括：安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。这个介绍还是比较生动形象的，便...

爬虫初探(2)之requests【代码】

关于请求网络，requests这个库是爬虫经常用到的一个第三方库。import requestsurl = ‘http://www.baidu.com‘#这里用get方法用来请求网页，其他还有post等方法来请求网页 data = requests.get(url)print(data) #<Response [200]>print(data.text)#这里的 .text 就等同于上一篇中的 read() #此时同样打印出网页源码其余方法后期学习，方法列表如下：#HTTP请求类型 #get类型 r = requests.get(‘https://github.com/timeline.json‘...

爬虫之requests 高级用法【代码】

1. 文件上传import requestsfiles = {‘file‘: open(‘favicon.ico‘, ‘rb‘)} r = requests.post("http://httpbin.org/post", files=files) print(r.text){"args": {}, "data": "", "files": {"file": "data:application/octet-stream;base64,AAAAAA...="}, "form": {}, "headers": {"Accept": "*/*", "Accept-Encoding": "gzip, deflate", "Content-Length": "6665", "Content-Type": "multipart/form-data; boundary=809f80b1...

python之路_day96_爬虫之requests模块补充【代码】

一、响应Response1、response属性import requests respone=requests.get(‘http://www.jianshu.com‘) # respone属性print(respone.text) #获得文本内容print(respone.content) #获得二进制文本内容print(respone.status_code) #获得状态码print(respone.headers) #获得响应头print(respone.cookies) #获得cookies...

python学习之爬虫：安装requests模块【图】

终端输入命令：pip install requests 如果报错：p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 11.0px Menlo; color: #000000; background-color: #ffffff } p.p2 { margin: 0.0px 0.0px 0.0px 0.0px; font: 11.0px Menlo; color: #c33720; background-color: #ffffff } span.s1 { }Installing collected packages: idna, urllib3, certifi, chardet, requestsException:Traceback (most recent call last): File "/Library/Pyt...

利用Requests库写爬虫【代码】

基本Get请求：#-*- coding:utf-8 -*- import requests url = ‘http://www.baidu.com‘ r = requests.get(url) print r.text带参数Get请求：#-*- coding:utf-8 -*- import requests url = ‘http://www.baidu.com‘ payload = {‘key1‘: ‘value1‘, ‘key2‘: ‘value2‘} r = requests.get(url, params=payload) print r.textPOST请求模拟登陆及一些返回对象的方法：#-*- coding:utf-8 -*- import requests url1 = ‘http://www...

python网络爬虫——requests模块（第二章）【代码】【图】

网络爬虫之requests模块今日概要基于requests的get请求基于requests模块的post请求基于requests模块ajax的get请求基于requests模块ajax的post请求综合项目练习：爬取国家药品监督管理总局中基于中华人民共和国化妆品生产许可证相关数据知识点回顾常见的请求头常见的相应头https协议的加密方式基于如下5点展开requests模块的学习什么是requests模块requests模块是python中原生的基于网络请求的模块，其主要作用是用来模拟浏览器发起...

爬虫--requests基本请求：get和post带参数【代码】

# get请求 response = requests.get(url=url, params=params, headers=headers, proxies=proxies)# post请求 response = requests.post(url=url, data=data, headers=headers, proxies=proxies) 原文：https://www.cnblogs.com/wangshx666/p/13293246.html

爬虫小试--用python中requests和urllib模块爬取图片【代码】

今天突发奇想小试爬虫,获取一下某素材站一些图片实现步骤如下:import re import requests from urllib import request import os# 1.首先要检查数据是否是动态加载出来的 # 2.获取页面源码数据ifnot os.path.exists(‘tupian‘):os.mkdir(‘tupian‘) headers = {"User-Agent" : "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36" } url = "http://sc...

Python爬虫：认识urllib/urllib2以及requests【代码】

首先说明一下我的爬虫环境是基于py2.x的，为什么用这个版本呢，因为py2.x的版本支持的多，而且一般会使用py2.x环境，基本在py3.x也没有太大问题，好了，进入正题！ urllib 与 urllib2urllib与urllib2是Python内置的，要实现Http请求，以urllib2为主,urllib为辅. 构建一个请求与响应模型import urllib2strUrl = "http://www.baidu.com" response = urllib2.urlopen(strUrl) print response.read()得到： <div ><b>网页</b><a href...

Python爬虫连载10-Requests模块、Proxy代理【代码】【图】

一、Request模块1.HTTP for Humans,更简洁更友好2.继承了urllib所有的特征3.底层使用的是urllib34.?开源地址：https://github.com/requests/requests5.中文文档?：https://requests.readthedocs.io/zh_CN/latest/6.先安装这个包:pip install requests7.get请求（1）requests.get()（2）requests.request("get",url)（3）可以带有headers和params参数8.get返回内容 import requests?#两种请求 url = "http://www.baidu.com/s?"rsp =...

Python:requests库、BeautifulSoup4库的基本使用（实现简单的网络爬虫）【代码】【图】

Python:requests库、BeautifulSoup4库的基本使用（实现简单的网络爬虫）一、requests库的基本使用requests是python语言编写的简单易用的HTTP库，使用起来比urllib更加简洁方便。 requests是第三方库，使用前需要通过pip安装。pip install requests 1.基本用法：import requests#以百度首页为例 response = requests.get(‘http://www.baidu.com‘)#response对象的属性print(response.status_code) # 打印状态码print(response.url...

首页 / 爬虫 / python笔记(爬虫 request模块)

python笔记(爬虫 request模块)

内容导读

内容图文

内容总结

内容备注

内容手机端

【python笔记(爬虫 request模块)】教程文章相关的互联网学习教程文章

request模块的简单使用+爬虫小程序【代码】

PYTHON爬虫代理如何设置？用免费IP或IP池和REQUEST库爬取网页【图】

爬虫--requests爬取猫眼电影排行榜【代码】

Python爬虫（二）：Requests库【代码】

爬虫初探(2)之requests【代码】

爬虫之requests 高级用法【代码】

python之路_day96_爬虫之requests模块补充【代码】

python学习之爬虫：安装requests模块【图】

利用Requests库写爬虫【代码】

python网络爬虫——requests模块（第二章）【代码】【图】

爬虫--requests基本请求：get和post带参数【代码】

爬虫小试--用python中requests和urllib模块爬取图片【代码】

Python爬虫：认识urllib/urllib2以及requests【代码】

Python爬虫连载10-Requests模块、Proxy代理【代码】【图】

Python:requests库、BeautifulSoup4库的基本使用（实现简单的网络爬虫）【代码】【图】

REQUEST - 相关标签

PYTHON - 相关标签

爬虫 - 相关标签

爬虫 - 最新教程

爬虫 - 最热教程