爬虫5 cookie保存和调用实例

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了爬虫5 cookie保存和调用实例，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含1579字，纯文字阅读大概需要3分钟。

内容图文

简述：使用MozillaCookieJar来保存和加载cookie，具体如下：

            """
            cookie实例， 自动保存，调用cookie
　　使用‘快代理’网站测试：登录页 + 工单页
    1. MozillaCookieJar库，用来提取并保存cookie信息

            """
            from urllib.request import Request, build_opener, HTTPCookieProcessor
from fake_useragent import UserAgent
from urllib.parse import urlencode
from http.cookiejar import MozillaCookieJar


# 登陆并保存cookiedef login_save_cookie():
    url = ‘https://www.kuaidaili.com/login/‘
    headers = {
        ‘User-Agent‘: UserAgent().chrome
    }
    login_info = {
        ‘username‘: ‘...‘,
        ‘passwd‘: ‘...‘
    }
    request = Request(url, headers=headers, data=urlencode(login_info).encode())
    # 定义一个保存cookie的对象
    cookie_jar = MozillaCookieJar()
    # cookie处理器加载cookie_jar对象
    handler = HTTPCookieProcessor(cookie_jar)
    # 自定义opener对象，加载cookie处理器，并用来发送请求request对象
    opener = build_opener(handler)
    response = opener.open(request)
    # 定义保存cookie信息, 其它参数表示：忽略丢弃，忽略过期
    cookie_jar.save(‘cookie.txt‘, ignore_discard=True, ignore_expires=True)
    

# 提取cookie来访问其它页面def load_cookie_request():
    url = ‘https://www.kuaidaili.com/support/‘
    headers = {
        ‘User-Agent‘: UserAgent().chrome
    }
    request = Request(url, headers=headers)
    # 生成保存cookie的对象
    cookie_jar = MozillaCookieJar()
    # 读取cookie文件信息
    cookie_jar.load(‘cookie.txt‘, ignore_expires=True, ignore_discard=True)
    # 将信息加载到cookie处理器
    handler = HTTPCookieProcessor(cookie_jar)
    # 生成自定义opener对象,加载cookie处理器
    opener = build_opener(handler)
    # 发送请求，接收响应
    response = opener.open(request)
    info = response.read()
    print(info.decode())
    

# 主函数def main():
    login_save_cookie()
    load_cookie_request()
    

if__name__ == ‘__main__‘:
    main()

原文：https://www.cnblogs.com/leafchen/p/12796023.html

内容总结

以上是互联网集市为您收集整理的爬虫5 cookie保存和调用实例全部内容，希望文章能够帮你解决爬虫5 cookie保存和调用实例所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/1147889.html

来源：【匿名】

【上一篇】吴裕雄--python学习笔记：爬虫包的更换【下一篇】PHP使用swoole实现多线程爬虫

更多 ►

【爬虫5 cookie保存和调用实例】教程文章相关的互联网学习教程文章

cookie的应用和处理- cookie:服务器端记录客户端的相关状态 - 处理cookie的方式：- 手动处理：不建议页面找隐藏的标签,获取value- 自动处理：会话对象Session，该对象可以像requests模块一样进行网络请求的发送（get，post）。session进行的请求发送可以自动携带和处理cookiecookie/session处理请求不是必须的 ,因为session是耗费资源的#基于cookie的案例分析：https://xueqiu.com/ 案例使用自动处理cookie办法 #1.从首页中获...

爬虫5 cookie保存和调用实例【代码】

简述：使用MozillaCookieJar来保存和加载cookie，具体如下："""cookie实例，自动保存，调用cookie　　使用‘快代理’网站测试：登录页 + 工单页1. MozillaCookieJar库，用来提取并保存cookie信息 """from urllib.request import Request, build_opener, HTTPCookieProcessor from fake_useragent import UserAgent from urllib.parse import urlencode from http.cookiejar import MozillaCookieJar# 登陆并保存cookiedef login_...

登录网站爬虫（保持Cookie不变）【代码】【图】

平时经常需要到学校的信息门户去查看课表及其他信息，于是想做一个爬虫，可以自动替我登录并且得到这些信息，于是今天动手写了一个爬虫：首先登录学校的信息门户：http://cas.whu.edu.cn/authserver/login?service=http://my.whu.edu.cn然后这里我随便输入账号名和密码，来看看登录时浏览器都做了些什么。这里我使用的是FireFix浏览器以及HttpFox插件，如果用Chrome的话，谷歌下也有很棒的插件，IE的话推荐HTTPWatch。从HttpFox中...

python爬虫--运用cookie模拟登录知乎【代码】

前面已经介绍过，运用表单填写帐号，用户名的方式模拟登录知乎。若登录成功，则之后就可以利用cookie登入，无需重复之前步骤。import requests import http.cookiejar from bs4 import BeautifulSoup session = requests.Session() session.cookies = http.cookiejar.LWPCookieJar("cookie") agent = ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Maxthon/5.1.2.3000 Chrome/55.0.2883.75 Safa...

selenium模块跳过用户名密码验证码输入，加载浏览器标签和cookie，进行翻页爬虫多页动态加载的数据（js)【代码】

能解决登陆一次后，之后不需要二次登陆的动态加载数据，网页保存的cookie和标签，加入到selenium自动化测试浏览器中 1from selenium import webdriver2import re3from time import sleep4 5def willbill():6‘‘‘点击翻页，获取下一页数据，进行正则匹配‘‘‘ 7 driver.find_element_by_xpath(‘//*[@id="upPage"]/li[5]/a‘).click()8 sleep(3)9 data = driver.page_source 10 results_list = ‘class="limingc...

再来一个爬虫,PHPcURL带cookies模拟HTTP

抓取个json数据,不知道哪里错了。遂重写一个 curl <?php header("content-type:text/html;charset=utf8");$curl = curl_init(https://www.phpcto.org/course/19/lesson/170);// 不输出header头信息curl_setopt($curl, CURLOPT_HEADER, 0);curl_setopt($curl, CURLOPT_COOKIE, ' PHPSESSID=q406pvav5da7st8q4ov6c482e0');// 伪装浏览器curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/5...

通过网页爬虫中cookie自动获取及过期自动更新（详细教程）【图】

这篇文章主要介绍了网页爬虫之cookie自动获取及过期自动更新的实现方法,需要的朋友可以参考下本文实现cookie的自动获取，及cookie过期自动更新。社交网站中的很多信息需要登录才能获取到，以微博为例，不登录账号，只能看到大V的前十条微博。保持登录状态，必须要用到Cookie。以登录www.weibo.cn 为例：在chrome中输入：http://login.weibo.cn/login/分析控制台的Headers的请求返回，会看到weibo.cn有几组返回的cookie。实现步骤：...

网页爬虫之cookie自动获取及过期自动更新的实现方法【图】

本文实现cookie的自动获取，及cookie过期自动更新。社交网站中的很多信息需要登录才能获取到，以微博为例，不登录账号，只能看到大V的前十条微博。保持登录状态，必须要用到Cookie。以登录www.weibo.cn 为例：在chrome中输入：http://login.weibo.cn/login/分析控制台的Headers的请求返回，会看到weibo.cn有几组返回的cookie。实现步骤： 1，采用selenium自动登录获取cookie，保存到文件; 2，读取cookie，比较cookie的有效期，若...

首页 / 爬虫 / 爬虫5 cookie保存和调用实例

爬虫5 cookie保存和调用实例

内容导读

内容图文

内容总结

内容备注

内容手机端

【爬虫5 cookie保存和调用实例】教程文章相关的互联网学习教程文章

爬虫cookie的处理办法【代码】

爬虫5 cookie保存和调用实例【代码】

登录网站爬虫（保持Cookie不变）【代码】【图】

python爬虫--运用cookie模拟登录知乎【代码】

selenium模块跳过用户名密码验证码输入，加载浏览器标签和cookie，进行翻页爬虫多页动态加载的数据（js)【代码】

再来一个爬虫,PHPcURL带cookies模拟HTTP

通过网页爬虫中cookie自动获取及过期自动更新（详细教程）【图】

网页爬虫之cookie自动获取及过期自动更新的实现方法【图】

Python3 爬虫带上 cookie【代码】【图】

python爬虫怎么获取cookie【图】

图文详解Python爬虫破解JS加密的Cookie步骤【图】

Python爬虫利用cookie实现模拟登陆实例详解【图】

Python爬虫使用浏览器的cookies：browsercookie

Python中urllib+urllib2+cookielib模块编写爬虫实战【图】

玩转python爬虫之cookie使用方法【图】

COOKIE - 相关标签

调用 - 相关标签

保存 - 相关标签

爬虫 - 最新教程

爬虫 - 最热教程