首页 / 爬虫 / 【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录

【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含439字，纯文字阅读大概需要1分钟。

内容图文

selenium 模拟登录：

from selenium import webdriver
import time

driver = webdriver.Chrome()
driver.get("https://www.douban.com/")
driver.find_element_by_id("form_email").send_keys("your account")
driver.find_element_by_id("form_password").send_keys("password")

time.sleep(5)

driver.find_element_by_class_name("bn-submit").click()


cookies = {i["name"]:i["value"] for i in driver.get_cookies()}

print(cookies)

time.sleep(3)
driver.close()
driver.quit()

内容总结

以上是互联网集市为您收集整理的【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录全部内容，希望文章能够帮你解决【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/786114.html

来源：【匿名】

【上一篇】java微博爬虫【下一篇】PHP使用swoole实现多线程爬虫

更多 ►

【【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录】教程文章相关的互联网学习教程文章

[Python爬虫] 之三：Selenium 调用IEDriverServer 抓取数据【代码】

接着上一遍，在用Selenium+phantomjs 抓取数据过程中发现，有时候抓取不到，所以又测试了用Selenium+浏览器驱动的方式：具体代码如下：#coding=utf-8import osimport refrom selenium import webdriverfrom selenium.webdriver.common.keys import Keysimport timefrom selenium.webdriver.common.action_chains import ActionChainsimport IniFileclass IEDriverCrawler: def __init__(self): #通过配置文件获取IEDrive...

[python爬虫] Selenium定向爬取PubMed生物医学摘要信息【代码】【图】

本文主要是自己的在线代码笔记。在生物医学本体Ontology构建过程中，我使用Selenium定向爬取生物医学PubMed数据库的内容。 PubMed是一个免费的搜寻引擎，提供生物医学方面的论文搜寻以及摘要。它的数据库来源为MEDLINE（生物医学数据库），其核心主题为医学，但亦包括其他与医学相关的领域，像是护理学或者其他健康学科。它同时也提供对于相关生物医学资讯上相当全面的支援，像是生化学与细胞生物学。 PubMed是因特网...

使用selenium做简单爬虫的实例

selenium 是一个Web自动化测试的软件包，可以用于自动测试Web应用，也可以用于当作简单的爬虫制作工具，这是一个简单的demo，用于爬取Google APP Store中的一个类别: ?1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991001011021031041051061071081091101111121131141151161171...

python爬虫从入门到放弃（八）之 Selenium库的使用【代码】【图】

原文地址https://www.cnblogs.com/zhaof/p/6953241.html一、什么是Seleniumselenium 是一套完整的web应用程序测试系统，包含了测试的录制（selenium IDE）,编写及运行（Selenium Remote Control）和测试的并行处理（Selenium Grid）。Selenium的核心Selenium Core基于JsUnit，完全由JavaScript编写，因此可以用于任何支持JavaScript的浏览器上。selenium可以模拟真实浏览器，自动化测试工具，支持多种浏览器，爬虫中主要用来解决Ja...

Python爬虫实例（二）使用selenium抓取斗鱼直播平台数据【代码】【图】

程序说明：抓取斗鱼直播平台的直播房间号及其观众人数，最后统计出某一时刻的总直播人数和总观众人数。过程分析：一、进入斗鱼首页http://www.douyu.com/directory/all进入平台首页，来到页面底部点击下一页，发现url地址没有发生变化，这样的话再使用urllib2发送请求将获取不到完整数据，这时我们可以使用selenium和PhantomJS来模拟浏览器点击下一页，这样就可以获取完整响应数据了。首先检查下一页元素，如下：<a href="#" class...

动态网站爬虫Python-selenium-PhantomJS【代码】

from selenium import webdriver #from selenium.webdriver.common.proxy import Proxyfrom selenium.webdriver.common.proxy import ProxyType from selenium.webdriver.common.desired_capabilities import DesiredCapabilitiesdcap = dict(DesiredCapabilities.PHANTOMJS) dcap["phantomjs.page.settings.userAgent"] = ("Mozilla/5.0 (iPod; U; CPU iPhone OS 2_1 like Mac OS X; ja-jp) AppleWebKit/525.18.1 (KHTML, like Ge...

爬虫——Selenium与PhantomJS【代码】【图】

SeleniumSelenium是一个Web的自动化测试工具，最初是为网站自动化测试而开发的，类型像我们玩游戏用的按键精灵，可以按指定的命令自动操作，不同的是Selenium可以直接运行在浏览器上，它支持所有主流的浏览器（包括PhantomJS这些无界面的浏览器）。Selenium可以根据我们的指令，让浏览器自动加载页面，获取需要的数据，甚至页面截屏，或者判断网站上某些动作是否发生。Selenium自己不带浏览器，不支持浏览器的功能，它需要与第三方...

[python爬虫] Selenium切换窗口句柄及调用Chrome浏览器【图】

因为我的博客是根据我每个阶段自己做的事情而写的，所以前言可能有点跑题，但它更有利于让我回忆这个阶段自己的所作所为。这篇文章主要介绍Selenium爬虫获取当前窗口句柄、切换窗口句柄以及调用Chrome浏览器几个知识点，其中获取当前句柄的方法是非常重要的一个知识点，只有真正遇到的时候才能体会到它的强大。最近课程比较多，写博客的内容也比较杂，包括网站搭建、HTML设计、计算机图形学、Python数据挖掘、Flash动画等。...

爬虫-selenium实现验证码自动登录（14）【代码】

import time from io import BytesIO import randomimport requests from selenium import webdriver from selenium.webdriver import ActionChains from PIL import Imageurl = "https://www.douban.com/" browser = webdriver.Chrome(executable_path="E:/爬虫0基础入门/chromedriver_win32/chromedriver.exe")#2. 点击元素显示出有缺口的图片并下载 #3. 对比两张图片找出缺口的移动像素 #4. 拖动元素 url = "https://passport.b...

selenium模块跳过用户名密码验证码输入，加载浏览器标签和cookie，进行翻页爬虫多页动态加载的数据（js)【代码】

能解决登陆一次后，之后不需要二次登陆的动态加载数据，网页保存的cookie和标签，加入到selenium自动化测试浏览器中 1from selenium import webdriver2import re3from time import sleep4 5def willbill():6‘‘‘点击翻页，获取下一页数据，进行正则匹配‘‘‘ 7 driver.find_element_by_xpath(‘//*[@id="upPage"]/li[5]/a‘).click()8 sleep(3)9 data = driver.page_source 10 results_list = ‘class="limingc...

Python爬虫之selenium的使用（八）【代码】【图】

Python爬虫之selenium的使用一、简介二、安装三、使用一、简介 Selenium 是自动化测试工具。它支持各种浏览器，包括 Chrome，Safari，Firefox 等主流界面式浏览器，如果你在这些浏览器里面安装一个 Selenium 的插件，那么便可以方便地实现Web界面的测试。Selenium 支持这些浏览器驱动。Selenium支持多种语言开发，比如 Python，Java，C，Ruby等等。二、安装1.安装seleniumpip3 install selenium 2.配置驱动　　（下载驱动，...

Selenium+Browsermob-Proxy 爬虫-获取浏览器Network请求和响应（新示例）【代码】【图】

之前有写过一篇文章，使用Selenium+Browsermob-Proxy 获取浏览器Network请求和响应（地址：https://blog.csdn.net/qq_32502511/article/details/101536325），发现评论里面有很多同志都说获取不到内容或者对HTTPS请求不行，今天在这里重新写个简单的例子给大家参考，这里以模拟登陆华润通H5页面为例。华润通页面地址：https://cloud.huaruntong.cn/web/m/#/homePage （注意：说HTTPS不行的同志注意了，这里演示的网址也是个HTTPS的...

Python爬虫初探 - selenium+beautifulsoup4+chromedriver爬取需要登录的网页信息【代码】【图】

目标之前的自动答复机器人需要从一个内部网页上获取的消息用于回复一些问题，但是没有对应的查询api，于是想到了用脚本模拟浏览器访问网站爬取内容返回给用户。详细介绍了第一次探索python爬虫的坑。准备工作 requests模块向网站发送http请求，BeautifulSoup模块来从静态HTML文本中提取我们想要的数据，更高级的，对于动态加载页面我们需要用webdriver去模拟真实的网页访问，并解析内容。推荐使用Anaconda 这个科学计算版本，主要...

Selenium爬虫Driver的选择_PHP教程【图】

Selenium爬虫Driver的选择由于Chrome速度快，因此很早便使用Chrome Driver淘汰了IE Driver和PhantomJS Driver。最近的抓取工作出现了一个令人头疼的事情，单开一个Driver做while1循环，每隔5分钟扫描抓取目标对象。然而Chrome Driver总是会在4~5个小时僵死掉。我做了性能和时间的记录：Turn 1:硕博家园2016-1-6 16:45:00Mem 1.45GB2016-1-6 17:06:45Mem 1.43GBchrome 38,000k2016-1-6 17:14:14Turn 2:考研版块2016-1-6 17:19:14M...

详解python爬虫利器Selenium使用方法【图】

简介：用pyhon爬取动态页面时普通的urllib2无法实现，例如下面的京东首页，随着滚动条的下拉会加载新的内容，而urllib2就无法抓取这些内容，此时就需要今天的主角selenium。Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE、Mozilla Firefox、Mozilla Suite等。使用它爬取页面也十分方便，只需要按照访问步骤模拟人在操作就可以了，完全不用操心Cookie,S...

爬虫 - 相关标签

爬虫程序爬虫代理ip 爬虫代码爬虫工程师爬虫工具爬虫是什么爬虫原理

爬虫 - 最热教程

论Python爬虫与MySQL数据库交互的坑 Python爬虫实战教程：爬取网易新闻；爬...【Python爬虫实践】异步XHR爬取在线编...node爬虫进阶之——登录 Python3爬虫实例之网易云音乐爬虫 Python爬虫入门【10】：电子书多线程爬...c# – 尝试使用ZeroMQ构建分布式爬虫 Python爬虫抓取技术的门道，大师级总结 java网页爬虫正则表达式 [Python] [爬虫] 1.批量政府网站的招投...

首页 / 爬虫 / 【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录

【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录

内容导读

内容图文

内容总结

内容备注

内容手机端

【【Rollo的Python之路】Python 爬虫系统学习 (六) Selenium 模拟登录】教程文章相关的互联网学习教程文章

[Python爬虫] 之三：Selenium 调用IEDriverServer 抓取数据【代码】

[python爬虫] Selenium定向爬取PubMed生物医学摘要信息【代码】【图】

使用selenium做简单爬虫的实例

python爬虫从入门到放弃（八）之 Selenium库的使用【代码】【图】

Python爬虫实例（二）使用selenium抓取斗鱼直播平台数据【代码】【图】

动态网站爬虫Python-selenium-PhantomJS【代码】

爬虫——Selenium与PhantomJS【代码】【图】

[python爬虫] Selenium切换窗口句柄及调用Chrome浏览器【图】

爬虫-selenium实现验证码自动登录（14）【代码】

selenium模块跳过用户名密码验证码输入，加载浏览器标签和cookie，进行翻页爬虫多页动态加载的数据（js)【代码】

Python爬虫之selenium的使用（八）【代码】【图】

Selenium+Browsermob-Proxy 爬虫-获取浏览器Network请求和响应（新示例）【代码】【图】

Python爬虫初探 - selenium+beautifulsoup4+chromedriver爬取需要登录的网页信息【代码】【图】

Selenium爬虫Driver的选择_PHP教程【图】

详解python爬虫利器Selenium使用方法【图】

PYTHON - 相关标签

爬虫 - 相关标签

系统 - 相关标签

爬虫 - 最新教程

爬虫 - 最热教程